Cara Kerja Algoritma Naive Bayes


Step By Step Cara Kerja Algoritma Naïve Bayes
Contributor: Triesta Arviana Haryadinanti

  • Penjelasan mengenai tahapan-tahapan pengerjaan algoritma Naïve Bayes akan menggunakan contoh berikut untuk mempermudah pemahaman: 
  • Di sebuah universitas, terdapat data set mahasiswa sebagai berikut:

Tabel 1 Contoh Data Mahasiswa

No.
Jenis kelamin
Status mahasiswa
Status pernikahan
IPK
semester
1-6
Status kelulusan
1
Laki - laki
Mahasiswa
Belum
3.17
Tepat
2
Laki - laki
Bekerja
Belum
3.30
Tepat
3
Perempuan
Mahasiswa
Belum
3.01
Tepat
4
Perempuan
Mahasiswa
Menikah
3.25
Tepat
5
Laki - laki
Bekerja
Menikah
3.20
Tepat
6
Laki - laki
Bekerja
Menikah
2.50
Terlambat
7
Perempuan
Bekerja
Menikah
3.00
Terlambat
8
Perempuan
Bekerja
Belum
2.70
Terlambat
9
Laki - laki
Bekerja
Belum
2.40
Terlambat
10
Perempuan
Mahasiswa
Menikah
2.50
Terlambat
11
Perempuan
Mahasiswa
Belum
2.50
Terlambat
12
Perempuan
Mahasiswa
Belum
3.50
Tepat
13
Laki - laki
Bekerja
Menikah
3.30
Tepat
14
Laki - laki
Mahasiswa
Menikah
3.25
Tepat
15
Laki - laki
Mahasiswa
Belum
2.30
Terlambat

  •  Berpegangan pada rumus berikut:

dimana
Y = status kelulusan à kelas kejadian
X1 = jenis kelamin à variabel pertama
X2 = status mahasiswa à variabel kedua
X3 = status pernikahan à variabel ketiga
X4 = IPK à variabel keempat

  • Kemudian universitas ingin menambah sebuah data sebagai berikut:
  • Universitas akan menggunakan Naïve Bayes untuk mendapatkan hasil mengenai status kelulusan mahasiswa tersebut.

Step 1: Menghitung probabilitas total setiap kelas kejadian

  • Tahap pertama yang perlu dilakukan adalah menghitung probabilitas total masing-masing kelas kejadian. Caranya adalah dengan membagi jumlah data kelas kejadian dengan jumlah seluruh data di tabel.
  • Untuk contoh di atas, maka perhitungan menjadi seperti berikut:
    • P(Y = tepat)  = 8/15   à jumlah data kelas “tepat” pada kejadian status kelulusan” dibagi jumlah seluruh data
    • P(Y = terlambat) = 7/15 à jumlah data kelas “terlambat” pada kejadian status kelulusan” dibagi jumlah seluruh data

Step 2: Menghitung probabilitas detil variabel dalam kelas

  • Tahap kedua adalah menghitung probabilitas setiap kasus. Perhitungan dilakukan dengan menghitung jumlah kasus yang terjadi di masing-masing variabel, sesuai yang bersangkutan dengan data tambahan, dengan masing-masing kelas kejadian.
  • Untuk contoh di atas, maka perhitungannya adalah sebagai berikut:
    •  Variabel jenis kelamin (X1):
      • P(jenis kelamin = laki-laki | Y = tepat) = 5/8 à jumlah data jenis kelamin “laki-laki” dengan kejadian status kelulusan “tepat” dibagi jumlah data kelas “tepat”.
      • P(jenis kelamin = laki-laki | Y = terlambat) = 3/7 à jumlah data jenis kelamin “laki-laki” dengan kejadian status kelulusan “terlambat” dibagi jumlah data kelas “terlambat”.
    • Variabel status mahasiswa (X2)
      •  P(status mahasiswa = mahasiswa | Y = tepat) = 5/8 à jumlah data status mahasiswa “mahasiswa” dengan kejadian status kelulusan “tepat” dibagi jumlah data kelas “tepat”.
      •  P(status mahasiswa = mahasiswa | Y = terlambat) = 3/7 à jumlah data status mahasiswa “mahasiswa” dengan kejadian status kelulusan “terlambat” dibagi jumlah data kelas “terlambat”.
    • Variabel status pernikahan (X3):
      •  P(status pernikahan = belum | Y = tepat) = 4/8 à jumlah data status pernikahan “belum” dengan kejadian status kelulusan “tepat” dibagi jumlah data kelas “tepat”.
      • P(status pernikahan = belum | Y = terlambat) = 4/7 à jumlah data status pernikahan “belum” dengan kejadian status kelulusan “terlambat” dibagi jumlah data kelas “terlambat”.

    • Variabel IPK (X4):
      • P(IPK = 2.70| Y = tepat) = 0/8 à jumlah data IPK “2.70” dengan kejadian status kelulusan “tepat” dibagi jumlah data kelas “tepat”.
      • P(IPK = 2.70| Y = terlambat) = 1/7 à jumlah data IPK “2.70” dengan kejadian status kelulusan “terlambat” dibagi jumlah data kelas “terlambat”.

Step 3: Mengalikan semua variabel kelas

  • Tahap ketiga adalah mengalikan semua hasil variabel pada setiap kelas kejadian. Untuk contoh di atas, maka perhitungannya adalah sebagai berikut:
    • Kelas kejadian status kelulusan “tepat”:
      • P (jenis kelamin = laki-laki), (status mahasiswa = mahasiswa), (status pernikahan = belum), (IPK = 2.70 ) | TEPAT)
        = P(jenis kelamin = laki-laki |Y = tepat)
           x P(status mahasiswa = mahasiswa | Y = tepat) 
           x P(status pernikahan = belum | Y = tepat)
           x P(IPK = 2.70 | Y = tepat)
        = 5/8 x 5/8 x 4/8 x 0/8 x 8/15
        = 0
    • Kelas kejadian status kelulusan “terlambat”:
      • P (jenis kelamin = laki-laki), (status mahasiswa = mahasiswa), (status pernikahan = belum), (IPK = 2.70 ) | TERLAMBAT)
        = P(jenis kelamin = laki-laki |Y = terlambat)
           x P(status mahasiswa = mahasiswa | Y = terlambat)
           x P(status pernikahan = belum | Y = terlambat)
           x P(IPK = 2.70 | Y = terlambat)
        = 3/7 x 3/7 x 4/7 x 1/7 x 7/15
        = 0,00699

Step 4: Membandingkan hasil antar kelas

  • Pada tahap terakhir ini, yang perlu dilakukan hanya membandingkan hasil akhir kelas-kelas yang ada. Hasil atau keputusan yang diambil adalah hasil yang paling besar.
  • Untuk contoh di atas, hasilnya adalah:
    • P(tepat) = 0
    • P(terlambat) = 0,00699
    • Hasil P(terlambat) lebih besar dari P(tepat) maka keputusannya adalah “TERLAMBAT”.

No comments:

Post a Comment