Pengertian Algoritma Naive Bayes


Algoritma Naive Bayes
Contributor: Triesta Arviana Haryadinanti

1. Tentang Algoritma Naive Bayes

Naïve Bayes merupakan metode klasifikasi yang berdasarkan pada Teorama Bayes. Dinamakan Teorema Bayes karena disesuaikan dengan nama penemunya, yaitu Reverend Thomas Bayes, walaupun sebenarnya ada beberapa penelitian yang mengatakan bahwa Teorema Bayes telah ditemukan oleh orang lain sebelum Reverend Thomas Bayes.
Reverend Thomas Bayes merupakan seorang ilmuwan dari Inggris. Reverend Thomas Bayes mempelajari hal-hal mengenai klasifikasi, namun setelah beliau meninggal, temannyalah yang menggantikannya untuk mempresentasikan penelitiannya.

Reverend Thomas Bayes

Algoritma Naïve Bayes kurang lebih ditemukan pada pertengahan abad ke-18. Pada saat itu, algoritma ini dikenal dengan banyak nama. Meskipun begitu, algoitma ini populer dikenal sebagai metode pengelompokkan teks dan pengkategorian menggunakan frekuensi kata-kata.
Sesuai namanya, algoritma Naïve Bayes disebut demikian karena cirinya yang “naïve”, yaitu mengasumsikan bahwa setiap variabelnya independen, bebas antara satu sama lain, tidak memiliki hubungan atau korelasi yang bisa memengaruhi hasilnya.
Walaupun Naïve Bayes dianggap memiliki asumsi yang terlalu sederhana, namun Naïve Bayes telah bekerja dengan baik untuk menangani masalah-masalah nyata yang rumit. Seperti pada tahun 2004, sebuah hasil analisis menyatakan bahwa ada alasan mengenai keakuratan Naïve Bayes yang mana keakuratan tersebut bertentangan dengan anggapan orang-orang. Pada tahun 2006, pengklasifikasian dengan Naïve Bayes menampilkan performa dan hasil yang lebih baik dibandingkan dengan metode-metode lain seperti random forest dan boosted trees. 

2. Kegunaan Naïve Bayes

·           Mengklasifikasikan dokumen teks seperti teks berita ataupun teks akademis
·           Sebagai metode machine learning yang menggunakan probabilitas
·           Untuk membuat diagnosis medis secara otomatis
·           Mendeteksi atau menyaring spam


3. Kelebihan Naïve Bayes

·           Bisa dipakai untuk data kuantitatif maupun kualitatif
·           Tidak memerlukan jumlah data yang banyak
·           Tidak perlu melakukan data training yang banyak
·           Jika ada nilai yang hilang, maka bisa diabaikan dalam perhitungan.
·           Perhitungannya cepat dan efisien
·           Mudah dipahami
·           Mudah dibuat
·           Pengklasifikasian dokumen bisa dipersonalisasi, disesuaikan dengan kebutuhan setiap orang
·           Jika digunakan dalaam bahasa pemrograman, code-nya sederhana
·           Bisa digunakan untuk klasifikasi masalah biner ataupun multiclass

4. Kekurangan Naïve Bayes

·           Apabila probabilitas kondisionalnya bernilai nol, maka probabilitas prediksi juga akan bernilai nol
·           Asumsi bahwa masing-masing variabel independen membuat berkurangnya akurasi, karena biasanya ada korelasi antara variabel yang satu dengan variabel yang lain
·           Keakuratannya tidak bisa diukur menggunakan satu probabilitas saja. Butuh bukti-bukti lain untuk membuktikannya.
·           Untuk membuat keputusan, diperlukan pengetahuan awal atau pengetahuan mengenai masa sebelumnya. Keberhasilannya sangat bergantung pada pengetahuan awal tersebut
·           Banyak celah yang bisa mengurangi efektivitasnya
·          Dirancang untuk mendeteksi kata-kata saja, tidak bisa berupa gambar




2 comments: