kNN Classification



kNN dapat digunakan untuk proses klasifikasi. Prinsipnya kita mau tahu apa klasifikasi data di posisi tertentu. Kemudian kita mencari sebanyak k data terdekat. Kemudian sifat-sifat data di posisi yang kita tunjuk adalah klasifikasi dengan jumlah data yang paling banyak.

STEP-BY-STEP kNN:

  1. Plot seluruh sampel data
  2. Temukan k=3 sampel data terdekat. Klasifikasi dengan jumlah sampel terbanyak adalah klasifikasi yang dihasilkan. Catat hasil klasifikasi ini.
  3. Ulangi langkah kedua menggunakan bilangan ganjil k=5, 7, 9 ... sampai tidak ada lagi perbedaan jenis klasifikasi yang dhasilkan.

    CONTOH SOAL:  

    Sebuah SMA memiliki kebijakan untuk membagi jurusan IPA dan IPS berdasarkan nilai ujian matematika dan bahasa Inggrisnya.
    • Bila nilai matematikanya lebih tinggi dari bahasa Inggris, maka siswa tsb masuk ke jurusan IPA. 
    • Sebaliknya bila nilai bahasa Inggrisnya lebih tinggi dari nilai matematikanya, maka siswa tsb masuk ke jurusan  IPS.


    PERTANYAAN: Kalau seorang siswa dengan nilai matematika 4 dan bahasa Inggris juga 4, sebaiknya masuk ke jurusan apa?

    STEP-1: Menggambarkan Plot. 
    • Plot terdiri dari 2 sumbu. 
    • Sumbu horisontal (mendatar) menggambarkan nilai bahasa Inggris dan sumbu vertikal (tegak) menggambarkan nilai matematika.


    STEP-2: Plot Data Pertama 
    • Pertama-tama kita mendapatkan A seorang siswa IPA. Nilai matematikanya 8 tetapi nilai bahasa Inggrisnya cuma 4. A kita letakkan pada posisi (4,8) seperti terlihat pada gambar. 
    • Yang IPA kta beri warna Biru dan IPS kita beri warna Merah. A kita beri warna biru.

    STEP-3: Plot Data Kedua. 
    • Setelah itu, kita mendapatkan B seorang siswa IPS. Nilai matematikanya 7 dan nilai bahasa Inggrisnya 9. B kita letakkan pada posisi (9,7) seperti terlihat pada gambar. 
    • B kita beri warna merah karena IPS.

    STEP-4: Plot Data Seluruhnya. 
    • Seluruhnya, kita dapatkan 5 siswa IPA dan 5 siswa IPS
    • Kemudian kita plot data yang masih belum kita plot mulai dari C, D,  sampai J seperti pada gambar.

    STEP-5: Plot Data P 
    • Kemudian kita plot data yang ditanyakan yaitu P dengan nilai matematika dan bahasa Inggris sama-sama 4.
    • Kita Plot P di posisi (4,4) seperti terlihat pada gambar.

    STEP-6: k=3.
    • Biasanya nilai k bilangan ganjil
    • Sebaiknya k tidak sama dengan 1 karena kurang informasinya. 
    • Bilangan ganjil bukan 1, kita gunakan k=3.
    • Karena k=3, kita harus mencari 3 tetangga terdekat dengan P. Kita temukan titik F, D, dan H.
    • Karena ada 2 data berwarna biru dan hanya 1 merah, maka untuk k=3, P akan ikut warna biru atau klasifikasi IPA.

    STEP-7: k=5.
    • Selanjutnya, kita  ganti k=5. 
    • Sehingga kita harus mencari 5 tetangga terdekat dengan P. Kita temukan titik F, D, A, H, dan J.
    • Karena 3 data berwarna biru dan hanya 2 merah, maka untuk k=5, P akan ikut warna biru atau klasifikasi IPA.
    • Karena sudah tidak terjadi perubahan klasifikasi, maka kita putuskan untuk tidak menambah nilai k lagi.

    KESIMPULAN

    •  Siswa P sebaiknya masuk jurusan IPA.