Pengertian Decision Tree


  • Proses klasifikasi juaga merupakan proses menentukan kategori tertentu pada suatu objek berdasarkan rule tertentu.
  • Misalkan: 
    • klasifikasi negara-negara dengan kategori negara miskin, berkembang, maju dengan rule menggunakan interval GDP.
    • Klasifikasi harga suatu barang komersil dengan kategori mahal, wajar, murah dengan rule menggunakan interval harga barang. 
  • Pada saat proses klasifikasi ini, akan lebih mudah bila kita sudah mendapatkan rulenya.
  • Namun bagaimana bila kita belum memiliki rulenya? Disinilah kegunaan decision tree yang mampu membuat rule menjadi sebuah model pohon keputusan sehingga dari model ini dapat ditarik rulenya
Kelebihan Decision Tree:

  • mudah dimengerti dan dijelaskan
  • membantu untuk menentukan hasil yang diharapkan dari berbagai macam scenario
  • membantu untuk menentukan nilai terbaik dan nilai terburuk dari berbagai macam scenario
  • dapat dikombinasikan dengan teknik decision yang lain
  • membutuhkan persiapan data yang minimal 
  • masih dapat menghandledata yang hilang 
  • terpengaruh pada outliers mungkin ada tapi sangat kecil
  • tidak usah repot-repot menghitung hubungan nonlinear antar parameters
  • beberapa teknik decion tree dapat memprosed data numerik dan kategorikal
  • dapat membuat rule dari model decision tree 

Kekurangan
  • Pada beberapa data kategorikal, hasil akan menjadi bias bila jumlah perbedaan kategorinya banyak.
  • Kalau over-fitted terhadap data, hasil prediksi akan sangat buruk


Bentuk Decision Tree
  • Bentuknya memang seperti pohon dan juga banyak dipergunakan untuk mengambil keputusan, makanya disebut pohon keputusan
  • Struktur pohon keputusan terdiri dari
    • komponen pohon hanya terdiri dari node dan edge
    • jenis-jenis node:
      • Root node adalah node di bagian pohon keputusan yang paling atas dimana tidak ada lagi edge yang menunjuknya.Root node digambarkan sebagai ellips.
      • Internal node adalah di bagian tengah pohon keputusan dimana ada edge yang menunjuknya dan ada juga edge yang keluar darinya. Internal node digambarkan sebagai ellips. 
      • Terminal node (leaf) adalah node di bagian ujung bawah pohon keputusan, dimana hanya ada edge yang menunjukknya dan tidak ada lagi edge yang keluar darinya. Terminal node digambarkan sebagai persegi panjang.

Data yang diperlukan
  • Data berbentuk sebuah tabel yang terdiri dari kolom (attributes) dan baris (records).
  • Attribute ini penting karena dipergunakan sebagai parameter untuk membangun pohon keputusan.
  • Attribute Identity adalah attribute unik yang menunjuk kepada satu objek tertentu, Contoh bila objeknya pelajar, maka attribute identitynya adalah Nomor Induk Pelajar (NIP).  
  • Attribute yang dipergunakan sebagai tujuan klasifikasi disebut dengan target attribute.

Proses-proses dalam pembentukkan Decision Tree:
  • Proses pengembangan decison tree yaitu proses split satu node jadi beberapa node dan seterusnya. Split ini pada dasarnya merupakan proses untuk membagi suatu dataset menjadi beberapa subset. Proses split ini terus dilakukan sampai dilakukannya proses pemberhentian split.
  • Proses pemberhentian split dilakukan apabila setiap record sudah memiliki suatu klasifikasi yang tidak berubah lagi. Namun ada kalanya diperlukan prosedur untuk menghentikan proses secara dini.
  • Proses membuat rule dari model decision tree.
  • Proses Prunning yaitu penyederhaan rule.

Bacaan berikutnya kembali ke Classification




No comments:

Post a Comment