Clustering



Clustering atau klasterisasi merupakan metode pengelompokan data. Menurut Tan, 2006 clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum

Clustering banyak digunakan dalam berbagai aplikasi seperti misalnya pada business inteligence, pengenalan pola citra, web search, bidang ilmu biologi, dan untuk keamanan (security).

Manfaat Clustering
  1. Clustering merupakan metode segmentasi data yang sangat berguna dalam prediksi dan analisa masalah bisnis tertentu. Misalnya Segmentasi pasar, marketing dan pemetaan zonasi wilayah.
  2. Identifikasi obyek dalam bidang berbagai bidang seperti computer vision dan image processing.
Metode clustering secara umum dapat dibagi menjadi dua yaitu hierarchical clusteringdan partitional clustering (Tan, 2011)..
    • Partitional clustering. Pada metode partitional clustering setiap cluster memiliki titik pusat cluster (centroid) dan secara umum metode ini memiliki fungsi tujuan yaitu meminimumkan jarak (dissimilarity) dari seluruh data ke pusat cluster masing-masing. Salah satu contoh partitional clustering adalah kmeans. Materi-materi klaster partisi meliputi:


    Daftar Pustaka

    Tan, P.N., Steinbach, M., Kumar, V. (2006) Introduction to Data Mining. Boston:Pearson Education.

    No comments:

    Post a Comment