Text
Metode k-Medoids Clustering dengan Validasi Silhouette Index dan C-Index (Studi Kasus Jumlah Kriminalitas Kabupaten/Kota di Jawa Tengah tahun 2018)
ABSTRAK
Metode k-medoids merupakan metode pengklasteran non hierarki yang bertujuan untuk mengelompokkan n objek ke dalam k klaster yang memiliki karakteristik sama. Algoritma pengklasteran ini menggunakan medoid sebagai pusat klasternya. Medoid merupakan objek yang letaknya terpusat di dalam suatu klaster, sehingga lebih robust terhadap adanya pencilan. Pada analisis klaster objek-objek dikelompokkan berdasarkan kemiripannya. Untuk mengukur tingkat kemiripan tersebut digunakan ukuran jarak, yaitu jarak euclidean dan jarak cityblock. Ukuran jarak yang digunakan dalam analisis klaster dapat berpengaruh pada hasil klaster yang diperoleh. Untuk mengetahui kualitas hasil analisis klaster dilakukan uji validasi dengan pendekatan kriteria internal yaitu validasi silhouette index dan C-index. Pada penelitian ini metode k-medoids digunakan untuk mengelompokkan Kabupaten/Kota di Jawa Tengah berdasarkan jenis dan jumlah kriminalitas. Diperoleh klaster yang optimal pada k=4 menggunakan jarak euclidean, dimana nilai silhouette index=0,3862593 dan C-index=0,043893.
Kata Kunci: Pengklasteran, k-Medoids, Jarak euclidean, Jarak cityblock, Silhouette index, C-index, Kriminalitas
ABSTRACT
The k-medoids method is a non-hierarchical clustering to classify n object into k clusters that have the same characteristics. This clustering algorithm uses the medoid as its cluster center. Medoid is the most centrally located object in a cluster, so it’s robust to outliers. In cluster analysis the objects are grouped by the similarity. To measure the similarity, it can be used distance measures, euclidean distance and cityblock distance. The distance that is used in cluster analysis can affect the clustering results. Then, to determine the quality of the clustering results can be used the internal criteria with silhouette width and C-index. In this research the k-medoids method to classify of regencies/cities in Central Java based on type and number of crimes. The optimal cluster at k= 4 uses euclidean distance, where the silhouette index= 0,3862593 and C-index= 0,043893.
Keywords: Clustering, k-Medoids, Euclidean distance, Cityblock distance, Silhouette index, C-index, Crime
733E19III | 733 E 19-ii | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain