Text
Kernel K-Means Clustering untuk Pengelompokan Sungai di Kota Semarang Berdasarkan Faktor Pencemaran Air DB
K-Means Clustering merupakan salah satu jenis analisis cluster non-hierarki yang
sering digunakan. K-Means memiliki kelemahan memproses data yang nonlinearly separable (tidak memiliki pembatas yang jelas) dan terjadi overlap, yaitu
ketika secara visual hasil suatu cluster berada di antara cluster lainnya. Fungsi
Kernel Gaussian dapat digunakan untuk mengatasi pengelompokan data yang
bersifat non-linearly separable dan overlap pada analisis cluster. Salah satu
metode cluster non-hierarki yang menggunakan fungsi Kernel Gaussian yaitu
Kernel K-Means Clustering. Tujuan dari penelitian ini adalah mengetahui konsep
langkah dan hasil Kernel K-Means Clustering untuk pengelompokan sungai di
Kota Semarang berdasarkan faktor pencemaran air. Data real yang digunakan
adalah data 47 sungai dan 18 indikator pencemaran air sungai yang diperoleh dari
Dinas Lingkungan Hidup (DLH) Kota Semarang pada semester pertama tahun
2019. Algoritma Kernel K-Means Clustering pada prinsipnya hampir sama
dengan metode K-Means, perbedaannya terletak pada data inputnya yang harus
dipetakan pada dimensi baru menggunakan fungsi kernel. Evaluasi hasil cluster
yang digunakan adalah indeks Calinski-Harabasz, Silhouette, dan Xie-Beni karena
memiliki performa yang baik dalam aspek terhadap dampak kemonotonan dan
kepadatan. Dari hasil studi, evaluasi hasil cluster menunjukkan jumlah cluster
terbaik adalah K=4. Anggota untuk 4 cluster adalah 12, 14, 11, dan 10 sungai
dengan 6 variabel pada klaster 1 dan klaster 2 memiliki rata-rata kandungan faktor
pencemaran air lebih tinggi dibandingkan pada klaster lainnya.
Kata Kunci: Kernel Gaussian, Kernel K-Means Clustering, Evaluasi Hasil
Cluster
Tidak ada salinan data
Tidak tersedia versi lain