Text
Perbandingan Kinerja Mutual K-Nearest Neighbor (MKNN) Dan K-Nearest Neighbor
ABSTRAK
Analisis kelayakan kredit merupakan hal yang penting bagi pihak pemberi kredit untuk menghindari risiko di tengah peningkatan jumlah permohonan kredit. Analisis tersebut dapat dilakukan dengan teknik klasifikasi, salah satunya adalah instance-based classification. Teknik tersebut cenderung sederhana, namun sangat tergantung pada penentuan nilai jumlah tetangga terdekat K yang dijadikan dasar pengklasifikasian kelas data baru. K yang terlalu kecil sangat sensitif terhadap outlier. Kelemahan tersebut dapat diatasi menggunakan algoritma yang mampu menangani outlier, salah satunya Mutual K-Nearest Neighbor (MKNN). MKNN pada prinsipnya menghapuskan outlier terlebih dahulu kemudian memprediksi kelas amatan baru berdasarkan mayoritas kelas dari tetangga mutual terdekatnya. Algoritma tersebut akan dibandingkan dengan KNN yang juga telah melalui tahap penghapusan outlier. Evaluasi model dilakukan dengan 10-fold cross validation dan kinerja klasifikasi diukur dengan Geometric-Mean dari sensitifitas dan spesifisitas. Hasil analisis menunjukkan bahwa nilai K optimal adalah K=9 untuk algoritma MKNN dan K=3 untuk KNN. G-Mean tertinggi dihasilkan oleh KNN yaitu sebesar 0,718, sedangkan MKNN menghasilkan G-Mean sebesar 0,702. Alternatif terbaik untuk mengklasifikasi kelayakan kredit dalam penelitian ini adalah penggunaan algoritma K-Nearest Neighbor (KNN) dengan K=3.
Kata Kunci : Klasifikasi, Kredit, MKNN, KNN, G-Mean.
ABSTRACT
Credit feasibility analysis is important for lenders to avoid the risk among the increasement of credit applications. This analysis can be carried out by the classification technique. Classification technique used in this research is instance-based classification. These techniques tend to be simple, but are very dependent on the number of K nearest neighbor considered for class classification of new data. A small value of K is very sensitive to outliers. This weakness can be overcome using algorithms that are able to handle outliers, one of them is Mutual K-Nearest Neighbor (MKNN). MKNN removes outliers first, then predicts new observation classes based on the majority class of their mutual nearest neighbors. The algorithm will be compared with KNN without outliers. The model is evaluated by 10-fold cross validation and the classification performance is measured by Geometric-Mean of sensitivity and specificity. Based on the analysis the optimal value of K is 9 for MKNN and 3 for KNN, with the highest G-Mean produced by KNN is equal to 0.718, meanwhile G-Mean produced by MKNN is 0.702. The best alternative to classifying credit feasibility in this study is K-Nearest Neighbor (KNN) algorithm with K=3.
Keywords: Classification, Credit, MKNN, KNN, G-Mean.
743E19III | 743 E 19-ii | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain