Text
Klasifikasi Kualitas Kopi Arabika dengan Metode Random Forest dan K-Nearest Neighbor pada Imbalanced Dataset
Kopi merupakan komoditas perkebunan yang unggul dalam bidang ekspor
dengan nilai ekonomi yang tinggi. Kualitas kopi menjadi faktor terpenting yang
mempengaruhi nilai jual, sehingga penilaian kualitas kopi merupakan kunci utama
dalam penetapan harga pasar dan menentukan potensi ekspor dari negara-negara
penghasil kopi. Kualitas kopi dibagi menjadi spesialti, premium, dan reguler
berdasarkan cacat biji dan nilai uji cita rasa. Prediksi kualitas kopi diperlukan untuk
mengetahui kopi mana yang memiliki kualitas terbaik. Penelitian ini
membandingkan metode Random Forest dan K-Nearest Neighbor (KNN) untuk
mengetahui algoritma mana yang paling efektif dalam memprediksi kualitas kopi.
Prinsip kerja Random Forest yaitu membangun lebih dari satu decision tree
kemudian menentukan nilai dugaan berdasarkan majority voting. KNN melakukan
klasifikasi terhadap data berdasarkan jarak antara data tersebut dengan data lain.
Dataset kopi yang digunakan bersumber dari Database Coffee Quality Institute
(CQI). Data memiliki masalah ketidakseimbangan sehingga menghasilkan nilai
recall yang kecil pada kelas minoritas, algoritma oversampling SMOTE digunakan
untuk meningkatkan kinerja klasifikasi. Kelebihan oversampling dibandingkan
undersampling yaitu tidak kehilangan informasi data. Hasil penelitian
menunjukkan bahwa metode Random Forest setelah dilakukan SMOTE
menghasilkan kinerja klasifikasi terbaik dengan nilai akurasi dan recall masingmasing adalah 80,26% dan 80,59%.
Kata Kunci: Klasifikasi, Kopi Arabika, SMOTE, K-Nearest Neighbor, Random
Forest
| 1095E2023 | 1095 E 2023 | Perpustakaan FSM Undip | Tersedia |
Tidak tersedia versi lain