Text
KLASIFIKASI PENYAKIT DIABETES MENGGUNAKAN ALGORITMA RANDOM FOREST
Random Forest telah banyak digunakan dalam bidang medis, khususnya untuk
diagnosis penyakit diabetes. Penyakit diabetes merupakan penyakit paling umum pada
semua populasi dan merupakan salah satu penyebab kematian dalam medis. Penelitian
klasifikasi penyakit diabetes menggunakan algoritma random forest pernah dilakukan
sebelumnya. Berdasarkan Penelitian Tigga & Garg (2020) klasifikasi penyakit diabetes
menggunakan algoritma random forest menghasilkan akurasi dengan nilai 94,10% lebih
baik daripada algoritma Logistic Regression Method, K- Nearest Neighbor Classifier,
Support Vector Machine, Decision Tree Classification Method. Random Forest adalah salah
satu algoritma pembelajaran mesin yang menggunakan kombinasi dari banyak Decision
Tree untuk mendapatkan hasil klasifikasi dan regresi. Random Forest memiliki kemajuan
hasil akurasi klasifikasi yang signifikan berkat sekumpulan Decision Tree yang melakukan
klasifikasi secara individu dan melakukan voting untuk mendapatkan hasil klasifikasi. Pada
skripsi ini dilakukan pencarian model terbaik random forest dan analisis data diabetes. Dari
hasil diperoleh bahwa random forest terbaik menghasilkan nilai f1-score tertinggi sebesar
96,59%. Nilai f1-score terbaik untuk diabetes dataset diperoleh menggunakan nilai
parameter n_estimators 50, max_features 15, dan max_depth None. Dari 520 dataset
diperoleh 320 data terklasifikasi ke kelas positif diabetes dan 200 data terklasifikasi ke kelas
negatif diabetes. Ciri-ciri penyakit diabetes yaitu memiliki gejala polyuria, weakness dan
polydipsia. Saran yang dapat diberikan untuk penelitian lanjutan terkait dengan penelitian
ini adalah diharapkan model yang dihasilkan dapat diimplementasikan kedalam aplikasi atau
perangkat mobile.
Kata Kunci : Random Forest, Diabetes, N_estimator, Max_features, Max_depth.
1251 F 2023 | 1251 F 2023 | Perpustakaan FSM Undip | Tersedia |
Tidak tersedia versi lain