Text
Perbandingan Hasil Akurasi Algoritma Random Forest dan Gaussian Naive Bayes dalam Klasifikasi Penyakit Jantung (Studi Kasus: Dataset Heart Disease)
Penyakit jantung merupakan salah satu penyebab kematian utama dalam sejarah medis.
Karena fungsinya yang sangat vital bagi kehidupan dan banyak faktor yang dapat
menyebabkan seseorang terkena penyakit jantung, maka menjaga kesehatan jantung
sangatlah penting bagi setiap individu. Terdapat beberapa cara yang dapat dilakukan untuk
melakukan diagnosa apakah seseorang terkena gejala penyakit jantung atau tidak seperti,
anamnesis, pemeriksaan fisik, pemeriksaan laboratorium, foto dada, EKG, treadmill test,
penentuan klasifikasi penyakit jantung, dan masih banyak lainnya. Penentuan klasifikasi
penyakit jantung yang dapat dilakukan adalah dengan mengenali sejak dini gejala penyakit
jantung dengan proses klasifikasi dengan data mining. Diperlukan metode data mining
yang tepat untuk dapat memprediksi penyakit jantung dengan lebih akurat. Metode data
mining yang akan digunakan pada penelitian ini adalah metode klasifikasi dengan
menggunakan algoritma Random Forest dan Gaussian Naïve Bayes karena kedua
algoritma ini umum digunakan dan menghasilkan akurasi yang cenderung tinggi pada
penelitian sebelumnya. Penelitian ini bertujuan untuk membandingkan hasil akurasi
algoritma Random Forest dan Gaussian Naïve Bayes dalam klasifikasi penyakit jantung
agar mendapatkan model data mining terbaik yang akurat untuk mendeteksi penyakit
jantung. Data yang digunakan dalam penelitian ini adalah dataset Heart Disease yang
diperoleh dari website Kaggle. Algoritma Random Forest dan Gaussian Naïve Bayes
diimplementasikan dengan menggunakan Python pada tool google colab. Algoritma
Random Forest dan Gaussian Naïve Bayes dievaluasi menggunakan metode k-fold cross
validation dengan k = 10. Hasil penelitian menunjukkan bahwa algoritma Random Forest
memiliki akurasi yang lebih tinggi daripada algoritma Gaussian Naïve Bayes, yaitu sebesar
83,94% dibandingkan 81,81%. Hal ini menunjukkan bahwa algoritma Random Forest
lebih baik dalam mendeteksi penyakit jantung. Kesimpulan penelitian ini adalah algoritma
Random Forest merupakan algoritma pemodelan data mining yang lebih baik untuk
mendeteksi penyakit jantung dibandingkan algoritma Gaussian Naïve Bayes.
Kata Kunci: Random Forest, Gaussian Naïve Bayes, Penyakit Jantung, Data Mining,
Klasifikasi, Akurasi
1250 F 2023 | 1250 F 2023 | Perpustakaan FSM Undip | Tersedia |
Tidak tersedia versi lain