Text
Implementasi Random Forest Berdasarkan Nilai Pearson Correlation Untuk Meningkatkan Akurasi Klasifikasi Kanker Prostat
Kanker prostat adalah kondisi ketika uretra yang merupakan tabung yang menghubungkan
kandung kemih ke luar mengalami penyempitan. Kanker prostat telah menjadi jenis kanker
yang paling umum kedua ditemui pada pria setelah kanker paru – paru di seluruh dunia.
Maka dari itu perlu adanya pendekatan lebih dari berbagai sudut pandang, terutama di bagian
non-medis demi menambah lebih dalam pemahaman mengenai kanker prostat. Salah satu
contoh pendekatan non-medis terutama di bidang teknologi dan informasi adalah dengan
menggunakan ilmu data mining. Metode data mining yang akan digunakan pada penelitian
ini adalah metode klasifikasi dengan menggunakan algoritma Random Forest dengan
memanfaatkan Feature Selection berdasarkan nilai Pearson Correlation. Dengan
menerapkan algoritma Random Forest berdasarkan nilai Pearson Correlation pada
klasifikasi kanker prostat diharapkan dapat menghasilkan model yang dapat secara tepat
mengidentifikasi seseorang terkena kanker prostat atau tidak. Tujuan dari penelitian ini
adalah mengetahui bagaimana penyakit jantung dapat dideteksi dengan data mining melalui
algoritma Random Forest berdasarkan nilai Pearson Correlation, mengetahui apakah
algoritma Random Forest berdasarkan nilai Pearson Correlation menghasilkan akurasi lebih
tinggi dibanding tanpa Pearson Correlation dalam klasifikasi kanker prostat. Penelitian ini
diawali dengan identifikasi masalah dan studi literatur, kemudian dilakukan pengumpulan
data penelitian berupa dataset kanker prostat. Setelah itu, dilakukan serangkaian proses data
mining mulai dari pre-processing sampai evaluasi yang menghasilkan nilai akurasi model
klasifikasi kanker prostat dengan algoritma Random Forest berdasarkan nilai Pearson
Correlation. Proses data mining menghasilkan perbandingan akurasi dari kedua model yang
digunakan pada penelitian ini. Penelitian ini menghasilkan kesimpulan bahwa pemodelan
klasifikasi kanker prostat dengan algoritma Random Forest berdasarkan nilai Pearson
Correlation memiliki nilai akurasi 90% dengan perbedaan 25% lebih tinggi dibanding tanpa
Feature Selection Pearson Correlation. Dengan kata lain, pemodelan dengan algoritma
Random Forest berdasarkan nilai Pearson Correlation dapat melakukan klasifikasi apakah
seseorang terkena kanker prostat lebih baik dibanding algoritma Random Forest tanpa
Feature Selection.
Kata kunci : Data Mining, Random Forest, Kanker Prostat, Feature Selection, Pearson
Correlation, Klasifikasi, Akurasi
| 1269 F 2024 | 1269 F 2024 | Perpustakaan FSM Undip | Tersedia |
Tidak tersedia versi lain