Text
Penerapan Klasifikasi Regresi Logistik Biner dan Classification and Regression Trees pada Prediksi Penyakit Hepatitis C
Virus hepatitis C dapat mengganggu fungsi hati dan mengancam kesehatan.
Hasil pemeriksaan laboratorium seperti pengukuran kadar albumin, bilirubin, dan
enzim pada hati dapat membantu mendeteksi adanya hepatitis. Proses klasifikasi
digunakan untuk mengetahui kondisi pasien dengan status positif atau negatif
hepatitis. Pengolahan data menggunakan metode klasifikasi Regresi Logistik Biner
dan Classification and Regression Trees (CART). Metode tersebut digunakan
karena data penelitian ini memiliki variabel respon yang bersifat biner. Regresi
Logistik Biner merupakan Regresi Logistik dengan variabel responnya bersifat
biner. Pendekatan dengan proses Adaptive Boosting dilakukan untuk memperbaiki
kinerja dari klasifikasi pohon keputusan CART dengan menambahkan bobot pada
pengamatan yang salah diklasifikasikan. Masalah data imbalance ditemukan pada
data penelitian dengan kategori positif hepatitis sebanyak 45 data dan kategori
negatif hepatitis sebanyak 427 data. Penanganan data imbalance menggunakan
teknik Synthetic Minority Over-Sampling Technique (SMOTE) yang bekerja
dengan cara membangkitkan data dari kelas minor dengan pendekatan
ketetanggaan. Pengambilan data diperoleh dari Machine Learning Repository UCI
(University of California Irvine) tahun 2020 mengenai hasil laboratorium donor
darah di Jerman yang berisi status hepatitis C pasien. Data tersebut mudah diakses
dan memiliki variabel yang dibutuhkan untuk proses klasifikasi. Ukuran ketepatan
klasifikasi yang cocok digunakan untuk kasus penyakit hepatitis C adalah
sensitivitas karena mampu mengukur proporsi penyakit hepatitis diprediksi secara
benar terkena hepatitis. Hasil ketepatan klasifikasi metode Regresi Logistik Biner
menghasilkan sensitivitas sebesar 100%. Ketepatan klasifikasi metode CART
dengan Adaptive Boosting menghasilkan nilai sensitivitas sebesar 90,91%. Regresi
Logistik Biner adalah metode terbaik yang dapat mengklasifikasikan status
hepatitis C pasien dengan sensitivitas tertinggi 100%.
Kata Kunci: Hepatitis C, Regresi Logistik Biner, Adaptive Boosting,
Classification and Regression Trees, Synthetic Minority Oversampling Technique,
Sensitivitas
1133E2023 | 1133 E 2023 | Perpustakaan FSM Undip | Tersedia |
Tidak tersedia versi lain