Text
Implementasi Algoritma Random Forest untuk Mendiagnosa Kejadian Berulang (Kekambuhan) paa Kanker Payudara Berbasis WEB
ABSTRAK
Kanker merupakan sel ganas yang menjadi peran utama penyebab kematian yang hampir
tidak dapat dicegah. Kanker menjadi penyebab utama kematian dengan menduduki
peringkat kedua secara global yang diperkirakan 9,6 juta kematian terjadi pada tahun 2018
akibat kanker. Kanker payudara adalah kanker yang paling umum dengan menduduki
peringkat kedua setelah kanker paru-paru. Kanker payudara memiliki dampak sekitar 2,1
juta wanita pada tiap tahunnya dan menyebabkan kematian terkait kanker pada wanita.
Pada tahun 2018, diperkirakan 627.000 wanita meninggal akibat kanker payudara. Angka
ini menunjukkan sekitar 15% dari seluruh kematian akibat kanker yang terjadi pada
wanita. Pada saat kanker payudara pernah diobati, ada kemungkinan bahwa penyakit
tersebut akan muncul kembali beberapa waktu yang akan datang setelah penyakit tersebut
sudah dinyatakan tidak ada. Kebanyakan kejadian berulang pada kanker payudara terjadi
dalam lima tahun pertama dengan penampilan yang mungkin lebih terlihat dalam dua
tahun pertama dan akan jarang terjadi setelah 10 tahun. Sudah banyak penelitian yang telah
meneliti faktor risiko kekambuhan pada kanker yaitu usia, pada faktor ini perempuan yang
masih muda memiliki risiko yang lebih tinggi untuk perkembangan kekambuhan kanker
payudara. Selain itu ada faktor genetik seperti riwayat keluarga, status reseptor hormon,
status nodus pada kelenjar getah bening, dan ukuran tumor sebagai faktor risiko yang
ditetapkan. Oleh karena itu, perhatian terhadap tindak lanjut seseorang yang mengidap
kanker payudara harus dilakukan karena penyakit tersebut memiliki peningkatan terhadap
risiko kekambuhan pada pengidapnya. Random Forest merupakan salah satu teknik
pembelajaran yang paling sukses dan populer yang telah terbukti teknik yang paling kuat
untuk masalah klasifikasi dimensi tinggi dan masalah yang tidak simetris. Pada penelitian
ini dilakukan diagnosis kejadian berulang (kekambuhan) pada kanker payudara dengan
mengimplementasikan random forest dalam pengklasifikasiannya. Pada penelitian ini,
dataset yang digunakan adalah dataset breast cancer yang diperoleh dari University of
California Irvine (UCI) yang terdiri dari 9 atribut dan 2 parameter kelas. Penelitian ini juga
menggunakan metode k-fold cross validation dalam pembagian dataset menjadi data latih
dan data uji. Dengan mengimplementasikan random forest untuk mendiagnosis kejadian
berulang (kekambuhan) pada kanker payudara yang diajukan pada penelitian ini
memperoleh nilai akurasi akhir sebesar 82,23%, sensitivity sebesar 52,5%, dan specificity
sebesar 93,5% dengan menggunakan k-fold cross validation.
Kata Kunci : Kanker, Kanker Payudara, Kekambuhan, Random Forest, University of
California Irvine (UCI), K-fold Cross Validation.vii
ABSTRACT
Cancer is a malignant cell which have the main role of the cause of death that can hardly
be prevented. Cancer is the leading cause of death and ranks second globally with an
estimated 9.6 million deaths occurring in 2018 due to cancer. Breast cancer is the most
common cancer with the second rank after lung cancer. Breast cancer has an impact of
around 2.1 million women each year and causes cancer-related deaths in women. In 2018,
an estimated 627,000 women died from breast cancer. This figure shows about 15% of all
cancer deaths that occur in women. When breast cancer has been treated, it is possible that
the disease will reappear some time to come after the disease has been declared nonexistent. Most recurring events in breast cancer occur in the first five years with
appearances that may be more visible in the first two years and will rarely occur after 10
years. There have been many studies that have examined the risk factors for recurrence in
cancer, namely age, in this factor young women have a higher risk of developing breast
cancer recurrence. In addition there are genetic factors such as family history, hormone
receptor status, node status in the lymph nodes, and tumor size as defined risk factors.
Therefore, attention to the follow-up of someone who has breast cancer should be done
because the disease has an increased risk of recurrence. Random Forest is one of the most
successful and popular learning techniques that has proven to be the most powerful
technique for high dimensional classification problems and asymmetrical problems. In this
study a diagnosis of recurring events (recurrence) in breast cancer was carried out by
implementing random forest in its classification. In this study, the dataset was using the
breast cancer dataset which obtained from the University of California Irvine (UCI)
consisting of 9 attributes and 2 class parameters. This study also uses the k-fold cross
validation method in dividing datasets into training data and test data. By implementing
random forest to diagnose recurring events (recurrence) in breast cancer that proposed in
this study obtained the final accuracy value of 82.23%, sensitivity value of 52,5%, and
specificity value of 93,5% using the data in k-fold cross validation.
Keywords : Cancer, Breast Cancer, Recurrence, Random Forest, University of California
Irvine (UCI), K-fold Cross Validation.
688F18IV | 688 F 19-i | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain