Text
Implementasi Algoritma Random Forest untuk Mengidentifikasi Situs Web Phishing
ABSTRAK
Phishing merupakan salah satu bentuk penipuan elektronik yang bertujuan untuk mendapatkan
informasi sensitif seseorang. Situs web phishing dengan desain yang bagus akan menjebak
pengguna internet dengan mudah apabila pengetahuan pengguna internet mengenai situs web
phishing masih sangat minim. Selain berdampak pada individu, efek phishing juga akan
berdampak pada perusahaan. Pada penelitian ini dibangun aplikasi pendeteksi situs web
phishing yang bertujuan untuk menghindarkan pengguna internet dari perangkap phishing.
Pengembangan aplikasi pendeteksi situs web phishing pada penelitian ini dikembangkan
dengan menggunakan model proses waterfall. Algoritma random forest digunakan pada
penelitian ini untuk pelatihan data dan untuk mendapatkan model klasifikasi. Random forest
merupakan algoritma yang menggabungkan decision tree dengan bootstrap aggregation
(Bagging) untuk mendapatkan hasil akhir yang konsisten dan akurasi yang lebih baik. Ratarata kinerja akurasi random forest pada penelitian ini mendapatkan hasil sebesar 88,29% dan
rata-rata akurasi yang dihasilkan oleh scikit-learn adalah sebesar 88,02%.
Kata kunci : Phishing, Random Forest, Decision Tree, Waterfall, Bootstrap Aggregation
(Bagging).
ABSTRACT
Phishing is one form of an electronic fraud which aims to get sensitive information of an
individual. Phishing website with a good design will trap internet users with ease if the internet
users have little knowledge towards phishing. Aside from impacting an indivudual, the effect
of phishing will also have an impact on a company. Phishing website detection application was
built in this research which aim to avoid internet users from phishing trap. The development of
phishing website detection application in this research was developed using the waterfall
model. Random forest algorithm was used in this research to train the model of the data.
Random forest is an algorithm that combines decision tree algorithm with bootstrap
aggregation (Bagging) to obtain more consistent result and improve overall accuracy. The
mean accuracy performance of random forest algorithm in this research has a result of 88,29%
and the scikit-learn library accuracy has a result of 88,02%.
Keywords : Phishing, Random Forest, Decision Tree, Waterfall, Bootstrap Aggregation
(Bagging)
886F20IV | 886 F 20-iv | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain