Text
Penerapan Algoritma C4.5 Pada Aplikasi Prediksi Kelulusan Mahasiswa Prodi Teknik Informatika
ABSTRAK
Data tentang mahasiswa yang lulus merupakan sebuah data yang penting baik bagi departemen, fakultas maupun universitas karena data tersebut digunakan dalam proses akreditasi. Data tentang mahasiswa yang lulus terus bertambah ditiap tahunnya dan menumpuk seperti data yang terabaikan karena jarang digunakan. Data tentang mahasiswa yang lulus dapat memberikan informasi yang berguna jika dimanfaatkan dengan maksimal. Maka dari itu penelitian ini akan memanfaatkan data tentang mahasiswa yang lulus dengan mengolahnya menggunakan data mining untuk mendapatkan informasi berupa prediksi kelulusan mahasiswa. Metode yang akan digunakan adalah metode pohon keputusan yang dibangun dengan algoritma C4.5 disertai dengan algoritma error-based pruning untuk proses pemotongan pohon keputusan. Kriteria yang akan digunakan adalah jenis kelamin, asal daerah, IPK, dan TOEFL. Dalam penerapannya, algoritma C4.5 dapat digunakan untuk menghasilkan prediksi kelulusan dengan nilai rata-rata precision 63.93%, recall 60.73%, dan akurasi 60.52%. Setelah pohon keputusan dipotong dengan menggunakan metode error-based pruning, didapatkan hasil yang lebih baik. Pohon yang dipotong dengan menggunakan nilai confidence 0,4 menghasilkan precision 70.70%, recall 50.65%, dan akurasi 61.57%. Sedangkan pohon yang dipotong dengan menggunakan nilai confidence 0,25 menghasilkan precision 73.77%, recall 48.84%, dan akurasi 62.44%.
Kata kunci: Data Mining, Kelulusan Mahasiswa, Pohon Keputusan, C4.5, Error-based Pruning
ABSTRACT
Data of student who have graduated is essential data for departement, faculty and university because it used in the process of validating the existence of a university. Data of student who have graduated continues to grow each year and accumulate as neglected data because it is rarely used. Data of student who have graduated can provide useful information if it is utilized to the fullest. Therefore, this research used data of student who have graduated by processing them using data mining and getting information in the form of students' graduation prediction. The method used in this research is decision tree method built with C4.5 algorithm with error-based pruning algorithm for decision tree pruning. The criteria that will be used are gender; regional origin; GPA; and TOEFL. In its implementation, the C4.5 algorithm can be used to predict students' graduation with an average 63.93% of precision, an average 60.73% of recall, and an average 60.52% of accuracy. After the decision tree pruned using the error-based pruning method, better results are obtained. Pruned tree with 0.4 confidence value gives result an average 70.70% of precision, an average 50.65% of recall, and an average 61.57% of accuracy. While the pruned tree with 0.25 confidence value gives result an average 73.77% of precision, an average 48.84% of recall, and an average 62.44% of accuracy.
Keywords: Data Mining, Students’ Graduation, Decision Tree, C4.5, Error-based Pruning
633F18III | 633 F 18 | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain