Text
Klasifikasi Dokumen Artikel Ilmiah Menggunakan Metode Improved K-Nearest Neighbor
ABSTRAK
Artikel ilmiah adalah tulisan yang berisi laporan sistematis mengenai hasil kajian atau hasil penelitian.
Artikel ilmiah dapat diakses dengan mudah dan cepat melalui berbagai media, baik cetak maupun
digital. Meskipun begitu, sering ditemui kesulitan dalam mengakses artikel yang tepat sesuai
kebutuhan. Salah satu solusi yang dapat ditawarkan adalah menggunakan klasifikasi dokumen.
Klasifikasi dokumen memiliki beragam metode, dan salah satu yang digunakan adalah dengan metode
Improved K-Nearest Neighbor. Improved K-Nearest Neighbor memodifikasi K-Nearest Neighbor
biasa dengan menyesuaikan nilai k terhadap jumlah data yang ada. Data penelitian berupa artikel
ilmiah di bidang informatika yang terbagi ke dalam 6 topik, yaitu basis data, data mining, jaringan
syaraf tiruan, jaringan komputer, rekayasa perangkat lunak, dan robotika. Data dikumpulkan dari
beragam situs penyedia e-journal dengan total jumlah 300 data. Abstrak dari data-data tersebut yang
disimpan dalam satu file bertipe csv. Klasifikasi menerapkan stratified split untuk membagi data
sebesar 80% untuk data latih dan 20% untuk data uji dengan split sebanyak 5. Pengukuran akurasi
klasifikasi dilihat menggunakan confusion matrix dan menghitung precision, recall, dan f1-measure.
Hasil klasifikasi menunjukkan hasil f1-measure terbaik dengan k = 25 pada split ke-1.
Kata kunci: Artikel ilmiah, klasifikasi dokumen, Improved K-Nearest Neighbor.
ABSTRACT
Scientific article is a writing which content is a systematic report about a review or a research result.
Scientific article can be accessed with ease and quickly through various medias, whether it’s printed
or digitally. Despite that, problems often occur when trying to access articles which suited the needs
of the searcher. One solution that can be offered is by document classification. Document classification
can be done through different methods, and one of them is by using Improved K-Nearest Neighbor
method. Improved K-Nearest Neighbor modifies the basic K-Nearest Neighbor by adjusting the k
value to the amount of data. The data used in the research are scientific articles in informatics subjects
which are divided into 6 topics. Those topics are database, data mining, artificial neural network,
computer network, software engineering, and robotics. Classifier applies stratified split to split the data
into 80% for training and 20% for testing resulting in 5 different splits. Measurement of accuracy for
the classifier uses confusion matrix and calculating precision, recall, and f1-measure. Classifier shows
the best f1-measure score with k = 25 in the first split.
Keywords: Scientific article, document classification, Improved K-Nearest Neighbor.
877F20IV | 877 F 20-iv | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain