Text
Relevance Feedback Menggunakan Algoritma Genetika Pada Sistem Temu Kembali Informasi Untuk Dokumen Berbahasa Indonesia
ABSTRAK
Perkembangan teknologi di Indonesia yang semakin pesat membuat jumlah informasi
yang tersedia meningkat serta beragam sehingga diperlukan sistem temu kembali informasi
untuk menemukan dokumen yang sesuai dengan kebutuhan informasi pengguna.
Permasalahan yang muncul pada sistem temu kembali informasi adalah kurangnya
kemampuan sistem dalam memberikan hasil pencarian berupa dokumen relevan. Relevance
feedback merupakan proses untuk meningkatkan jumlah dokumen relevan yang muncul
pada hasil pencarian. Salah satu teknik yang dapat digunakan dalam melakukan relevance
feedback adalah algoritma genetika. Tujuan dari penelitian ini yaitu untuk mengetahui
kinerja relevance feedback menggunakan algoritma genetika dibandingkan tanpa relevance
feedback pada sistem temu kembali informasi untuk dokumen berbahasa Indonesia. Metode
evaluasi yang digunakan adalah Mean Average Precision (MAP) dan recall dengan
pendekatan subjective evaluation dimana penentuan dokumen yang relevan dilakukan oleh
pengguna. Penelitian ini menggunakan dua dataset dokumen berbahasa Indonesia, yaitu
dataset abstrak skripsi dan dataset berita. Hasil dari eksperimen pada penelitian ini
menunjukkan peningkatan nilai MAP sebesar 18% untuk dataset abstrak skripsi dan sebesar
44% untuk dataset berita dibandingkan tanpa dilakukannya relevance feedback
menggunakan algoritma genetika. Peningkatan nilai recall pada posisi ke-10 sebesar 14%
untuk dataset abstrak skripsi dan sebesar 26% untuk dataset berita. Kinerja algoritma
genetika terbaik untuk dataset abstrak skripsi didapatkan dengan parameter ukuran populasi
sebesar 20, probabilitas crossover sebesar 0.7, dan probabilitas mutation sebesar 0.2,
sedangkan untuk dataset berita didapatkkan dengan parameter ukuran populasi sebesar 10,
probabilitas crossover sebesar 0.5, dan probabilitas mutation sebesar 0.2.
Kata kunci : Relevance Feedback, Algoritma Genetika, Sistem Temu Kembali Informasi,
Dokumen Berbahasa Indonesia
ABSTRACT
Technological developments in Indonesia are rapidly increased making the amount
of information available increases and varies so an information retrieval system is needed to
find documents that are in accordance with the user's information needs. The problem that
arises in information retrieval system is the lack of system ability to provide relevant
document as a search results. Relevance feedback is a process to increase the number of
relevant documents that appear in search results. One technique that can be used in relevance
feedback is genetic algorithms. Purpose of this research is to find out relevance feedback
performance using genetic algorithms compared to without relevance feedback on
information retrieval system for Indonesian language documents. Evaluation method used is
Mean Average Precision (MAP) and recall with a subjective evaluation approach where the
determination of relevant documents is carried out by user. This study uses two Indonesian
language document datasets, namely thesis abstract datasets and news datasets. Results of
experiment in this study showed an increase in MAP value of 18% for thesis abstract datasets
and 44% for news datasets compared without relevance of feedback using genetic
algorithms. Increased recall value at 10th position by 14% for thesis abstract datasets and by
26% for news datasets. Best genetic algorithm performance for thesis abstract dataset is
obtained with a population size parameter of 20, a crossover probability of 0.7, and a
mutation probability of 0.2, whereas for a news dataset it is obtained with a population size
10, crossover probability 0.5, and mutation probability 0.2.
Keyword : Relevance Feedback, Genetic Algorithm, Information Retrieval System,
Indonesian Document
663F18IV | 663 F 18 | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain