Text
Non-Factoid Answer Selection pada Science Question Answering System Berbahasa Indonesia dengan Menggunakan Model Long Short-Term Memory (LSTM)
ABSTRAK
Sains merupakan ilmu yang erat kaitannya dengan kehidupan sehari-hari, diri sendiri, dan alam sekitar. Sains penting untuk dikenal sebab memengaruhi banyak aspek kehidupan sehari-hari. Sumber informasi yang sangat luas menimbulkan adanya kesulitan dalam pencarian informasi secara cepat dan efisien, sehingga diperlukan sistem question answering. Tipe pertanyaan yang digunakan untuk sistem question answering dengan topik sains adalah tipe pertanyaan non-factoid. Penelitian ini menggunakan model Long Short-Term Memory (LSTM) untuk permasalahan answer selection pada sistem question answering. Parameter model LSTM yang diujicobakan adalah dropout, jumlah hidden unit, learning rate, margin, dan ukuran answer pool. Pada penelitian ini menggunakan 0,2; 0,5; 0,7 sebagai nilai dropout, 50 dan 100 sebagai jumlah hidden unit, nilai 0,05; 0,10; 0,15 sebagai learning rate dan margin, serta 20 dan 50 sebagai ukuran answer pool. Data yang digunakan dalam penelitian ini adalah 400 pasangan pertanyaan dan jawaban dengan topik sains yang diambil dari Wikipedia. Rata-rata tertinggi sebesar 90,06% untuk Mean Reciprocal Rank (MRR) dan 78,69% untuk Mean Average Precision (MAP) yang diperoleh dengan menggunakan dropout 0,2, jumlah hidden unit 50, learning rate 0,05, margin 0,1, dan ukuran answer pool 20.
Kata Kunci: pertanyaan non-factoid, science question answering system, answer selection, Long Short-Term Memory
ABSTRACT
Natural Science is a discipline that is closely related to everyday life, oneself, and the surrounding. Natural Science is important to be understood because it affects many aspects of daily necessity. An extremely broad source of information raised difficulties in finding information quickly and efficiently, so the question answering system is needed. The type of question used for system question answering in relation to science topics is a non-factoid question. This research uses the Long Short-Term Memory (LSTM) model for answer selection problems on the question answering system. The parameters of the LSTM model tested are dropouts, hidden unit numbers, learning rates, margins, and the size of the answer pool. This research uses 0,2; 0,5; 0,7 as a dropout value, 50 and 100 as the number of hidden units, 0,05; 0,10; 0,15 as a learning rate and margin, and 20 and 50 as a measure of the answer pool. Data used in this research are 400 pairs of questions and answers science topics taken from Wikipedia. The highest average is 90,06% for Mean Reciprocal Rank (MRR) and 78,69% for Mean Average Precision (MAP) obtained using dropout 0,2, the number of hidden units 50, learning rate 0,05, margin 0,1, and size of answer pool 20.
Keywords: non-factoid question, science question answering system, answer selection, Long Short-Term Memory
740F19III | 740 F 19-ii | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain