Text
Penentuan Tren Topik Tugas Akhir Menggunakan Metode Latent Dirichlet Allocation (LDA) dengan Visualisasi Streamgraph
ABSTRAK
Tugas akhir adalah salah satu karya ilmiah yang ditulis oleh mahasiswa pada akhir
masa studinya yang merupakan salah satu syarat kelulusan untuk seorang mahasiswa. Karya
ilmiah tersebut disusun menurut kaidah keilmuan dan ditulis berdasarkan kaidah Bahasa
Indonesia di bawah bimbingan dan arahan dosen pembimbing. Mahasiswa sering
kebingungan dalam pemilihan topik yang akan dikerjakan sehingga menambah waktu
pengerjaan tugas akhirnya. Mengetahui tren topik akan memudahkan untuk mencari topik
yang memiliki banyak referensi. Pada penelitian ini, diusulkan menggunakan metode Latent
Dirichlet Allocation (LDA) untuk melakukan pengelompokan (clustering) terhadap abstrak
dari tugas akhir dalam bahasa Indonesia. LDA akan melakukan clustering terhadap abstrak
tugas akhir berdasarkan tingkat kemiripan kata-kata yang ada pada abstrak tersebut ke dalam
sejumlah topik. LDA akan menghasilkan dua buah keluaran yaitu, topic proportion dan
probabilitas kata-topik. Visualisasi diperlukan untuk dapat melihat lebih jelas hasil
clustering abstrak tugas akhir. Salah satu visualisasi yang dapat menampilkan hasil
clustering adalah dalam bentuk Streamgraph. Tujuan dari penelitian ini adalah untuk
menghasilkan Streamgraph yang menampilkan hasil clustering dari abstrak tugas akhir
dengan menggunakan kombinasi parameter LDA yang terbaik. Kombinasi parameter
terbaik dalam kasus ini adalah dengan menggunakan nilai alpha 0,1, beta 0,1, dan threshold
0,001, sedangkan jumlah topik ditentukan berdasarkan kata unik di dalam kumpulan abstrak,
sehingga mendapatkan nilai sebesar 13. Kombinasi parameter tersebut menghasilkan nilai
perplexity sebesar 12,69. Hasil pengujian usability pada visualisasi memperoleh nilai untuk
indikator learnability 92 %, efficiency 95,38 %, memorability 90 %, errors 2 %, dan
satisfaction 90 %.
Kata Kunci : Latent Dirichlet Allocation, clustering, streamgraph, pengujian usability
ABSTRACT
The thesis is one of the scientific papers written by students at the end of their study period
which is one of the graduation requirements. The scientific paper is arranged according to
scientific rules and written based on Indonesian language rules under the guidance and
direction of the supervisor. However, in the final project, students are often finding difficulty
choosing their thesis topics and that will cause their thesis postponed. Knowing topic trends
will make it easy to find topics that have many references. In this research, we use the Latent
Dirichlet Allocation (LDA) method to cluster the abstract of the final assignment with a
proper Indonesian language. Based on the similarity of the thesis's abstract, LDA will cluster
the words into topics. The LDA would produce two outputs, topic proportion, and the
probability of word-topic. To see the results of the final clustering thesis's abstract, we
needed a visualization. One of the visualizations that could display the results of clustering
was Streamgraph. The purpose of this research was to produce a Streamgraph that displays
the results of clustering from the final assignment abstract using the best combination of
LDA parameters. The best combination of parameters in this case, was to use alpha 0,1, beta
0,1, and threshold 0,001, while the topics were determined based on the unique words of
abstracts resulting in the value is 13. The combination of parameters yielded a perplexity
value of 12,69. The usability testing resulted in visualization for learnability was 92%,
efficiency was 95,38%, memorability was 90%, errors was 2%, and satisfaction was 90%.
Keywords: Latent Dirichlet Allocation, clustering, streamgraph, usability testing.
723F19II | 723 F 19 | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain