Text
Analisis Sentimen Menggunakan Latent Dirichlet Allocation Dan Visualisasi Topic Polarity Wordcloud 005.133
ABSTRAK
Bagi sebuah institusi pendidikan, pendapat peserta didik memiliki peran penting untuk
kemajuan institusi pendidikan tersebut. Analisis sentimen dapat membantu dalam
mengekstrasi pendapat yang berasal dari sebuah dokumen, komentar, review produk, dan
data-data lainnya sehingga akan lebih mudah dalam melakukan pemantauan. Salah satu
metode untuk melakukan analisis sentimen adalah Latent Dirichlet Allocation (LDA) yang
mampu digunakan untuk mengekstraksi topik dari kumpulan dokumen komentar, dimana
topik tersebut direpresentasikan sebagai kemunculan kata-kata dengan probabilitas topik
yang berbeda. Oleh karena itu diperlukan representasi data dalam bentuk visual yang
mudah dipahami daripada teks dan tabel. Salah satu bentuk visualisasi data adalah
wordcloud yang memberikan gambaran visual frekuensi kemunculan kata. Pada penelitian
ini akan dilakukan analisis sentimen terhadap komentar mahasiswa pada suatu universitas,
dalam hal ini Universitas Diponegoro, menggunakan LDA dengan visualisasi topic
polarity wordcloud. Adapun tujuan khusus penelitian ini adalah untuk mengetahui
pengaruh perubahan nilai alpha, beta, jumlah topik terhadap nilai perplexity dan waktu
eksekusi (detik), mengetahui kombinasi parameter terbaik untuk analisis sentimen, dan
mengetahui persebaran topik terkait komentar mahasiswa Universitas Diponegoro. Pada
penelitian ini dilakukan proses LDA untuk melakukan ekstraksi topik dengan
menggunakan 690 data komentar. Kemudian memvisualisasikan hasil ekstraksi topik ke
dalam bentuk topic polarity wordcloud dengan sentimen positif, negatif atau netral. Hasil
penelitian menunjukkan nilai alpha, beta, dan jumlah topik yang semakin besar
menghasilkan nilai perplexity yang kecil. Nilai alpha dan beta yang semakin besar
menghasilkan waktu eksekusi yang relatif lebih cepat. Sedangkan kenaikan jumlah topik
menghasilkan waktu eksekusi yang lebih lama. Kemudian kombinasi parameter terbaik
adalah parameter dengan nilai alpha 0.1, beta 0.1, jumlah topik 9 dengan nilai threshold
0.0000001. Kombinasi parameter menghasilkan 3 topik sebagai sentimen positif dan 6
topik sebagai sentimen negatif dengan topik yang dibahas adalah masalah fasilitas,
birokrasi, tempat parkir, dan ukt.
Kata kunci : Latent Dirichlet Allocation, analisis sentimen, wordcloud
ABSTRACT
For an educational institution, the opinions of learners have an important role for the
progress of the educational institutions. Sentiment analysis can help in extracting the
opinions from some documents, comments, product reviews, and other data that will be
easier to do the monitoring. One method for doing sentiment analysis is Latent Dirichlet
Allocation (LDA), which can be used to extract the topic of documents, where the topic is
represented as the appearance of the words with different topic probability. Therefore, we
need data representation in a visual form that is easier to understand than text and tables.
One form of data visualization is wordcloud that provides a visual representation of words
frequency. This research will perform sentiment analysis from a student's comments to an
university, in this case the University of Diponegoro, using LDA and topic polarity
wordcloud visualization. This study aims to determine the effect of changes of alpha, beta,
the number of topics against the value of perplexity and execution time (seconds),
determine the best combination of parameters for sentiment analysis, and determine the
distribution of related topics from Diponegoro University student’s comments. In this
research performed LDA process for extracting topic using 690 dataset and then visualized
to topic polarity wordcloud with sentiment positive, negative or neutral. The results show
that the increase value of alpha, beta, and the number of topics produce smaller value of
perplexity. Greater value of alpha and beta produce a faster execution time. But greater
value of the number of topics produce slower execution time. The best parameter
combination is parameter with value of alpha 0.1, value of beta 0.1, number of topics 9,
threshold 0.0000001. This best parameter combination produces 3 topics as positive
sentimen and 6 topics as negative sentimen with the topics are talking about facilities,
bureaucratic, parking lots, and tuition.
Keywords : Latent Dirichlet Allocation, sentiment analysis, wordcloud
481F17II | 481 F 17 | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain