Text
Analisis Klasifikasi Opini Tweet Pada Media Sosial Twitter Menggunakan Latent Dirichlet Allocation (LDA)
ABSTRAK
Media sosial menunjukkan perkembangan yang sangat besar pada masa ini. Salah satu
platform media sosial yang banyak digunakan di Indonesia adalah Twitter. Penggunaan
Twitter yang relatif mudah menjadi pilihan sebagian besar orang dalam menggunakan
media sosial ini. Dengan banyaknya pengguna Twitter, semakin banyak informasi yang
dihasilkan, tidak jarang pula adanya tindak kejahatan yang dilakukan. Aktivitas kriminal
atau tindak kejahatan yang sering dilakukan melalui Twitter pada umumnya berupa cyberbullying dan cyber-harassment. Penelitian ini bertujuan untuk mengembangkan aplikasi
yang dapat mengklasifikasikan opini tweet sebagai neutral opinion atau crime indicated
opinion dengan menggunakan sentiment analysis. Opini tweet yang akan dikategorikan
crime indicated opinion yang akan diambil dalam penelitian ini adalah tweet atau pesan
pada Twitter yang mengandung unsur cyberbulliying atau cyberharassment. Sentiment
analysis dengan probabilistic topic model menggunakan metode Latent Dirichlet
Allocation (LDA) merupakan metode baru yang dapat diimplementasikan dalam
permasalahan analisis klasifikasi opini tweet. Hasil penelitian menunjukkan nilai akurasi
yang cukup baik sebesar 66% untuk akurasi rata-rata tertinggi dengan nilai hiperparameter
β 0,1, α 0,00001 untuk 2 topik pada jumlah iterasi 10000. Berdasarkan hasil akurasi
tertinggi, dilakukan perhitungan sensitivitas dan spesifitas untuk setiap fold untuk
menentukan fold terbaik, didapatkan hasil akurasi fold tertinggi sebesar 77%.
Kata kunci: Latent Dirichlet Allocation, Probabilistic Topic Model, Sentiment Analysis,
Analisis Klasifikasi Opini Tweet, Twitter
ABSTRACT
Nowadays, social media showed a great improvement. Twitter is one of social media
platforms which is widely used in Indonesia. Simplicity in Twitter usage is the key factor
in seizing the wide variety market. Along with the great user statisic, there is malicious
activity being performed in twitter. The commonly performed malicious activities are
cyber-bullying and cyber harrasment. This research aims to develop applications that can
classify tweets opinion as a neutral opinion or crime indicated using sentiment analysis.
The tweets that are going to be classified as crime indicated opinion contain cyber-bullying
and cyber harrasment content. Sentiment analysis with probabilistic topic model using
Latent Dirichlet Allocation(LDA) is a new method which can be implemented in tweet
opinion classification analysis. As the result of this study showed a good accuracy score of
66% for average of the highest accuracy with hyperparameter α 0,00001 and β 0,1 for 2
topics at 10000 iteration. Through these result, in order to decide the best fold, a sensitivity
and specificity values were calculated over the fold that has highest accuracy. Based on the
calculation of sensitivity and specificity for each fold, it was resulted in fold 5 with the
highest sensitivity value about 77%.
Keywords: Latent Dirichlet Allocation, Probabilistic Topic Model, Sentiment Analysis,
Tweet Opinion Classification Analysis, Twitter
487F17II | 005.133 MIN a | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain