Text
Analisis Sentimen Pemindahan Ibu Kota Negara Dengan Klasifikasi Naïve Bayes untuk Model Bernoulli dan Multinomial
ABSTRAK
Keputusan Presiden RI untuk memindahkan ibu kota ke Kalimantan Timur sudah disahkan pada tanggal 26 Agustus 2019. Pengesahan keputusan tersebut pasti menimbulkan respon yang beragam dari masyarakat. Text mining merupakan variasi dari data mining yang berusaha menemukan pola yang menarik dari sekumpulan data tekstual yang berjumlah besar. Analisis sentimen merupakan bagian dari text mining yang melibatkan pengambilan data opini, tanggapan, atau komentar. Analisis sentimen mengenai keputusan Presiden RI dapat menjadi pilihan untuk melihat respon masyarakat. Youtube menjadi media yang paling banyak diakses di Indonesia. Youtube dapat menjadi sumber data dengan melakukan pengumpulan komentar dari video yang diunggah oleh Kompas TV. Pengumpulan data tersebut dilakukan pada tanggal 15 Oktober 2019 dengan dipilih 1.500 komentar terbaru (26 Agustus 2019 – 12 Oktober 2019). Data yang terkumpul ditransformasi untuk mendapat fitur yang sesuai melalui data pre-processing. Data pre-processing meliputi case folding, remove mention, unescape HTML, remove numbers, remove punctuation, normalisasi kata, strip whitespace, stopwords removal, tokenizing dan stemming. Pelabelan kelas sentimen dilakukan dengan menggunakan teknik sentiment scoring. Jumlah komentar positif sebanyak 849, sementara komentar negatif sebanyak 651. Perbandingan data uji dan data latih, yaitu 80% : 20%. Analisis sentimen dilakukan dengan menggunakan klasifikasi Naïve Bayes model Bernoulli dan Multinomial. Model Bernoulli hanya memperhatikan kemunculan kata dalam dokumen, sedangkan model Multinomial memperhatikan frekuensi dari kata yang muncul. Hasil pengujian menunjukkan bahwa klasifikasi menggunakan Bernoulli Naïve Bayes mendapatkan tingkat sensitivity (recall) sebesar 93,45% dan Multinomial Naïve Bayes mendapatkan tingkat sensitivity (recall) sebesar 90,19%. Hal tersebut menunjukkan bahwa baik model Bernoulli maupun Multinomial memiliki performansi yang baik untuk penelitian ini.
Kata Kunci : Text Mining, Pemindahan Ibu Kota, Youtube, Bernoulli Naïve Bayes, Multinomial Naïve Bayes, Sensitivity (Recall).
ABSTRACT
Text mining is a variation on a field called data mining that tries to find interesting patterns from large databases. Indonesian President affirmed that the capital would be moved to East Kalimantan on August 26, 2019. That planning would received pros and cons from public. Sentiment analysis is part of text mining that typically involves taking data from opinion, comment or response. Sentiment analysis is the choice to do in this topic to get result about public’s opinion. As the most used social media in Indonesia, Youtube is able to be data source by crawling the comments on video uploaded by Kompas TV channel. Those comments were crawled on October, 15 2019 and selected 1500 latest comments (August 26 – October 12, 2019). The selected comments get transformed by using data pre-processing technique that involves case folding, removing mention, unescaping HTML, removing numbers, removing punctuation, text normalization, stripping whitespace, stopwords removal, tokenizing, and stemming. Labelling of sentiment class uses the sentiment scoring technique. The number of negative comments is 849, while the number of positive comments is 651. Ratio between training data and testing data is 80% : 20%. The classification method used to do sentiment analysis is Naive Bayes Classifier for Bernoulli and Multinomial model. Bernoulli model only uses occurrence information, whereas the multinomial model keeps track of multiple occurrences. The results show that Bernoulli Naïve Bayes has 93,45% level of sensitivity (recall) and Multinomial Naïve Bayes has 90,19% level of sensitivity (recall). It means that both Bernoulli and Multinomial have good result for this research.
Keywords : Text Mining, Relocation of Indonesia’a Capital, Youtube, Bernoulli Naïve Bayes, Multinomial Naïve Bayes, Sensitivity (Recall).
788E20III | 788 E 20iii | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain