Text
Sentiment Analysis Pada Tripadvisor Menggunakan Latent Dirichlet Allocation (Lda) Untuk Mengetahui Profil Pariwisata (Studi Kasus : Ubud, Bali, Indonesia) 005.133 PUT s
ABSTRAK
Industri pariwisata merupakan salah satu sektor penghasil devisa yang memiliki potensi
pengembangan yang cukup besar di Indonesia. meskipun begitu sangat disayangkan bahwa
Indonesia sebagai salah satu negara terbesar di Asia Tenggara dinilai gagal dalam
mengelola potensi pariwisatanya selama ini. Terbukti dari nilai kunjungan wisman
(wisatawan mancanegara) di Indonesia yang masih minim dengan 8,8 juta pengunjung
pada tahun 2013, jika dibandingkan dengan negara lainnya di Asia Tenggara, seperti
halnya Malaysia dengan 18 juta pengunjung dan Singapore 20 juta pengunjung. Maka
sudah sepantasnya para pelaku pariwisata di Indonesia melakukan introspeksi untuk
perencanaan manajemen dan pengelolaan yang lebih matang dan terarah dalam menjawab
tantangan dan menangkap peluang pariwisata di Indonesia. Introspeksi yang dilakukan tak
terlepas dari tanggapan dan sentimen positif maupun negatif wisman terhadap pariwisata di
Indonesia. Tanggapan atau sentimen yang diberikan wisman banyak terdapat pada lamanlaman terkait kepariwisataan seperti pada laman TripAdvisor yang merupakan salah satu
laman penyedia jasa kepariwisataan dengan jumlah kontributor lebih dari 75 juta orang
dari berbagai kewarganegaraan. Dimana sampai saat ini salah satu teknologi yang
dilakukan untuk menjawab permasalahan ini hanya bersumber pada data statistik yang
bersifat subjektif yang dilakukan dengan teknik voting atau grading secara random.
Penelitian ini bertujuan untuk menjawab permasalahan tersebut melalui sentiment analysis.
Sentiment analysis dengan probabilistic topic model menggunakan metode Latent
Dirichlet Allocation (LDA) merupakan teknologi baru yang dapat diimplementasikan
untuk membaca sentimentasi publik terkait sentimen positif dan negatif terhadap topik
tertentu. Sehingga penggalian informasi juga menjadi lebih objektif dan berimbang.
Penelitian yang diusulkan merupakan sentiment analysis menggunakan metode LDA
sebagai proses inferensi dengan collapsed gibbs sampler untuk komentar pada laman
TripAdvisor. Hasil penelitian menunjukkan nilai akurasi yang cukup baik sebesar 60%
untuk akurasi rata-rata tertinggi dan 80% untuk akurasi tertinggi per fold dengan nilai
hiperparameter β 0,1, α 0,1 untuk 55 topik pada jumlah iterasi 100.000. Berdasarkan hasil
penelitian dapat disimpulkan bahwa nilai hiperparameter α menunjukkan kecenderungan
nilai yang berbanding terbalik dengan besar jumlah topik dan jumlah iterasi.
Kata kunci: Latent Dirichlet Allocation, Pariwisata, Probabilistic Topic Model, Sentiment
Analysis, TripAdvisor
ABSTRACT
The tourism industry is one of foreign exchange sector, which has considerable potential
development in Indonesia. Compared to other Southeast Asia countries such as Malaysia
with 18 million tourists and Singapore 20 million tourists, Indonesia which is the largest
Southeast Asia’s country have failed to attract higher tourist numbers compared to its
regional peers. Indonesia only managed to attract 8,8 million foreign tourists in 2013.
Apart from the infrastructure problems, marketing and managing also form of obstacles for
tourism growth. An evaluation and self-analysis should be done by stakeholder to respond
toward this problem and capture opportunities that related to tourism satisfaction from
tourists review. Recently, one of technology to answer this problem only relying on the
subjective of statistical data which collected by voting or grading from user randomly. So
the result is still not to be accountable. This research aims to answer these problems
through sentiment analysis. Sentiment analysis with probabilistic topic model using Latent
Dirichlet Allocation (LDA) method is a new approach that appropriate to be applied for
reading general tendency toward certain topics. Resulting more objective and balanced
information. Thus, we proposed sentiment analysis using LDA method as an inference
process with collapsed gibbs sampler for TripAdvisor’s review. As the results of this study
showed quite good accuracy score of 60% for the average of the highest accuracy and 80%
for the highest accuracy per fold with a value of hiperparameter α-0,1, β-0,1 and 55 for
number of topics in 100.000 as number of iteration. Through these results we can
concluded that the value of hiperparameter α indicates inversely value to the number of
topics and the number of iterations in the case of sentiment analysis in the following
research.
Keywords: Latent Dirichlet Allocation, Tourism, Probabilistic Topic Model, Sentiment
Analysis, TripAdvisor
460F17I | 460 F 17 | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain