Text
Hierarchical Sentence Sentiment Analysis Untuk Ulasan Hotel Pada Website Traveloka Menggunakan Metode Naïve Bayes Classifier
ABSTRAK
Traveloka menyediakan ruang bagi penggunanya untuk menuliskan ulasan tentang layanan
hotel yang disewakan. Ulasan-ulasan ini sangat berguna bagi pengelola hotel dalam
mengetahui tingkat kepuasan pelanggan. Sentiment analysis merupakan sarana yang dapat
digunakan untuk menganalisis ulasan tersebut, sehingga dapat diketahui apakah ulasan
tersebut mengandung opini atau tidak, yang kemudian tingkat kepuasan pelanggan akan
diukur berdasarkan jumlah sentimen (positif, negatif) yang terkandung dari opini yang
didapatkan. Penelitian ini menggunakan metode Naïve Bayes classifier dalam melakukan
hierarchical sentence sentiment analysis pada ulasan hotel dari website Traveloka. Selain
itu, penelitian ini menggunakan dua jenis pembobotan kata dalam ekstraksi fitur, yaitu raw
term frequency dan TF-IDF. Sentence sentiment analysis menggunakan flat classification
untuk ulasan hotel pada website Traveloka dilakukan untuk membandingkan hasilnya
dengan hierarchical sentence sentiment analysis pada ulasan hotel dari website Traveloka.
Hasil penelitian sentiment analysis terhadap ulasan hotel ini menunjukkan bahwa
penggunaan hierarchical classification dalam sentiment analysis lebih baik dibandingkan
dengan menggunakan flat classification. Hasil perhitungan rata-rata nilai f-measure untuk
model flat classification menghasilkan nilai sebesar 0,7518, sedangkan untuk model
hierarchical classification menghasilkan nilai sebesar 0,7748. Berdasarkan hasil tersebut,
menunjukkan bahwa penggunaan hierarchical classification pada sentiment analysis
meningkatkan kinerja rata-rata model klasifikasi sebesar 0,023. Penggunaan fitur raw term
frequency pada flat classification memberikan nilai f-measure yang lebih tinggi daripada
penggunaan fitur TF-IDF dengan selisih 0,039. Rata-rata nilai f-measure flat classification
dengan fitur raw term frequency menghasilkan nilai sebesar 0,7518 sedangkan untuk fitur
TF-IDF sebesar 0,7123.
Kata Kunci : Traveloka, ulasan, sentiment analysis, hierarchical classification, Naïve
Bayes classifier
ABSTRACT
Traveloka provides space for its users to write reviews about their hotel reservation services.
These reviews are very useful for the hotel manager in knowing the level of customer
satisfaction. Sentiment analysis is a tool that can be used to analyze the reviews, so it can
known wether the reviews contain opinion or not, then the level of customer satisfaction will
be measured based on the number of sentiments (positive or negative) contained in the
opinion. In this research, the Naïve Bayes classifier method was used to perform hierarchical
sentence sentiment analysis on the hotel reviews obtained from Traveloka. In addition, this
research used two types of term weighting schemes for feature extraction, raw term
frequency and TF-IDF. Sentence sentiment analysis using flat classification on hotel reviews
from Traveloka were conducted to compare the results with the hierarchical sentence
sentiment analysis on hotel reviews from Traveloka. The results of this research about
sentiment analysis on hotel reviews indicated that the use of hierarchical classification in
sentiment analysis was better than flat classification. The average f-measure value for flat
classification model was 0.7518, while the average f-measure value for hierarchical
classification model was 0.7748. Based on these results, showed that the use of hierarchical
classification in sentiment analysis improved the average performance of the classification
model by 0.023. The use of the raw term frequency feature extraction in flat classification
provided a higher f-measure value than the use of the TF-IDF feature extraction, with a
margin of 0.039. The average value of f-measure for flat classification using raw term
frequency feature extraction was 0.7518 while for TF-IDF feature extraction was 0.7123.
Keywords : Traveloka, reviews, sentiment analysis, hierarchical classification, Naïve Bayes
classifier
643F18IV | 643 F 18 | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain