Text
Sentiment Analysis Ulasan Hotel Pada Website Traveloka Menggunakan Model Word2Vec dan Metode Convolutional Neural Network (CNN)
ABSTRAK
Traveloka adalah aplikasi yang menyediakan jasa pemesanan hotel dan mempunyai fitur ulasan. Banyaknya jumlah ulasan menyebabkan penyedia jasa kesulitan menganalisa ulasan tersebut, sehingga diperlukan suatu tools yang disebut dengan sentiment analysis. Penelitian ini menggunakan model Word2Vec dan metode Convolutional Neural Network (CNN) untuk menganalisa ulasan hotel pada website Traveloka. Parameter model Word2Vec yang diujicobakan adalah arsitektur model Word2Vec, metode evaluasi, dan dimensi. Adapun arsitektur model Word2Vec yang digunakan adalah model Skip-gram dan model Continous Bag Of Word (CBOW) dengan Hierarhical Softmax dan Negative Sampling sebagai metode evaluasi dan 3 dimensi yang berbeda yaitu 100, 200, dan 300. Parameter metode CNN yang diujicobakan adalah dropout, aktivasi konvolusi, aktivasi output, dan optimizer. Pada penelitian ini menggunakan 0,2; 0,5; 0,7 sebagai nilai dropout, ReLU dan Tanh sebagai aktivasi konvolusi, Sigmoid dan Softmax sebagai aktivasi output, dengan Stochastic Gradient Descent (SGD) dan Adam sebagai optimizer. Rata-rata akurasi tertinggi sebesar 98,16% yang diperoleh dengan menggunakan Skip-gram, Hierarchical Softmax, dimensi 100, dropout 0.2, ReLU sebagai aktivasi konvolusi, Softmax sebagai aktivasi output, dan Adam sebagai optimizer. Model dengan nilai rata-rata akurasi tertinggi digunakan sebagai dasar untuk mengklasifikasikan ulasan hotel pada website Traveloka ke dalam kelas positif atau negatif.
Kata Kunci : Traveloka, sentiment analysis, model Word2Vec, metode Convolutional Neural Network (CNN)
ABSTRACT
Traveloka is an application that provides hotel booking services and has features reviews. The large number of reviews causes service providers get difficulty analyzing these reviews, so a tool is needed that called sentiment analysis. This research used the Word2Vec model and the Convolutional Neural Network (CNN) method to analyze hotel reviews on the Traveloka website. The Word2Vec model parameters that being tested were the type of Word2Vec model architecture, evaluation method, and dimensions. As for the architecture of Word2Vec model that being used were Skip-gram model and Continuous Bag of Word (CBOW) model along with Hierarchical Softmax and Negative Sampling as the evaluation method and 3 different dimensions which are 100, 200, and 300 dimensions. The parameters of CNN method that being tested were dropout, convolution activation, output activation, and optimizer. This research used 0.2, 0.5, and 0.7 for the dropout values, ReLU and Tanh as the activation convolution, Sigmoid and Softmax as output activation along with Stochastic Gradient Descent (SGD) and Adam as optimizer. The highest average of accuracy was 98.16% which obtained by using Skip-gram model, Hierarchical Softmax, dimension 100, dropout of 0.2, ReLU as convolution activation, Softmax as output activation, and Adam as optimizer. The model with the highest average accuracy was used as the basis for classifying hotel reviews on the Traveloka website into positive or negative classes.
Keywords: Traveloka, sentiment analysis, Word2Vec model, Convolutional Neural Network (CNN) method
689F19I | 689 F 19-i | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain