Text
Analisis Analisis Sentimen Online Review Produk Tokopedia dengan Menggunakan Metode Random Forest
ABSTRAK
Tokopedia merupakan salah satu e-commerce terpopuler di Indonesia yang menawarkan berbagai jenis produk. Setiap produk memiliki fitur review yang penting untuk dijadikan evaluasi bagi penjual dan sebagai pertimbangan untuk membeli produk bagi calon pembeli. Analisis sentimen pada review pelanggan terhadap suatu produk di Tokopedia menjadi pilihan untuk melihat respon pembeli terhadap pelayanan dan kualitas produk yang dibeli di marketplace tersebut. Respon tersebut diklasifikasikan menjadi sentimen positif dan sentimen negatif menggunakan metode Random Forest dengan evaluasi model 10-fold cross-validation. Pelabelan data dilakukan secara otomatis dengan menghitung skor sentimen menggunakan kamus lexicon. Hasil pelabelan dapat divisualisasikan dengan menggunakan diagram batang dan word cloud pada setiap kelas sentimen untuk menemukan informasi yang dianggap penting dan paling sering dibicarakan. Hasil pengujian menunjukkan bahwa tingkat akurasi dari metode Random Forest dengan parameter nilai mtry = 73 dan ntree = 50 adalah sebesar 97,38% sehingga dapat disimpulkan metode Random Forest mampu memprediksi data review produk Tokopedia dengan bagus. Semakin besar nilai akurasi, maka semakin baik performansi model klasifikasi tersebut.
Kata Kunci: Review Produk, Tokopedia, Random Forest, Text mining, Word Cloud
ABSTRACT
Tokopedia is one of the most popular e-commerce sites in Indonesia that offers consumer products from various categories. In each product section, a review feature is offered. This review feature became essential in evaluating the sellers and become one consideration for customers in making purchase consideration. Sentiment analysis of Tokopedia product reviews may provide the opportunity to look upon the response of Tokopedia customers to product quality and sellers’ hospitality. In evaluating the model, the reviews were grouped as: “positive sentiment” and “negative sentiment” using the Random Forest method and 10-fold cross-validation. Data labelling was carried out automatically by calculating the sentiment score using Lexicon-Based. Visualization of the labelling results was then done using a bar graph and a word cloud on each class of sentiment in order to look up for information that is considered important and most discussed. The test results showed that the accuracy of the Random Forest Method with parameter mtry = 73 and ntree = 50 is 97.38% which leads to the conclusion that the Random Forest Method could well predict the product reviews of Tokopedia. The greater the accuracy, the better performance of the classification model.
Keywords: Product Reviews, Tokopedia, Random Forest, Text mining, Word Cloud
0822E20IV | 822 E 20-iv | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain