Text
Multimodal Sentiment Analysis Ulasan Produk Fashion Berbahasa Indonesia Menggunaka Image Captioning dan Didirectional Long Short Term Memory (Bi-LSTM)
Evolusi digital membawa industri fashion pada paradigma baru yaitu online shopping.
Masyarakat kini beralih ke online shopping lebih daripada sebelumnya. Oleh karena
keterbatasan yang diciptakan oleh transaksi tidak langsung pada online shopping, tugas
sentiment analysis pada domain fashion memiliki potensi tinggi untuk e-commerce maupun
marketplace seperti Shopee. Namun saat ini pembeli tidak hanya menulis teks ulasan
terhadap suatu produk, tetapi juga melampirkan gambar untuk memberi informasi tambahan.
Data dengan modalitas yang berbeda dapat saling melengkapi informasi. Oleh karena itu,
penelitian ini mengusulkan pendekatan multimodal sentiment analysis terhadap ulasan
produk fashion di Shopee dengan tujuan memprediksi sentimen dari data teks dan gambar
ulasan pembeli menggunakan image captioning untuk ekstraksi gambar dan Bidirectional
Long-Short Term Memory (Bi-LSTM) untuk tugas analisis sentimen. Data yang digunakan
adalah ulasan produk fashion sejumlah 3000 data. Metode Bi-LSTM diusulkan untuk
membangun model pada penelitian ini karena dapat memperbaiki metode classical machine
learning dan LSTM dalam hal mempertahankan urutan kata dan kemampuan menangkap
informasi dari kondisi masa lalu dan masa depan secara bersamaan. Model dengan empat
arsitektur berbeda dilatih dan diuji menggunakan data ulasan dengan dan tanpa caption
gambar berdasarkan target klasifikasinya yaitu 1 (positif), 0 (netral), dan -1 (negatif). Model
terbaik yang dilatih data ulasan dengan caption gambar memiliki pengaturan
hyperparameter units Bi-LSTM sebesar 160, dropout rate sebesar 0,2, dan learning rate
0,001 dengan micro average precision sebesar 0,50, recall 0,52, F1 score sebesar 0,50, dan
akurasi sebesar 0,52. Sedangkan model terbaik yang dilatih data ulasan tanpa caption
gambar memiliki pengaturan hyperparameter units Bi-LSTM sebesar 320, dropout rate
sebesar 0,2, dan learning rate 0,001 dengan micro average precision 0,51, recall 0,49, F1
score 0,50, dan akurasi sebesar 0,49. Hasil pengujian menunjukkan bahwa informasi dari
gambar berupa caption yang ditambahkan pada teks ulasan mampu meningkatkan kinerja
model dalam menganalisis sentiment meskipun kinerja model masih tergolong sedang.
Kata kunci : multimodal sentiment analysis, image captioning, Bi-LSTM, fashion, Shopee
| 1208F2023 | 1208 F 2023 | Perpustakaan FSM Undip | Tersedia |
Tidak tersedia versi lain