Text
Klasifikasi Tingkat Kemacetan Lalu Lintas Berbasis Analisis Tweet Menggunakan Latent Dirichlet Allocation dan N-Gram 005.133 WIE k
ABSTRAK
Kemacetan lalu lintas merupakan permasalahan yang sering terjadi di kota-kota besar dan
memberi dampak negatif terhadap lingkungan disekitarnya. Twitter sebagai salah satu media
sosial, memungkinkan penggunanya untuk berbagi informasi mengenai kemacetan lalu
lintas disekitar mereka. Melihat permasalahan tersebut, pemanfaatan metode Latent
Dirichlet Allocation (LDA) dapat diterapkan dalam klasifikasi tweet. Klasifikasi tingkat
kemacetan lalu lintas berbasis analisis tweet dari pengguna Twitter bertujuan untuk
menginformasikan kepada orang lain agar mengetahui lokasi-lokasi kemacetan. Saat
identifikasi tweet, bigram akan diterapkan sebagai antisipasi penurunan kinerja klasifikasi
terhadap kelas tingkat kemacetan berupa kata majemuk seperti “Macet Total”. Penelitian ini
bertujuan untuk mengetahui kinerja klasifikasi tingkat kemacetan lalu lintas berbasis analisis
tweet menggunakan algoritma LDA dengan data masukan berupa representasi kata unigram,
bigram, dan mixed-gram (unigram + bigram). Kemudian, membandingkan kinerja
klasifikasi berdasarkan setiap representasi kata tersebut. Hasil penelitian menunjukkan
bahwa arsitektur terbaik dihasilkan oleh penerapan LDA sebagai data masukan berupa
representasi kata mixed-gram dengan kombinasi parameter nilai alpha 0.1, beta 0.001,
jumlah topik 10, dan jumlah iterasi 15000. Arsitektur tersebut, memiliki akurasi sebesar
100%. Oleh karena itu, untuk menghasilkan kinerja terbaik pembentukan model klasifikasi
tingkat kemacetan lalu lintas berbasis analisis tweet dengan cara menerapkan LDA sebagai
data masukan berupa mixed-gram.
Kata Kunci : Latent Dirichlet Allocation, unigram, bigram, mixed-gram, Twitter,
kemacetan lalu lintas
ABSTRACT
Traffic jam was main issue that often occurred in big cities and it gave a negative impact on
environment around it. Twitter as one of the social media, could made users to share
information about traffic jam nearby. Based on that issue, the utilization of Latent Dirichlet
Allocation (LDA) could be used on tweet classification. Analysis from classification on
traffic jam level based on tweet from twitter user were aimed for informing other people to
know the locations of the traffic jam. While tweet was identified, bigram will be applied as
an anticipation of declining performance on classification of traffic jam level class in form
of compound word like “Macet Total”. The aim for this research was to find out the
classification performance of traffic jam based on tweet analysis using LDA Algorithm with
input data in form of unigram, bigram, and mixed-gram (unigram + bigram) word
representation. Hereafter, the classification performance had been compared based on each
representation of the word. The result of this research showed that the best architecture was
produced by the application of LDA as an input data in form of mixed-gram word
representation with parameter combination value alpha 0.1, beta 0.001, number of topics 10,
and total amount iteration 15000. That architecture had 100% accuracy level. Therefore, in
order to produce the best performance of building classification model of traffic jam level
based on the analysis of the tweet, it should be performed by applying LDA to the data in
the form of mixed-gram.
Keywords : Latent Dirichlet Allocation, unigram, bigram, mixed-gram, Twitter, traffic jam
465F17I | 465 F 17 | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain