Text
Metode Part-Of-Speech Latent Dirichlet Allocation (POSLDA) Dan Context-Free Grammar (CFG) Untuk Pembentukan Storytelling Twitter Sebagai Pendukung Informasi Jurnalis
ABSTRAK
Sosial media telah menjadi trend baru di masyarakat. Perkembangan pengguna sosial media di Indonesia mencapai 54.7% dari total populasi penduduk Indonesia pada tahun 2017. Salah satu sosial media yang banyak digunakan adalah Twitter. Twitter adalah microblogging yang memungkinkan pengguna saling bertukar pesan pendek hingga 280 karakter. Pada tahun 2016, jumlah pengguna aktif Twitter di Indonesia sebanyak 77% dari total jumlah pengguna Twitter di Indonesia. Jumlah pengguna aktif yang banyak menyebabkan jumlah dokumen tweet yang ada akan semakin bertambah. Hal ini bisa menjadi sumber pendukung informasi bagi jurnalis. Informasi yang berupa tweet update keseharian pengguna, peristiwa yang terjadi di sekitar, dan kejadian yang ramai dibicarakan dapat diolah menjadi bahan berita. Namun, pengumpulan bahan berita oleh jurnalis masih secara manual yaitu dengan mengumpulkan tweet yang berkaitan kemudian disusun menjadi storytelling. Storytelling adalah langkah merangkai koleksi tweet dalam menyusun berita. Pengumpulan bahan oleh jurnalis juga masih berkisar pada trending topics. Padahal bahan berita dapat dikumpulkan dari kumpulan tweet yang memiliki topik yang sama. Oleh sebab itu, diperlukan penelitian pembentukan storytelling dari kumpulan tweet berdasarkan topik yang sama. Pada penelitian ini, diusulkan menggunakan metode Part-of-Speech Latent Dirichlet Allocation (POSLDA) dan Context-Free Grammar (CFG) untuk pembentukan storytelling Twitter. Hasil keluaran POSLDA berupa probabilitas kata-topik, topic proportion, dan kelas syntactic sebagai masukan metode CFG dalam pembuatan grammar (tata bahasa) bahasa Indonesia untuk menyusun kalimat pada storytelling. Tujuan dari penelitian ini yaitu menerapkan metode POSLDA dan CFG untuk pembentukan storytelling Twitter sebagai pendukung informasi jurnalis. Pengujian sistem dilakukan 2 skenario yaitu menghitung perplexity pada POSLDA serta ROUGE-1 dan ROUGE-2 pada CFG. Pengujian pertama dilakukan untuk menentukan kombinasi parameter terbaik pada POSLDA. Hasil pengujian pertama didapatkan nilai perplexity terendah sebesar 6.31 dengan alpha 0.001, beta 0.001, dan jumlah topik 4. Pengujian kedua dilakukan untuk menentukan nilai beta topi terbaik. Hasil pengujian kedua didapatkan nilai ROUGE-1 terbesar bernilai 0.469847 pada saat beta topi 0.1 dan ROUGE-2 terbesar bernilai 0.149498 pada saat beta topi 0.001.
Kata kunci : storytelling, Twitter, Part-of-Speech Latent Dirichlet Allocation, Context-Free Grammar, perplexity, ROUGE-1, ROUGE-2
ABSTRACT
Social media has become a new trend in society. The development of social media users in Indonesia reached 54.7% of the Indonesia’s total population in 2017. One of the most widely used social media is Twitter. Twitter is microblogging which allows users to exchange short messages up to 280 characters. In 2016, the number of active users of Twitter in Indonesia was 77% of the total number of Twitter users in Indonesia. The large number of active users causes the number of existing tweet documents to increase. This can be a source of information support for journalists. The information in the form of tweets updates daily users, events that occur around, and events that are widely discussed can be processed into news material. However, the collection of news material by journalist is still manually by collecting related tweets and the compiled into storytelling. Storytelling is a step in arranging a collection of tweets in composing news. The collection of news material by journalists also still revolves around trending topics. Though news material can be collected from a collection of tweets that have the same topic. Therefore, it is necessary to research storytelling formation from a collection of tweets based on the same topic. In this research, it was proposed to use Part-of-Speech Latent Dirichlet Allocation (POSLDA) method and Context-Free Grammar (CFG) method for the formation of Twitter storytelling. POSLDA’s output is word-topic probability, topic proportion, and syntactic classes as input for the CFG method in making Indonesian grammar to compile sentences in storytelling. The purpose of this research is to apply the POSLDA and CFG methods for the formation of Twitter storytelling as a support for journalist information. System testing is carried out in 2 scenarios; calculating perplexity on POSLDA and ROUGE-1 & ROUGE-2 on CFG. The first test is done to determine the best parameter combination on POSLDA. The first test results obtained the lowest perplexity value of 6.31 with alpha 0.001, beta 0.001, and the number of topics 4. The second test was carried out to determine the beta cap value. The second test result shows that the highest ROUGE-1 value is 0.469847 when beta cap 0.1 and the highest ROUGE-2 is 0.149498 when beta cap 0.001.
Kata kunci : storytelling, Twitter, Part-of-Speech Latent Dirichlet Allocation, Context-Free Grammar, perplexity, ROUGE-1, ROUGE-2
699F19I | 699 F 19-i | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain