Text
Implementasi Algoritma Textrank Pada Text Summarization (Studi Kasus Review Produk Handphone)
ABSTRAK
Teknologi internet mendorong munculnya Web 2.0 yang mengakibatkan peningkatan
jumlah User Generated Content (UGC) di jaringan internet. Online product review
merupakan salah satu bentuk dari UGC. Banyaknya ketersediaan review akan memakan
waktu untuk membaca dan membandingkan review produk-produk yang ada, sehingga
diperlukan sebuah teknik agar online product review dapat dibaca secara cepat tanpa
menghilangkan informasi penting yang terkandung di dalamnya. Salah satu teknik yang
dapat dilakukan adalah dengan melakukan peringkasan teks. Teknik peringkasan teks
menghasilkan versi teks yang disederhanakan. Secara umum, peringkasan teks dapat dibagi
menjadi dua jenis yaitu ringkasan ekstraktif dan abstraktif. Penelitian ini menggunakan
ringkasan ekstraktif. Salah satu komponen penting dalam proses mendapatkan ringkasan
ekstraktif adalah ekstraksi kalimat. Dalam penelitian ini algoritma yang digunakan untuk
ekstraksi kalimat adalah TextRank. Tujuan dari penelitian ini adalah mengetahui kinerja
algoritma TextRank dengan data berupa review produk handphone dengan
mengimplementasikan pada kondisi data yang berbeda-beda berdasarkan ada tidaknya
stopword dan typo. Kondisi data tersebut yang digunakan untuk merumuskan skenario
pengujian. Pengujian dilakukan dengan menghitung nilai Rouge-1 yang membandingkan
hasil ringkasan sistem dan pakar. Pakar yang terlibat dalam penelitian ini berjumlah 2
orang. Pakar 1 adalah orang dengan bidang keahlian bahasa Indonesia dan Pakar 2
merupakan seseorang yang memiliki pengetahuan dan pemahaman tentang handphone
dengan berbagai jenis dan karakteristiknya. Dari hasil pengujian yang didapatkan, Pakar 1
mendapatkan hasil terbaik untuk skenario 2 yang kondisi datanya ada typo dan tidak ada
stopword dengan nilai rata-rata Rouge-1 sebesar 42.29% dan Pakar 2 mendapatkan hasil
terbaik untuk skenario 3 yang kondisi datanya tidak ada typo dan ada stopword dengan
nilai rata-rata Rouge-1 sebesar 46.71%. Dari nilai rata-rata Rouge-1 yang didapatkan
menunjukkan bahwa algoritma TextRank tidak mampu menghasilkan ringkasan yang baik
untuk data yang diringkas berupa review.
Kata kunci : Peringkas teks, TextRank, review produk, stopword, typo, Rouge-1
ABSTRACT
Internet technology is driving the emergence of Web 2.0 which increase the number of user
generated content (UGC) on the network. An example of UGC is an online product review.
The large availability of reviews will take long time to read and compare existing product
reviews, so we need a technique that online product review can be read quickly without
losing of its important information. The technique that can be done is the text summarizing
technique. Text summarization techniques produce simplified versions of texts. In general,
text summarization can be divided into two types, namely extractive and abstractive
summaries. This research used extractive summaries. One important component in the
process of getting extractive summaries is sentence extraction. In this study the algorithm
used for sentence extraction is TextRank. The purpose of this study is to determine the
performance of the TextRank algorithm with data of mobile product review by
implementing different data conditions based on the presence or absence of stopwords and
typos. These data conditions are used to formulate the test scenario. Testing is done by
calculating the value of Rouge-1 which compares the summary of system and expert.
Expert who involved in this study are 2. Expert 1 is a person with expertise in Indonesian
and Expert 2 is someone who has the knowledge and understanding of mobile phones with
various types and characteristics. From the test results obtained, Expert 1 gets the best
results for scenario 2 where data conditions are there is typo and no stopword with an
average value of Rouge-1 of 42.29% and Expert 2 gets the best results for scenario 3
where data conditions are no typo and there is stopword with an average value of Rouge-1
is 46.71%. The results show that the TextRank algorithm to summarize the review is not
able to produce a good summary.
Key words : Text summarization, TextRank, product review, stopword, typo, Rouge-1
900F20IV | 900 F 20-iv | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain