• 024-7474754 (current)
  • fsm@undip.ac.id
    ``````
  • Visitor
  • Unduh
  • Pilih Bahasa :
    Bahasa Arab Bahasa Bengal Bahasa Brazil Portugis Bahasa Inggris Bahasa Spanyol Bahasa Jerman Bahasa Indonesia Bahasa Jepang Bahasa Melayu Bahasa Persia Bahasa Rusia Bahasa Thailand Bahasa Turki Bahasa Urdu

Perpustakaan Fakultas Sains Matematika

Universitas Diponegoro

  • Berita
  • Profil
    Profil Singkat Struktur Organisasi Sambutan Kepala Perpustakaan Pustakawan Kontak
  • E-Resources
    Indonesiana
    • Batavia Digital
    • Candi di Indonesia
    • Dokumentasi Perfilman Indonesia
    • Dokumentasi Sastra Indonesia
    • Kepustakaan Presiden RI
    • Keraton Nusantara
    • Pernaskahan Nusantara
    • Pusaka Indonesia
    • Kepustakaan Tokoh Pahlawan P. Diponegoro
    • Kepustakaan Tokoh Pahlawan Jenderal Soedirman
    • Kepustakaan Tokoh Perfilman
    • Khasanah Pustaka Nusantara
    • Perpuspedia
    • Literasi Kanker Indonesia
    Pencarian
    • Indonesia One Search
    • DOAJ
    • Google Scholar
    • Scopus
    • JDIH
    • Bibliografi Nasional Indonesia
    • Katalog Induk Nasional
    • KINK Kemenkes
    • R2KN Kemenkes
    Alat & Sumber Belajar
    • Mendeley
    • Perpustakaan Digital
    • TED
    • Google Experiments
    • Sumber Belajar Kemdikbud
    • Ebook
    Pustaka Kami
    • Jurnal Nasional
    • Jurnal Internasional
    • Jurnal Dilanggan
    • Prosiding
    • Modul Bahan Ajar
  • Panduan
    Perpustakaan Layanan FAQ Penulisan Penelusuran Informasi Akses Internet Koleksi
  • Layanan
    Daftar Anggota Online Sirkulasi Referensi dan Serial Bebas Pinjam Kartu Sakti
  • Area Anggota

Pencarian berdasarkan :

SEMUA Pengarang Subjek ISBN/ISSN Pencarian Spesifik

Pencarian terakhir:

{{tmpObj[k].text}}
No image available for this title

Text

Klasifikasi Dokumen Berita Bahasa Indonesia Menggunakan Metode Latent Dirichlet Allocation (LDA) Dan Word2vec

Samuel Adi Prasetyo - Nama Orang;

ABSTRAK

Perkembangan yang pesat dalam informasi digital telah menyebabkan semakin meningkat
pula volume informasi yang berbentuk teks seperti dokumen berita. Dokumen berita yang
muncul diunggah di internet sangatlah banyak dalam rentang waktu yang cepat. Oleh karena
itu diperlukan adanya pengorganisasian dokumen berita. Salah satu cara yang dapat
dilakukan dengan cepat dan dapat dipahami oleh para penerima informasi adalah dengan
melakukan klasifikasi dokumen berita berdasarkan topiknya. Penelitian yang diusulkan yaitu
penerapan klasifikasi dokumen untuk berita Bahasa Indonesia menggunakan metode Latent
Dirichlet Allocation (LDA) yang akan digabungkan dengan metode word embedding
Word2Vec dan juga k-means clustering sebagai metode pembantu melakukan klusterisasi
vektor kata. Dokumen berita Bahasa Indonesia akan diklasifikasikan ke dalam lima topik
yaitu olahraga, teknologi, ekonomi, politik, dan sosial dimana kelima kategori tersebut
merupakan kategori berita utama yang sering diakses oleh pengguna. Hasil penelitian
dengan jumlah data pelatihan sebanyak 1000 berita (200 berita per kategori) menunjukkan
bahwa metode gabungan LDA dan Word2Vec sudah cukup baik dalam melakukan
klasifikasi dengan nilai akurasi tertinggi sebesar 73,4%. Meski demikian akurasi lebih baik
didapatkan oleh metode LDA murni tanpa Word2Vec dengan nilai akurasi sebesar 87,5%
sehingga memiliki selisih akurasi sebesar 14,1%. Kedua perbandingan metode tersebut
sama-sama diperoleh pada kombinasi parameter alpha 0,1; beta 0,01; dan jumlah topik
sebanyak 300 topik.
Kata Kunci: Text Mining, Klasifikasi Berita Bahasa Indonesia, Latent Dirichlet Allocation,
Word2Vec, K-means Clustering

ABSTRACT

The rapid development of digital information has led to an over-increasing volume of textual
information such as news documents. News documents that uploaded to internet are very
massive in the short of time. Therefore it is necessary to organize news documents. One way
that can be done quickly and comprehensible by the recipients of information is to classify
news documents based on their topic. The proposed research is the application of document
classification for Indonesian news using Latent Dirichlet Allocation (LDA) method which
will be combined with Word2Vec word embedding method and also k-means clustering as
support method to cluster word’s vector. Indonesian news documents will be classified into
five topics: sports, technology, economics, politics, and social where the five categories are
major news categories that are often accessed by users. Result of the research with amount
of training data of 1000 news (200 news per category) showed that the combined method of
LDA and Word2Vec was good enough in classification with the highest accuracy value of
73,4%. However better accuracy is obtained by the pure LDA method without Word2Vec
with an accuracy value of 87,5%, thus having an accuracy difference of 14,1%. Both
comparison methods were similarly obtained on the parameter combination of alpha 0,1;
beta 0,01; and 300 number of topics.
Keywords: Text Mining, Indonesian News Document Classification, Latent Dirichlet
Allocation, Word2Vec, K-means Clustering


Ketersediaan
614F18III614 F 18Perpustakaan FSM Undip (Referensi)Tersedia
Informasi Detail
Judul Seri
ILMU KOMPUTER/INFORMATIKA
No. Panggil
614 F 18
Penerbit
: ., 2018
Deskripsi Fisik
-
Bahasa
Indonesia
ISBN/ISSN
-
Klasifikasi
2275
Tipe Isi
-
Tipe Media
-
Tipe Pembawa
-
Edisi
-
Subjek
-
Info Detail Spesifik
-
Pernyataan Tanggungjawab
Samuel Adi Prasetyo
Versi lain/terkait

Tidak tersedia versi lain

Lampiran Berkas
Komentar

Anda harus masuk sebelum memberikan komentar

Perpustakaan Fakultas Sains Matematika
  • Informasi
  • Layanan
  • Pustakawan
  • Area Anggota

Jl. Prof. Sudarto, Tembalang, Kec. Tembalang, Kota Semarang, Jawa Tengah 50275

Tentang Kami

As a complete Library Management System, SLiMS (Senayan Library Management System) has many features that will help libraries and librarians to do their job easily and quickly. Follow this link to show some features provided by SLiMS.

Cari

masukkan satu atau lebih kata kunci dari judul, pengarang, atau subjek

Donasi untuk SLiMS Kontribusi untuk SLiMS?

© 2026 — Perpustakaan Fakultas Sains Matematika

Ditenagai oleh SLiMS
Pilih subjek yang menarik bagi Anda
  • Karya Umum
  • Filsafat
  • Agama
  • Ilmu-ilmu Sosial
  • Bahasa
  • Ilmu-ilmu Murni
  • Ilmu-ilmu Terapan
  • Kesenian, Hiburan, dan Olahraga
  • Kesusastraan
  • Geografi dan Sejarah
Icons made by Freepik from www.flaticon.com
Pencarian Spesifik