Text
Segmentasi Continuous Speech dengan Menggunakan Dynamic Thresholding dan Metode Blocking Block Area 005.133 ARA s
ABSTRAK
Pengenalan ucapan adalah suatu teknik yang memungkinkan komputer untuk dapat mengerti kata yang diucapkan oleh seseorang. Aplikasi pengenalan ucapan dibagi menjadi dua jenis berdasarkan input yang digunakan yaitu isolated word dan continuous speech. Pada pengenalan ucapan continuous speech dibutuhkan tahap segmentasi yang berfungsi untuk memecah kalimat yang diucapkan menjadi kata-kata yang dapat dikenali oleh komputer. Kualitas hasil segmentasi, dapat mempengaruhi hasil pengenalan yang dilakukan. Penelitian ini, meneliti mengenai threshold dinamis yang digunakan pada proses segmentasi continuous speech dan juga perbaikan metode Blocking Block Area pada domain Bahasa Indonesia. Pada penelitian ini, dilakukan pembandingan tiga algoritma (K-Means, Fuzzy C-Means, dan Otsu) untuk mencari threshold dinamis terbaik dan dilakukan penambahan proses morfologi serta kolom overlapping pada metode blocking block area sehingga diperoleh akurasi segmentasi terbaik. Berdasarkan hasil penelitian, algoritma Fuzzy C-Means memberikan hasil threshold terbaik dibandingkan dengan dua alogoritma lainnya. Secara keseluruhan dengan menggunakan algoritma Fuzzy C-Means, dan penambahan morfologi serta kolom overlaping, penelitian ini dapat meningkatkan akurasi segmentasi continuous speech Bahasa Indonesia dari 24% menjadi 90%.
Kata Kunci: Continuous Speech, Pengenalan Ucapan, Mel-Frequency Cepstral Coefficient, Hidden Markov Model, Segmentasi Ucapan
ABSTRACT
Speech Recognition is a technique that allows computer to understand words that had been spoken by a person. Based on the type of speech, speech recognition aplication was divided into two, they are isolated word and continuous speech. Segmentation are needed in continuous speech recognition, its function is to segment continuous speech into words that can be recognized by computer. The quality of segmentation results can influence the recognition results. This research, study about dynamic thresholding that used on segmentation process and also fixing Blocking Block Area method in Indonesia Domain speech recognition. In this research, researchers compare three algorithms (K-Means, Fuzzy C-Means, dan Otsu) to find best dynamic threshold and also adding morphological process and implementation of column overlapping concept on Blocking Block Area method to achieve the best segmentation accuracy. Based the result of this research, Fuzzy C-Means algorithm, gives best threshold result than the other two algorithms. Overall by using Fuzzy C-Means algorithm, adding mophological process, and column overlapping implementation, this research increases segmentation accuracy of Bahasa Indonesia continuous speech from 24% to 90%.
Key Word: Continuous Speech, Speech recognition, Mel-Frequency Cepstral Coefficient, Hidden Markov Model, Speech Segmentation.
462F17I | 462 F 17 | Perpustakaan FSM Undip (Referensi) | Tersedia |
Tidak tersedia versi lain