Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model

Luthfia Justisia Loebis; Arif Bijaksana Putra Negara; Novi Safriadi

doi:10.30743/infotekjar.v5i1.1986

Perbandingan Hasil Prediksi Durasi Fonem pada Bahasa Melayu Pontianak Berdasarkan Suku Kata Menggunakan Hidden Markov Model

Luthfia Justisia Loebis, Arif Bijaksana Putra Negara, Novi Safriadi

Abstract

TTS merupakan teknologi yang kerap dimanfaatkan untuk melestarikan eksistensi sebuah bahasa. Salah satu indikator terpenting untuk menghasilkan ucapan TTS yang baik adalah durasi fonem yang tepat. Durasi fonem dapat diprediksi menggunakan HMM. Prediksi dilakukan berdasarkan suku kata untuk memperkecil korpus yang digunakan. Dalam melakukan prediksi durasi fonem berdasarkan suku kata, korpus dikonversi ke dalam bentuk kode suku kata. Selain itu dilakukan reduksi variasi fonem ke dalam pengelompokkan 3 dan 5 state, agar HMM dapat bekerja dengan baik. Korpus bahasa Melayu Pontianak yang digunakan berisi 500 kalimat. Pengujian yang dilakukan adalah pengujian perbandingan durasi fonem dan kalimat, menggunakan dua model n-gram, bigram dan trigram. Pengujian didahului dengan penentuan nilai baseline, kemudian pengujian dengan k-fold cross validation untuk dua jenis pembagian data korpus, yaitu korpus latih berisi 80% korpus bahasa Melayu Pontianak dan korpus latih berisi 20% korpus bahasa Melayu Pontianak. Nilai baseline pada pengujian perbandingan durasi fonem untuk durasi 3 state dengan kedua model n-gram mendapatkan hasil 48%, sedangkan untuk durasi 5 state mendapatkan hasil 48% dan 69%. Nilai baseline pada pengujian perbandingan durasi kalimat untuk durasi 3 state dengan kedua model n-gram, mendapatkan hasil 21% dan 19%, sedangkan untuk durasi 5 state mendapatkan hasil 32% dan 17%. Dari hasil pengujian dengan k-fold cross validation diketahui bahwa dalam penggunaaan korpus latih 80%, hasil yang didapatkan mendekati nilai baseline, sedangkan hasil pada penggunaan korpus latih 20% menjauhi nilai baseline, namun perbedaan yang terjadi cukup tipis. Dari hasil keseluruhan pengujian dapat disimpulkan berdasarkan model perhitungan yang digunakan, trigram mendapatkan hasil yang lebih baik. Sedangkan berdasarkan state durasi yang digunakan, 3 state mendapatkan hasil lebih baik.

Keywords

Hidden Markov Model; Durasi Fonem; bahasa Melayu Pontianak

Full Text:

PDF

References

Krishna, N. S., Talukdar, P. P., Bali, K., dan Ramakrishnan, A. G. 2004. Duration Modeling for Hindi Text-To-Speech Sythesis System. Bangalore: Indian Institute of Science.

Na’im, Akhsan dan Hendry S. 2010. Kewarganegaraan, Suku Bangsa, Agama, dan Bahasa Sehari-hari Penduduk Indonesia, Hasil Sensus Penduduk 2010. Jakarta: Badan Pusat Statistik.

Novianti, E. 2011. Menilik Nasib Bahasa Melayu Pontianak. Semarang: Universitas Diponegoro.

Benesty, J., M. Sondhi, M., dan Yiteng, H. 2008. Springer Handbook of Speech Processing. Berlin: Springer-Verlag.

Nugraha, T. A. 2014. Prediksi Jeda dalam Ucapan Kalimat Bahasa Indonesia dengan Hidden Markov Model. Pontianak: Program Studi Informatika, Fakultas Teknik, Universitas Tanjungpura.

Prasetyo Budi, M. E. 2011. Teori Dasar Hidden Markov Model. Bandung: Program Studi Sistem dan Teknologi Informasi, Institut Teknologi Bandung.

Alwi, H., Dardjowidjojo, S., Lapoliwa, H., dan M. Moeliono, A. 2000. Tata bahasa baku bahasa Indonesia (Edisi Ketiga). Jakarta: Balai Pustaka

Erick, P. D. P. dan Hartati, U. 2016. Perbedaan Bahasa Melayu Pontianak Kalimantan Barat dengan Bahasa Indonesia Standar.Yogyakarta: FKIP Universitas Sarjanwiyata Tamansiswa Yogyakarta.

Ratnawati, N. K. M. dan Anak, A. N. B. J. D. 2015. Fonem Suprasegmental / Ciri-ciri Prosodi. Singaraja: Jurusan Pendidikan Bahasa dan Sanstra Indonesia, Fakultas Bahasa dan Senis, Universitas Pendidikan Ganesha.

Herho, S. H. S. 2017. Tutorial Pemrograman Python 2 Untuk Pemula. Bandung: WPCL Press.

Muniyati, E. F. 2019. Prediksi Jeda falam Ucapan Kalimat Bahasa Melayu Pontianak Menggunakan Hidden Markov Model Berbasis Part of Speech. Pontianak: Jurusan Informatika, Fakultas Teknik, Universitas Tanjungpura.

Wicaksono, A. F. dan Ayu, P. 2010. HMM Based Part-Of-Speech Tagger for Bahasa Indonesia. Bandung: Teknik Informatika, Institut Teknologi Bandung.

Numrotul, H. 2019. Analisis Implementasi Model Durasi Klatt pada Bahasa Melayu Pontianak Menggunakan Diphone Bahasa Indonesia. Pontianak: Jurusan Informatika, Fakultas Teknik, Universitas Tanjungpura.

Lestari, S. 2019. Analisis State Durasi Fonem Bahasa Melayu Pontianak Pada Hidden Markov Model. Pontianak: Jurusan Informatika, Fakultas Teknik, Universitas Tanjungpura.

DOI: https://doi.org/10.30743/infotekjar.v5i1.1986

Refbacks

There are currently no refbacks.

This work is licensed under a Creative Commons Attribution 4.0 International License.

Username
Password
Remember me