Prediksi Jeda pada Ucapan Kalimat Bahasa Melayu Pontianak Menggunakan Informasi Parafrasa

Arif Bijaksana Putra Negara, Rudy Dwi Nyoto, Wega Marda Fitri

Abstract


Jeda dalam kalimat sangat penting karena jeda yang terjadi dapat memperjelas informasi dari makna suatu teks kalimat, maka dari itu penelitian ini akan melakukan prediksi jeda Bahasa Melayu Pontianak menggunakan informasi parafrasa yang  bertujuan utuk menghasilkan prediksi jeda pada Bahasa Melayu Pontianak untuk mendapatkan nilai akurasi yang tepat sehingga dapat digunakan pada sistem TTS. Rumusan masalah pada penelitian ini adalah bagaimana mengambil  informasi parafrasa dalam suatu teks kalimat yang digunakan untuk memprediksi jeda. Parafrasa yaitu ungkapan kembali maksud atau isi tulisan dengan menggunakan kata-kata sendiri. Informasi parafrasa diambil berdasarkan kata kunci dan tipe PoS. Hasil dai penelitian ini adalah kalimat yang telah terpenggal memberntuk frasa ucapan jeda. Pengujian dilakukan dengan menggunakan precision, recall, dan f-measure terhadap 500 kalimat untuk frasa singkat dan frasa panjang. Hasil dari pengujian frasa singkat tanpa PoS diperoleh nilai precision, recall, dan f-measure adalah  0.59, 0.58 dan  0.59 sedangkan frasa singkat menggunakan PoS bernilai 0.59, 0.58 dan 0.59 serta untuk frasa panjang tanpa PoS diperoleh nilai precision 0.86, recall  0.78, dan f-measure  0.82 sedangkan frasa panjang menggunakan PoS bernilai 0.84, 0,77, dan 0.80. Berdasarkan pengujian yang telah dilakukan, didapatkan hasil bahwa frasa panjang lebih tinggi dikarenakan frasa yang menghasilkan indeks jeda panjang menghasilkan jeda pasti pada setiap ucapan dibandingkan frasa singkat karena frasa yang menghasilkan indeks jeda singkat  akan menghasilkan ucapan yang berbeda pada setiap orang karena jeda singkat merupakan jeda tipis atau pendek.

 


Keywords


Informasi Parafrasa; Kata Kunci; Bahasa Melayu Pontianak

Full Text:

PDF

References


Badan Pusat Statistik 2011. Kewarganegaraan, Suku Bangsa, Agama, dan Bahasa Sehari-hari Penduduk Indonesia Hasil Sensus 2010.

Putra, Muhammad Dwi Etsa.2018. Pengaruh Metode Dictionary Lookup Pada Proses Cleaning Korpus Terhadap Akurasi Mesin Penerjemah Statistik Bahasa Indonesia-Bahasa Melayu Pontianak. Pontianak: Universitas Tanjungpura

Sabarti Akhadiah, Maidar G. Arsjad, dan Sakura H. Ridwan. 1996. Pembinaan Kemampuan Menulis Bahasa Indonesia. Jakarta: Erlangga.

Jurafsky, Daniel, dan James H. Martin. 2009. Speech and Language Processing: An Introduction to Natural Language Processing, Speech Recognition, and Computational Linguistics. Edisi kedua. Prentice-Hall

Kamaludin, Muhammad Iqbal.2014. Prediksi Jeda Dalam Ucapan Kalimat Bahasa Melayu Pontianak Menggunakan Metode Shallow Parsing. Pontianak: Universitas Tanjungpura.

Adriani M, Riza H. 2008. Research Report on Local Language Computing: Development of Indonesian Language Resources and Translation System. PAN Localization.

Marcus M.P, Marcinkiewicz M.A, Santoroni B.1993. Building a Large Annotated

Corpus of English: The Penn Treebank. Computational

Linguistics – Special issue on using large corpora: II.

Pisceldo F. Adriani M, Manurung R. 2009. Probabilistic Part of Speech Tagging for Bahasa Indonesia. Third International Wokshop on Malay and Indonesian Language

Engineering. Singapore

Chowdhury, G. 2003 Natural language processing. Annual Review of Information Science and Technology.

Nugraha, Adhitya Teguh.2014. Prediksi Jeda Dalam Ucapan Kalimat Bahasa Indonesia Dengan Hidden Markov Model. Pontianak: Universitas Tanjungpura.




DOI: https://doi.org/10.30743/infotekjar.v4i1.1248

Refbacks

  • There are currently no refbacks.


Copyright (c) 2019 Arif Bijaksana Putra Negara, Rudy Dwi Nyoto, Wega Marda Fitri

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

InfoTekJar (Jurnal Nasional Informatika dan Teknologi Jaringan)

Program Studi Teknik Informatika - Universitas Islam Sumatera Utara
Website : http://jurnal.uisu.ac.id/index.php/infotekjar/index
Email : infotekjar@ft.uisu.ac.id

InfoTekJar : Jurnal Nasional Informatika dan Teknologi Jaringan) is licensed under a Creative Commons Attribution 4.0 International License