Analisa Recall dan Precision Menggunakan VSM pada Kasus Text Mining

Warnia Nengsih

Abstract


Text Mining merupakan proses pengolahan untuk mengetahui pola-pola yang tidak terstruktur. Pola yang tidak terstruktur tersebut bisa ditemukan pada objek seperti jurnal, artikel, novel, buku dan sejenisnya. Implementasi fitur yang sering digunakan adalah teknik pencarian file atau dokumen yang  memenuhi unsur efektif dan efisiensi. Pencarian file atau dokumen sangat ditentukan oleh ketepatan dan kesesuaian dokumen yang dipanggil dengan kata kunci yang digunakan. Semakin  tepat kata kunci yang diinputkan semakin relevan dengan hasil yang ditampilkan. Agar hasil pencarian sesuai dengan keyword yang dimasukkan maka dibutuhkan  algoritma pencarian Vector Space Model. Vector Space Model merupakan algoritma yang digunakan  untuk melihat relevansi antara kata kunci dengan hasil pencarian yang ditampilkan. Dari hasil perhitungan recall dan precission, sistem dapat melakukan pengembalian dokumen  sesuai dengan kata kunci yang dimasukkan pengguna. Dimana nilai recall yang diperoleh sebesar 100%. Pencarian menggunakan metode Vector Space Model  dapat memberikan hasil yang maksimal dalam melakukan pencarian dokumen.


Keywords


Vector Space Model, Preprocessing, recall, precission,,text mining

Full Text:

PDF

References


Dao, S. D. & Marian, R. 2011. Optimisation Of Precedence-Constrained Production Sequencing And Scheduling Using Genetic Algorithms. Proceedings Of The International Multi Conference Of Engineers And Computer Scientists, 16-18 March, Hong Kong.

Gen, M. & Cheng, R. 2000. Genetic Algorithms And Engineering Optimization. John Wiley & Sons, Inc., New York.

Liliana, D. Y. & Mahmudy, W. F. 2006. Penerapan Algoritma Genetika Pada Otomatisasi Penjadwalan Kuliah. Laporan Penelitian Dpp/Spp. Fmipa Universitas Brawijaya, Malang.

Marian, R. M., Luong, L. & Dao, S. D. 2012. Hybrid Genetic Algorithm Optimisation Of Distribution Networks—A Comparative Study. Dalam: Ao, S. I., Castillo, O. & Huang, X. (Editor.) Intelligent Control And Innovative Computing. Springer, Us.

Phanden, R. K., Jain, A. & Verma, R. 2013. An Approach For Integration Of Process Planning And Scheduling. International Journal Of Computer Integrated Manufacturing, 26(4), 284-302.

Ridok, A. 2014. Peringkasan Dokumen Bahasa Indonesia Berbasis Non-Negative Matrix Factorization. Jurnal Teknologi Informasi Dan Ilmu Komputer (Jtiik), 1(1), 39-44.

Tala, F. Z. 2003. A Study Of Stemming Effects On Information Retrieval In Bahasa Indonesia. Ph.D. Thesis. Universiteit Van Amsterdam.

Wang, L. 2007. Process Planning And Scheduling For Distributed Manufacturing. Springer, London.

Wibawa, A. P., Nafalski, A. & Mahmudy, W. F. 2013. Javanese `Speech Levels Machine Translation: Improved Parallel Text Alignment Based On Impossible Pair Limitation. Ieee International Conference On Computational Intelligence And Cybernetics, 3-4 December, Yogyakarta, Indonesia. 16-20.

Liliana, D. Y. & Mahmudy, W. F. 2006. Penerapan Algoritma Genetika Pada Otomatisasi Penjadwalan Kuliah. Laporan Penelitian Dpp/Spp. Fmipa Universitas Brawijaya, Malang.




DOI: https://doi.org/10.30743/infotekjar.v5i1.2663

Refbacks

  • There are currently no refbacks.


Copyright (c) 2020 Warnia Nengsih

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

InfoTekJar (Jurnal Nasional Informatika dan Teknologi Jaringan)

Program Studi Teknik Informatika - Universitas Islam Sumatera Utara
Website : http://jurnal.uisu.ac.id/index.php/infotekjar/index
Email : infotekjar@ft.uisu.ac.id

InfoTekJar : Jurnal Nasional Informatika dan Teknologi Jaringan) is licensed under a Creative Commons Attribution 4.0 International License