Lexical Rule and Lexicon Effect for Part of Speech Tagging Bahasa Madura
DOI:
https://doi.org/10.30812/matrik.v18i1.332Keywords:
lexical rule, lexicon, bahasa madura, POS taggingAbstract
POS Tagging adalah dasar untuk pengembangan Text Processing suatu bahasa. Dalam penelitian ini kita meneliti pengaruh penggunaan lexicon dan perubahan morfologi kata dalam penentuan tagset yang tepat untuk suatu kata. Aturan dengan pendekatan morfologi kata seperti awalan, akhiran, dan sisipan biasa disebut sebagai lexical rule. Penelitian ini menerapkan lexical rule hasil learner dengan menggunakan algoritma Brill Tagger. Bahasa Madura adalah bahasa daerah yang digunakan di Pulau Madura dan beberapa pulau lainnya di Jawa Timur. Objek penelitian ini menggunakan Bahasa Madura yang memiliki banyak sekali variasi afiksasi dibandingkan dengan Bahasa Indonesia. Pada penelitian ini, lexicon selain digunakan untuk pencarian kata dasar Bahasa Madura juga digunakan sebagai salah satu tahap pemberian POS Tagging. Hasil ujicoba dengan menggunakan lexicon mencapai akurasi yaitu 86.61% sedangkan jika tidak menggunakan lexicon hanya mencapai akurasi 28.95 %. Dari sini dapat disimpulkan bahwa ternyata lexicon sangat berpengaruh terhadap POS Tagging.
Downloads
References
[2] A. Chaer, Morfologi Bahasa Indonesia (Pendekatan Proses). Jakarta: Rineka Cipta, 2008.
[3] A. Carstairs-McCarthy, “An introduction to English morphology: words and their structure,” Linguistics, p. 160, 2002. [4] E. Brill, “A simple rule-based part of speech tagger,” Proc. third Conf. Appl. Nat. Lang. Process. -, p. 152, 1992
[5] A. Chaer, Linguistik Umum. Jakarta: Rineka Cipta, 2007
[6] Chris Manning and H. Schütze, Foundation of Statistical Natural Language Processing. Cambridge: MIT Press Textbook on statistical and probabilistic methods in NLP., 1999
[7] V. C. M, J. Pragantha, and E. Purnamasari, “Implementasi Brill Tagger Untuk Memberikan,” Jakarta J. Tek. dan Ilmu Komput., pp. 301–315, 2012
[8] T. Chandrawati, “Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning,” p. 465, 2008
[9] E. R. Setyaningsih, “Penetapan Tagset dan Modifikasi Brill Tagger untuk Part-of Speech Bahasa Indonesia,” Sekolah Tinggi Teknik Surabaya, 2014
[10] A. et al Sofyan, No TitleTata Bahasa Bahasa Madura. Sidoarjo: Bahasa Surabaya, 2017.