Lexical Rule and Lexicon Effect for Part of Speech Tagging Bahasa Madura

  • Nindian Puspa Dewi Universitas Madura
  • Ubaidi Ubaidi Universitas Madura
Keywords: lexical rule, lexicon, bahasa madura, POS tagging

Abstract

POS Tagging adalah dasar untuk pengembangan Text Processing suatu bahasa. Dalam penelitian ini kita meneliti pengaruh penggunaan lexicon dan perubahan morfologi kata dalam penentuan tagset yang tepat untuk suatu kata. Aturan dengan pendekatan morfologi kata seperti awalan, akhiran, dan sisipan biasa disebut sebagai lexical rule. Penelitian ini menerapkan lexical rule hasil learner dengan menggunakan algoritma Brill Tagger. Bahasa Madura adalah bahasa daerah yang digunakan di Pulau Madura dan beberapa pulau lainnya di Jawa Timur. Objek penelitian ini menggunakan Bahasa Madura yang memiliki banyak sekali variasi afiksasi dibandingkan dengan Bahasa Indonesia. Pada penelitian ini, lexicon selain digunakan untuk pencarian kata dasar Bahasa Madura juga digunakan sebagai salah satu tahap pemberian POS Tagging. Hasil ujicoba dengan menggunakan lexicon mencapai akurasi yaitu 86.61% sedangkan jika tidak menggunakan lexicon hanya mencapai akurasi 28.95 %. Dari sini dapat disimpulkan bahwa ternyata lexicon sangat berpengaruh terhadap POS Tagging.

Downloads

Download data is not yet available.

References

[1] A. Halim, Politik Bahasa Nasional 1 dan 2. Jakarta: Aneka Ilmu, 1976
[2] A. Chaer, Morfologi Bahasa Indonesia (Pendekatan Proses). Jakarta: Rineka Cipta, 2008.
[3] A. Carstairs-McCarthy, “An introduction to English morphology: words and their structure,” Linguistics, p. 160, 2002. [4] E. Brill, “A simple rule-based part of speech tagger,” Proc. third Conf. Appl. Nat. Lang. Process. -, p. 152, 1992
[5] A. Chaer, Linguistik Umum. Jakarta: Rineka Cipta, 2007
[6] Chris Manning and H. Schütze, Foundation of Statistical Natural Language Processing. Cambridge: MIT Press Textbook on statistical and probabilistic methods in NLP., 1999
[7] V. C. M, J. Pragantha, and E. Purnamasari, “Implementasi Brill Tagger Untuk Memberikan,” Jakarta J. Tek. dan Ilmu Komput., pp. 301–315, 2012
[8] T. Chandrawati, “Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning,” p. 465, 2008
[9] E. R. Setyaningsih, “Penetapan Tagset dan Modifikasi Brill Tagger untuk Part-of Speech Bahasa Indonesia,” Sekolah Tinggi Teknik Surabaya, 2014
[10] A. et al Sofyan, No TitleTata Bahasa Bahasa Madura. Sidoarjo: Bahasa Surabaya, 2017.
Published
2018-11-30
How to Cite
Dewi, N., & Ubaidi, U. (2018). Lexical Rule and Lexicon Effect for Part of Speech Tagging Bahasa Madura. MATRIK : Jurnal Manajemen, Teknik Informatika Dan Rekayasa Komputer, 18(1), 65-72. https://doi.org/https://doi.org/10.30812/matrik.v18i1.332
Section
Articles