Lexical Rule and Lexicon Effect for Part of Speech Tagging Bahasa Madura
DOI:
https://doi.org/10.30812/matrik.v18i1.332Keywords:
lexical rule, lexicon, bahasa madura, POS taggingAbstract
POS Tagging adalah dasar untuk pengembangan Text Processing suatu bahasa. Dalam penelitian ini kita meneliti pengaruh penggunaan lexicon dan perubahan morfologi kata dalam penentuan tagset yang tepat untuk suatu kata. Aturan dengan pendekatan morfologi kata seperti awalan, akhiran, dan sisipan biasa disebut sebagai lexical rule. Penelitian ini menerapkan lexical rule hasil learner dengan menggunakan algoritma Brill Tagger. Bahasa Madura adalah bahasa daerah yang digunakan di Pulau Madura dan beberapa pulau lainnya di Jawa Timur. Objek penelitian ini menggunakan Bahasa Madura yang memiliki banyak sekali variasi afiksasi dibandingkan dengan Bahasa Indonesia. Pada penelitian ini, lexicon selain digunakan untuk pencarian kata dasar Bahasa Madura juga digunakan sebagai salah satu tahap pemberian POS Tagging. Hasil ujicoba dengan menggunakan lexicon mencapai akurasi yaitu 86.61% sedangkan jika tidak menggunakan lexicon hanya mencapai akurasi 28.95 %. Dari sini dapat disimpulkan bahwa ternyata lexicon sangat berpengaruh terhadap POS Tagging.
Downloads
References
[2] A. Chaer, Morfologi Bahasa Indonesia (Pendekatan Proses). Jakarta: Rineka Cipta, 2008.
[3] A. Carstairs-McCarthy, “An introduction to English morphology: words and their structure,†Linguistics, p. 160, 2002. [4] E. Brill, “A simple rule-based part of speech tagger,†Proc. third Conf. Appl. Nat. Lang. Process. -, p. 152, 1992
[5] A. Chaer, Linguistik Umum. Jakarta: Rineka Cipta, 2007
[6] Chris Manning and H. Schütze, Foundation of Statistical Natural Language Processing. Cambridge: MIT Press Textbook on statistical and probabilistic methods in NLP., 1999
[7] V. C. M, J. Pragantha, and E. Purnamasari, “Implementasi Brill Tagger Untuk Memberikan,†Jakarta J. Tek. dan Ilmu Komput., pp. 301–315, 2012
[8] T. Chandrawati, “Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning,†p. 465, 2008
[9] E. R. Setyaningsih, “Penetapan Tagset dan Modifikasi Brill Tagger untuk Part-of Speech Bahasa Indonesia,†Sekolah Tinggi Teknik Surabaya, 2014
[10] A. et al Sofyan, No TitleTata Bahasa Bahasa Madura. Sidoarjo: Bahasa Surabaya, 2017.
Additional Files
Published
Issue
Section
How to Cite
Similar Articles
- Herlina Jayadianti, Budi Santosa, Judanti Cahyaning, Shoffan Saifullah, Rafal Drezewski, Essay auto-scoring using N-Gram and Jaro Winkler based Indonesian Typos , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 2 (2023)
- Imam Riadi, Herman Herman, Fitriah Fitriah, Suprihatin Suprihatin, Optimizing Inventory with Frequent Pattern Growth Algorithm for Small and Medium Enterprises , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 23 No. 1 (2023)
- Prihandoko Prihandoko, Deny Jollyta, Gusrianty Gusrianty, Muhammad Siddik, Johan Johan, Cluster Validity for Optimizing Classification Model: Davies Bouldin Index – Random Forest Algorithm , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 24 No. 1 (2024)
- Arwin Datumaya Wahyudi Sumari, Fatiha Eros Perdana, Dwi Nugraheny, Sandra Lovrencic, Improving the User Interface and Experience of a Student PortalThrough the Eight Golden Rules , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 24 No. 3 (2025)
- Magdalena Ariance Ineke Pakereng, Alz Danny Wowor, Yos Richard Beeh, Felix David, Erwien Christianto, Vincent Exelcio Susanto, Claudio Canavaro, Square Transposition Method with Adaptive Key Flexibility and Strong Diffusion Performance , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 24 No. 3 (2025)
- Elly Mufida, Martini Martini, Ady Hermawan, Perancangan Apilkasi Parenting Penguatan Perilaku Positif Anak oleh Orang Tua Berbasis Android , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 17 No. 2 (2018)
- Annisa Nurul Puteri, Arizal Arizal, Andini Dani Achmad, Feature Selection Correlation-Based pada Prediksi Nasabah Bank Telemarketing untuk Deposito , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 20 No. 2 (2021)
- Maria adelvin Londa, Yohanes Ardianus Wee, Melky Radja, Implementasi Sistem Informasi Monitoring Disposisi Surat Masuk dan Surat Keluar Berbasis Website , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 2 (2022)
- lili Tanti, Syahril Efendi, Maya Silvi Lydia, Herman Mawengkang, Model Dynamic Facility Location in Post-Disaster Areas in Uncertainty , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 1 (2022)
- Rofik Rofik, Roshan Aland Hakim, Jumanto Unjung, Budi Prasetiyo, Much Aziz Muslim, Optimization of SVM and Gradient Boosting Models Using GridSearchCV in Detecting Fake Job Postings , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 23 No. 2 (2024)
You may also start an advanced similarity search for this article.