Lexical Rule and Lexicon Effect for Part of Speech Tagging Bahasa Madura
DOI:
https://doi.org/10.30812/matrik.v18i1.332Keywords:
lexical rule, lexicon, bahasa madura, POS taggingAbstract
POS Tagging adalah dasar untuk pengembangan Text Processing suatu bahasa. Dalam penelitian ini kita meneliti pengaruh penggunaan lexicon dan perubahan morfologi kata dalam penentuan tagset yang tepat untuk suatu kata. Aturan dengan pendekatan morfologi kata seperti awalan, akhiran, dan sisipan biasa disebut sebagai lexical rule. Penelitian ini menerapkan lexical rule hasil learner dengan menggunakan algoritma Brill Tagger. Bahasa Madura adalah bahasa daerah yang digunakan di Pulau Madura dan beberapa pulau lainnya di Jawa Timur. Objek penelitian ini menggunakan Bahasa Madura yang memiliki banyak sekali variasi afiksasi dibandingkan dengan Bahasa Indonesia. Pada penelitian ini, lexicon selain digunakan untuk pencarian kata dasar Bahasa Madura juga digunakan sebagai salah satu tahap pemberian POS Tagging. Hasil ujicoba dengan menggunakan lexicon mencapai akurasi yaitu 86.61% sedangkan jika tidak menggunakan lexicon hanya mencapai akurasi 28.95 %. Dari sini dapat disimpulkan bahwa ternyata lexicon sangat berpengaruh terhadap POS Tagging.
Downloads
References
[2] A. Chaer, Morfologi Bahasa Indonesia (Pendekatan Proses). Jakarta: Rineka Cipta, 2008.
[3] A. Carstairs-McCarthy, “An introduction to English morphology: words and their structure,†Linguistics, p. 160, 2002. [4] E. Brill, “A simple rule-based part of speech tagger,†Proc. third Conf. Appl. Nat. Lang. Process. -, p. 152, 1992
[5] A. Chaer, Linguistik Umum. Jakarta: Rineka Cipta, 2007
[6] Chris Manning and H. Schütze, Foundation of Statistical Natural Language Processing. Cambridge: MIT Press Textbook on statistical and probabilistic methods in NLP., 1999
[7] V. C. M, J. Pragantha, and E. Purnamasari, “Implementasi Brill Tagger Untuk Memberikan,†Jakarta J. Tek. dan Ilmu Komput., pp. 301–315, 2012
[8] T. Chandrawati, “Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning,†p. 465, 2008
[9] E. R. Setyaningsih, “Penetapan Tagset dan Modifikasi Brill Tagger untuk Part-of Speech Bahasa Indonesia,†Sekolah Tinggi Teknik Surabaya, 2014
[10] A. et al Sofyan, No TitleTata Bahasa Bahasa Madura. Sidoarjo: Bahasa Surabaya, 2017.
Additional Files
Published
Issue
Section
How to Cite
Similar Articles
- Nur Fitrianingsih Hasan, Muhammad Salis Amin Iribaram, Digitalisasi Kamus Bahasa Daerah Papua Menggunakan Metode Rapid Application Development , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 3 (2022)
- Anjar Wanto, Ni Luh Wiwik Sri Rahayu Ginantra, Surya Hendraputra, Ika Okta Kirana, Abdi Rahim Damanik, Optimization of Performance Traditional Back-propagation with Cyclical Rule for Forecasting Model , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 1 (2022)
- Ach. Khozaimi, Sigit Susanto Putro, Mujibur Rohman, Pengembangan Aplikasi Managemen Tugas Skripsi (Studi Kasus : Program Studi Teknik Informatika Universitas Trunojoyo Madura) , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 18 No. 2 (2019)
- Firman Noor Hasan, Achmad Sufyan Aziz, Yos Nofendri, Utilization of Data Mining on MSMEs using FP-Growth Algorithm for Menu Recommendations , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 2 (2023)
- Anthony Anggrawan, Mayadi Mayadi, Christofer Satria, Menentukan Akurasi Tata Letak Barang dengan Menggunakan Algoritma Apriori dan Algoritma FP-Growth , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 1 (2021)
- Imam Ahmad Ashari, Anggit Wirasto, Deny Nugroho Triwibowo, Purwono Purwono, Implementasi Market Basket Analysis dengan Algoritma Apriori untuk Analisis Pendapatan Usaha Retail , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 3 (2022)
- Imamah Imamah, Akhmad Siddiqi, Penerapan Teorema Bayes untuk Mendiagnosa Penyakit Telinga Hidung Tenggorokan (THT) , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 18 No. 2 (2019)
- Herlina Jayadianti, Budi Santosa, Judanti Cahyaning, Shoffan Saifullah, Rafal Drezewski, Essay auto-scoring using N-Gram and Jaro Winkler based Indonesian Typos , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 2 (2023)
- Imam Riadi, Herman Herman, Fitriah Fitriah, Suprihatin Suprihatin, Optimizing Inventory with Frequent Pattern Growth Algorithm for Small and Medium Enterprises , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 23 No. 1 (2023)
- Prihandoko Prihandoko, Deny Jollyta, Gusrianty Gusrianty, Muhammad Siddik, Johan Johan, Cluster Validity for Optimizing Classification Model: Davies Bouldin Index – Random Forest Algorithm , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 24 No. 1 (2024)
You may also start an advanced similarity search for this article.