Lexical Rule and Lexicon Effect for Part of Speech Tagging Bahasa Madura
DOI:
https://doi.org/10.30812/matrik.v18i1.332Keywords:
lexical rule, lexicon, bahasa madura, POS taggingAbstract
POS Tagging adalah dasar untuk pengembangan Text Processing suatu bahasa. Dalam penelitian ini kita meneliti pengaruh penggunaan lexicon dan perubahan morfologi kata dalam penentuan tagset yang tepat untuk suatu kata. Aturan dengan pendekatan morfologi kata seperti awalan, akhiran, dan sisipan biasa disebut sebagai lexical rule. Penelitian ini menerapkan lexical rule hasil learner dengan menggunakan algoritma Brill Tagger. Bahasa Madura adalah bahasa daerah yang digunakan di Pulau Madura dan beberapa pulau lainnya di Jawa Timur. Objek penelitian ini menggunakan Bahasa Madura yang memiliki banyak sekali variasi afiksasi dibandingkan dengan Bahasa Indonesia. Pada penelitian ini, lexicon selain digunakan untuk pencarian kata dasar Bahasa Madura juga digunakan sebagai salah satu tahap pemberian POS Tagging. Hasil ujicoba dengan menggunakan lexicon mencapai akurasi yaitu 86.61% sedangkan jika tidak menggunakan lexicon hanya mencapai akurasi 28.95 %. Dari sini dapat disimpulkan bahwa ternyata lexicon sangat berpengaruh terhadap POS Tagging.
Downloads
References
[2] A. Chaer, Morfologi Bahasa Indonesia (Pendekatan Proses). Jakarta: Rineka Cipta, 2008.
[3] A. Carstairs-McCarthy, “An introduction to English morphology: words and their structure,†Linguistics, p. 160, 2002. [4] E. Brill, “A simple rule-based part of speech tagger,†Proc. third Conf. Appl. Nat. Lang. Process. -, p. 152, 1992
[5] A. Chaer, Linguistik Umum. Jakarta: Rineka Cipta, 2007
[6] Chris Manning and H. Schütze, Foundation of Statistical Natural Language Processing. Cambridge: MIT Press Textbook on statistical and probabilistic methods in NLP., 1999
[7] V. C. M, J. Pragantha, and E. Purnamasari, “Implementasi Brill Tagger Untuk Memberikan,†Jakarta J. Tek. dan Ilmu Komput., pp. 301–315, 2012
[8] T. Chandrawati, “Pengembangan Part of Speech Tagger untuk Bahasa Indonesia Berdasarkan Metode Conditional Random Fields dan Transformation Based Learning,†p. 465, 2008
[9] E. R. Setyaningsih, “Penetapan Tagset dan Modifikasi Brill Tagger untuk Part-of Speech Bahasa Indonesia,†Sekolah Tinggi Teknik Surabaya, 2014
[10] A. et al Sofyan, No TitleTata Bahasa Bahasa Madura. Sidoarjo: Bahasa Surabaya, 2017.
Additional Files
Published
Issue
Section
How to Cite
Similar Articles
- Mudafiq Riyan Pratama, Muhammad Yunus, Sistem Deteksi Struktur Kalimat Bahasa Arab Menggunakan Algoritma Light Stemming , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 19 No. 1 (2019)
- Angga Rahagiyanto, Identifikasi Ekstraksi Fitur untuk Gerakan Tangan dalam Bahasa Isyarat (SIBI) Menggunakan Sensor MYO Armband , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 19 No. 1 (2019)
- Darmansah Darmansah, Zulya Suhendro, Sistem Informasi Sekolah Pada Sekolah Dasar Negeri 21 Sungai Geringging Kabupaten Padang Pariaman Berbasis Web , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 19 No. 2 (2020)
- Moch. Syahrir, Fatimatuzzahra Fatimatuzzahra, Association Rule Integrasi Pendekatan Metode Custom Hashing dan Data Partitioning untuk Mempercepat Proses Pencarian Frekuensi Item-set pada Algoritma Apriori , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 20 No. 1 (2020)
- Adjie Wahyudinata, Harya Bima Dirgantara, Pengembangan Gim Edukasi 2D Pemilahan Sampah Daur Ulang Berbasis Android , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 20 No. 1 (2020)
- Cindy Ameilia Suhendra, Marsani Asfi, Widya Jati Lestari, Ilwan Syafrinal, Sistem Peramalan Persediaan Sparepart Menggunakan Metode Weight Moving Average dan Reorder Point , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 20 No. 2 (2021)
- Ito Setiawan, Aldistya Riesta Sekarini, Retno Waluyo, Fiby Nur Afiana, Manajemen Risiko Sistem Informasi Menggunakan ISO 31000 dan Standar Pengendalian ISO/EIC 27001 di Tripio Purwokerto , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 20 No. 2 (2021)
- Anastasia Mude, Leonardus Benediktus Finansius Mando, Implementasi Keamanan Rumah Cerdas Menggunakan Internet of Things dan Biometric Sistem , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 1 (2021)
- Ellen Theresia Sihotang, Hariadi Yutanto, Tata Kelola Organisasi Mahasiswa Melalui Pengembangan Sistem Informasi , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 1 (2021)
- Muhammad Ibnu Choldun Rachmatullah, The Application of Repeated SMOTE for Multi Class Classification on Imbalanced Data , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 1 (2022)
You may also start an advanced similarity search for this article.