PENGEMBANGAN ALGORITMA SOUNDEX PADA SPELL CHECKER BAHASA INDONESIA

  • Ika Purwanti Ningrum
  • Muh. Yamin
  • Samsul Samsul
Keywords: spell checker, algoritma Soundex

Abstract

Spell checker merupakan salah satu fitur dalam aplikasi pengolah kata yang memberikan pemeriksaan ejaan pada sebuah dokumen serta memberikan kata saran untuk kata yang salah dalam penulisan ejaannya. Spelling checker umumnya diimplementasi berdasarkan bahasa Inggris, sedangkan spelling checker bahasa Indonesia masih belum umum digunakan. Penelitian ini dibuat sebuah aplikasi spell checker bahasa Indonesia, yaitu mengembangkan algoritma Soundex hasil dari penelitian yang pernah dilakukan oleh [6]. Pada penelitian tersebut, pengelompokan konsonan dilakukan berdasarkan aturan pemberian kode fonetis perhuruf pada algoritma Soundex, berjumlah 7 (0-6) kode. Namun pengelompokan konsonan yang dilakukan belum mendapatkan hasil yang maksimal untuk kata saran yang dihasilkan, terutama untuk kata dengan awalan yang sama seperti kata dengan imbuhan “mem” dan “ber”. Dalam penelitian ini, pengembangan algoritma Soundex dilakukan dengan membagi huruf-huruf pada kode 0 algoritma awal ke dalam dua kode yaitu kode 0 dan kode 8, serta kode 6 algoritma awal dibagi menjadi kode 6 dan kode 7. Hasil yang diperoleh, kata saran yang ditampilkan untuk kata dengan imbuhan “mem” dan “ber” jumlahnya lebih sedikit daripada menggunakan algoritma awal.

References

[1]D.R. Pyriana, Program Aplikasi Editor Kata Bahasa Indonesia Menggunakan Metode Approximate String Matching dengan Algoritma Levenshtein Distance berbasis Java, Malang: Universitas Brawijaya, 2012.
[2]I.A. Rosmana, Bahan Belajar Mandiri (BBM) 2: Cara Membentuk Fonem Bahasa Indonesia, 2004.
[3]N.M. Andriyani, I.M. Santiyasa and A. Muliantara, Implementasi Algoritma Levenshtein Distance dan Metode iEmpiris untuk Menampilkan Saran Perbaikan Kesalahan Pengetikan Dokumen Berbahasa Indonesia,Bali: Universitas Udayana, 2012.
[4]P. David, V. Darnes, A. Yuridiana, G. Helena and L. Nahun, The Soundex Phonetic Algorithm Revisited for SMS-based Information Retrieval *,Mexico: Benemerita Universidad Autonoma de Puebla, 2012.
[5]R.N., Dwitiyastuti, M. Adharul and A. Muhammad, Pengoreksi Kesalahan Ejaan Bahasa Indonesia Menggunakan Metode Levenshtein Distance, Malang: Universitas Brawijaya, 2013.
[6]S. Arifin, Peranan Substitusi n-grams dan Code Shift Pada Algoritma Soundex, Bogor: Institut Pertanian Bogor, 2006.
[7]T.A. Purnamasari, Membangun Aplikasi Pencocokan String Berdasarkan Penulisan dan Kemiripan Pengucapan, Yogyakarta: STMIK AMIKOM, 2012.
Published
2016-10-29
Section
Articles