PERBANDINGAN N-GRAM TECHNIQUE DAN RABIN KARP PADA APLIKASI PENDETEKSI PLAGIARISME DOKUMEN TEKS BAHASA INDONESIA

  • Yusup Miftahuddin
  • Jasman Pardede
  • Acep Andi Andriani
Keywords: plagiarism, N-Gram Technique, Rabin Karp, Similarity, TF-IDF Weighting

Abstract

Plagiarism is copying or take over a works, paper and so on from other people who seemed to be claimed as his own work. Plagiarism detection can be done by matching the test document and source document. Detection process has few steps, which is preprocessing step, TF-IDF weighting step, and document similiarity detection process. Detection process is done with N-Gram Technique and Rabin Karp method. N-gram do the sentence splitting based on defined character length, then do the character matching and counting the similiarity percentage value. While in the Rabin Karp detection do the sentence splitting based on character length, then counting the hash value, then matching it, if hash value is match, then for the next step is doing the word matching and counting the similiarity percentage value. From the test result, TF-IDF weighting can be use to plagiarism detection. From the comparison of both method, N-Gram and Rabin Karp produce the same similarity value, but different detection time. N-Gram detection process time is faster than Rabin Karp.

References

[1] Astuti, Budi, 2012, Identifikasi Perilaku Plagiat pada Mahasiswa Fakultas Ilmu Pendidikan, Universitas Negeri Yogyakarta, Artikel Penelitian, Yogyakarta :Universitas Negeri Yogyakarta.
[2] Dewanto, Sandy, Indriati, Cholissodin, Imam, Deteksi Plagiarisme Dokumen Teks Menggunakan Algoritma Rabin-Karp dengan Synonym Recognition. Malang :Universitas Brawijaya Malang
[3] Evan, Fabianus Hendy, P., Y. Sigit Purnomo W.,Pranowo, 2014, Pembangunan Perangkat Lunak Peringkas Dokumen dari Banyak Sumber Menggunakan Sentence Scoring dengan Metode TF-IDF. Yogyakarta : Universitas Atma Jaya.
[4] Firdaus, Hari Bagus, 2008, Deteksi Plagiat Dokumen Menggunakan Algoritma Rabin-Karp. Bandung : Institut Teknologi Bandung
[5] Lisangan, Erick Alfons, 2013, Implementasi N-Gram Technique dalam Deteksi Plagiarisme Pada Tugas Mahasiswa. Universitas Atma Jaya Makassar.
[6] Mujahidin, Zainal, 2013, Implementasi Metode Rabin Karp Untuk Mendeteksi Tingkat Kesamaan Dua Dokumen, Pekanbaru Riau : Universitas Islam Negeri Sultan Syarif Kasim.
[7] Nugroho, Eko, 2011, Perancangan Sistem DeteksiPlagiarisme Dokumen Teks dengan Menggunakan Algoritma Rabin-Karp. Malang : Universitas Brawijaya.
[8] Pardede, Jasman, Alvian, Leo, 2015, Rancang Bangun Aplikasi Pendeteksi Plagiarisme Menggunakan Algoritma Sherlock. Bandung : ITENAS
[9] Pardede, Jasman, Tonianto, 2016, Implementasi Metode Non-Negative Matrix Factorization pada Aplikasi Peringkas Dokumen Bahasa Indonesia. Bandung :ITENAS
[10] Purwitasari, Diana, Kusmawan, Putu Yuwono, Yuhana, Umi Laili, Deteksi Keberadaan Kalimat Sama sebagai Indikasi Penjiplakan dengan Algoritma Hashing Berbasis N-Gram. ITS.
[11] Putra, Gifny Dwi, N., Youllia Indrawaty, 2011,Pembangunan Aplikasi Pengukuran Tingkat Similaritas Antar Dokumen Berbasis Teks Menggunakan Metode Document Fingerprinting. Bandung: ITENAS.
[12] Widiantoro, Agustinus, 2014, Peringkasan Teks Otomatis pada Dokumen Berbahasa Jawa Menggunakan Metode TF-IDF. Yogyakarta : Universitas Sanata Dharma.
[13] Yoga, Kadek Versi Yana, 2012, Pengembangan Aplikasi Pendeteksi Plagiarisme Pada Dokumen Teks Menggunakan Aalgoritma Rabin-Karp. Universitas Pendidikan Ganesha.
[14] ___, 2015, Plagiarisme, (online), (https://id.wikipedia.org/wiki/Plagiarisme, diakses pada tanggal 13 Maret 2016).
Published
2018-05-18
Section
Articles