Penanganan Ketidak Seimbangan Kelas Menggunakan Pendekatan Level Data

  • Abdurraghib Segaf Suweleh Universitas Bumigora, Mataram, Indonesia
  • Dyah Susilowaty Universitas Bumigora, Mataram, Indonesia
  • Hairani Hairani Universitas Bumigora, Mataram, Indonesia
  • Khairan Marzuki Universitas Bumigora, Mataram, Indonesia
Keywords: Ketidak Seimbangan Kelas, Level Data, SMOTE, K-Means-SMOTE, Metode C4.5

Abstract

Setiap tahun bagian kemahasiswaan Universitas Bumigora melakukan seleksi mahasiswa yang berhak mendapatkan Beasiswa Peningkatan Prestasi Akademik (Beasiswa PPA). Dalam proses seleksi pemilihan penerima Beasiswa PPA terdapat permasalahan seperti kesulitan dalam menentukan mahasiswa yang berhak menerima beasiswa, dikarenakan jumlah kuota beasiswa lebih sedikit dibandingkan jumlah mahasiswa yang mendaftar beasiswa. Kumpulan data hasil seleksi Beasiswa PPA sebanyak 150 instance. Terdapat ketidak seimbangan kelas pada data yang digunakan yaitu 85 instance kelas tidak layak dan 65 instance kelas layak. Solusi yag ditawarkan adalah menggunakan pendekatan level data untuk menyeimbangkan kelasnya seperti metode SMOTE dan k-means-SMOTE. Adapun tujuan penelitian ini adalah menangani permasalahan ketidak seimbangan kelas pada data beasiswa PPA Universitas Bumigora menggunakan pendekatan level data untuk meningkatkan kinerja metode C4.5. Tahapan-tahapan penelitian ini terdiri dari pengumpulan data Beasiswa PPA, data preprocesing, klasifikasi, dan pengujian kinerja. Berdasarkan hasil pengujiannya, pendekatan level data menggunakan metode k-means-SMOTE dan metode C4.5 memiliki kinerja terbaik untuk klasifikasi penerima Beasiswa PPA dengan akurasi 81.3%, sensitivitas 84.9%, dan spesifisitas 77.6%. Dengan demikian, metode k-mean-SMOTE dan metode C4.5 memiliki kinerja terbaik berdasarkan akurasi, sensitivitas, dan spesifisitas.

 

 

Downloads

Download data is not yet available.

References

[1] Rismayanti, “Implementasi Algoritma C4.5 Untuk Menentukan Penerima Beasiswa di STT Harapan Medan,” Media Infotama, vol. 12, no. 2, pp. 116–120, 2016.
[2] J. H. Jaman and N. I. P. Astuti, “Melakukan observasi ke tempat yang akan di teliti ( SDN Karawang Kulon,” Techno Xplore, vol. 3, no. 1, pp. 25–29, 2018.
[3] A. S. Suweleh, D. Susilowati, and H. Hairani, “Aplikasi Penentuan Penerima Beasiswa Menggunakan Algoritma C4.5,” Jurnal Bumigora Information Technology, vol. 2, no. 1, pp. 12–21, 2020.
[4] M. S. Juliardi, R. Saptono, and D. E. Cahyani, “Universitas Sebelas Maret Bidikmisi Applicant’s Classification using C4. 5 Algorithm,” Jurnal Teknologi dan Informasi, vol. 6, no. 1, pp. 16–23, 2017.
[5] N. Hijriana and M. Rasyidan, “Penerapan Metode Decision Tree Algoritma C4.5 untuk Seleksi Calon Penerima Beasiswa Tingkat Universitas,” Sains Dan Teknologi, vol. 3, pp. 9–13, 2017.
[6] D. Noviana, Y. Susanti, and I. Susanto, “Analisis Rekomendasi Penerima Beasiswa Menggunakan Algoritma K-Nearest Neighbor (K-NN) Dan Algoritma C4.5,” Seminar Nasional Penelitian Pendidikan Matematika, pp. 79–87, 2019.
[7] Okfalisa, R. Fitriani, and Y. Vitriani, “The Comparison of Linear Regression Method and K-Nearest Neighbors in Scholarship Recipient,” in International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing, 2018, pp. 194–199.
[8] D. Kurniadi, E. Abdurachman, H. L. H. S. Warnars, and W. Suparta, “The prediction of scholarship recipients in higher education using k-Nearest neighbor algorithm,” in IOP Conference Series: Materials Science and Engineering, 2018, pp. 1–7.
[9] N. Z. Dina and R. S. Marjianto, “Prediksi Penentuan Penerima Besasiswa Dengan Metode Knearest Neighbour,” in Jurnal Nasional Informatika dan Teknologi Jaringan, 2018, vol. 2, no. 2, pp. 135–139.
[10] W. Suryaningtyas, N. Iriawan, K. Fithriasari, B. S. S. Ulama, I. Susanto, and A. A. Pravitasari, “On the Bernoulli Mixture Model for Bidikmisi Scholarship Classification with Bayesian MCMC,” in Journal of Physics: Conf. Series 1090, 2018, vol. 1090, no. 1, pp. 1–8.
[11] H. Sulistiani and Y. T. Utami, “Penerapan Algoritma Klasifikasi sebagai Pendukung Keputusan Pemberian Beasiswa Mahasiswa,” in Seminar Nasional Teknologi Industri, 2018, pp. 300–305.
[12] Hairani, Setiawan, N. Akhmad, Adji, and T. Bharata, “Metode Klasifikasi Data Mining dan Teknik Sampling SMOTE Menangani Class Imbalance Untuk Segmentasi Customer pada Industri Perbankan,” in Seminar Nasional Sains dan Teknologi, 2016, vol. 1, no. 1, pp. 168–172.
[13] H. Hairani, K. E. Saputro, and S. Fadli, “K-means-SMOTE untuk menangani ketidakseimbangan kelas dalam klasifikasi penyakit diabetes dengan C4.5, SVM, dan naive Bayes,” Jurnal Teknologi dan Sistem Komputer, vol. 8, no. 2, pp. 89–93, 2020.
[14] X. Wu et al., “Top 10 algorithms in data mining,” Knowledge and information systems, vol. 14, no. 1, pp. 1–37, 2008.
[15] Hairani and M. Innuddin, “Kombinasi Metode Correlated Naive Bayes dan Metode Seleksi Fitur Wrapper untuk Klasifikasi Data Kesehatan,” Jurnal Teknik Elektro, vol. 11, no. 2, pp. 50–55, 2019.
[16] L. Nurellisa et al., “Analisis Rekomendasi Calon Debitur Motor pada PT. XYZ Menggunakan Algoritma C4.5,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 7, no. 4, pp. 673–682, 2020.
[17] G. Douzas, F. Bacao, and F. Last, “Improving imbalanced learning through a heuristic oversampling method based on k-means and SMOTE,” Information Sciences, vol. 465, pp. 1–20, 2018.
Published
2020-09-29
How to Cite
Suweleh, A., Susilowaty, D., Hairani, H., & Marzuki, K. (2020). Penanganan Ketidak Seimbangan Kelas Menggunakan Pendekatan Level Data. MATRIK : Jurnal Manajemen, Teknik Informatika Dan Rekayasa Komputer, 20(1), 109-116. https://doi.org/https://doi.org/10.30812/matrik.v20i1.846
Section
Articles