Penanganan Ketidak Seimbangan Kelas Menggunakan Pendekatan Level Data
DOI:
https://doi.org/10.30812/matrik.v20i1.846Keywords:
Ketidak Seimbangan Kelas, Level Data, SMOTE, K-Means-SMOTE, Metode C4.5Abstract
Setiap tahun bagian kemahasiswaan Universitas Bumigora melakukan seleksi mahasiswa yang berhak mendapatkan Beasiswa Peningkatan Prestasi Akademik (Beasiswa PPA). Dalam proses seleksi pemilihan penerima Beasiswa PPA terdapat permasalahan seperti kesulitan dalam menentukan mahasiswa yang berhak menerima beasiswa, dikarenakan jumlah kuota beasiswa lebih sedikit dibandingkan jumlah mahasiswa yang mendaftar beasiswa. Kumpulan data hasil seleksi Beasiswa PPA sebanyak 150 instance. Terdapat ketidak seimbangan kelas pada data yang digunakan yaitu 85 instance kelas tidak layak dan 65 instance kelas layak. Solusi yag ditawarkan adalah menggunakan pendekatan level data untuk menyeimbangkan kelasnya seperti metode SMOTE dan k-means-SMOTE. Adapun tujuan penelitian ini adalah menangani permasalahan ketidak seimbangan kelas pada data beasiswa PPA Universitas Bumigora menggunakan pendekatan level data untuk meningkatkan kinerja metode C4.5. Tahapan-tahapan penelitian ini terdiri dari pengumpulan data Beasiswa PPA, data preprocesing, klasifikasi, dan pengujian kinerja. Berdasarkan hasil pengujiannya, pendekatan level data menggunakan metode k-means-SMOTE dan metode C4.5 memiliki kinerja terbaik untuk klasifikasi penerima Beasiswa PPA dengan akurasi 81.3%, sensitivitas 84.9%, dan spesifisitas 77.6%. Dengan demikian, metode k-mean-SMOTE dan metode C4.5 memiliki kinerja terbaik berdasarkan akurasi, sensitivitas, dan spesifisitas.
Downloads
References
[2] J. H. Jaman and N. I. P. Astuti, “Melakukan observasi ke tempat yang akan di teliti ( SDN Karawang Kulon,†Techno Xplore, vol. 3, no. 1, pp. 25–29, 2018.
[3] A. S. Suweleh, D. Susilowati, and H. Hairani, “Aplikasi Penentuan Penerima Beasiswa Menggunakan Algoritma C4.5,†Jurnal Bumigora Information Technology, vol. 2, no. 1, pp. 12–21, 2020.
[4] M. S. Juliardi, R. Saptono, and D. E. Cahyani, “Universitas Sebelas Maret Bidikmisi Applicant’s Classification using C4. 5 Algorithm,†Jurnal Teknologi dan Informasi, vol. 6, no. 1, pp. 16–23, 2017.
[5] N. Hijriana and M. Rasyidan, “Penerapan Metode Decision Tree Algoritma C4.5 untuk Seleksi Calon Penerima Beasiswa Tingkat Universitas,†Sains Dan Teknologi, vol. 3, pp. 9–13, 2017.
[6] D. Noviana, Y. Susanti, and I. Susanto, “Analisis Rekomendasi Penerima Beasiswa Menggunakan Algoritma K-Nearest Neighbor (K-NN) Dan Algoritma C4.5,†Seminar Nasional Penelitian Pendidikan Matematika, pp. 79–87, 2019.
[7] Okfalisa, R. Fitriani, and Y. Vitriani, “The Comparison of Linear Regression Method and K-Nearest Neighbors in Scholarship Recipient,†in International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing, 2018, pp. 194–199.
[8] D. Kurniadi, E. Abdurachman, H. L. H. S. Warnars, and W. Suparta, “The prediction of scholarship recipients in higher education using k-Nearest neighbor algorithm,†in IOP Conference Series: Materials Science and Engineering, 2018, pp. 1–7.
[9] N. Z. Dina and R. S. Marjianto, “Prediksi Penentuan Penerima Besasiswa Dengan Metode Knearest Neighbour,†in Jurnal Nasional Informatika dan Teknologi Jaringan, 2018, vol. 2, no. 2, pp. 135–139.
[10] W. Suryaningtyas, N. Iriawan, K. Fithriasari, B. S. S. Ulama, I. Susanto, and A. A. Pravitasari, “On the Bernoulli Mixture Model for Bidikmisi Scholarship Classification with Bayesian MCMC,†in Journal of Physics: Conf. Series 1090, 2018, vol. 1090, no. 1, pp. 1–8.
[11] H. Sulistiani and Y. T. Utami, “Penerapan Algoritma Klasifikasi sebagai Pendukung Keputusan Pemberian Beasiswa Mahasiswa,†in Seminar Nasional Teknologi Industri, 2018, pp. 300–305.
[12] Hairani, Setiawan, N. Akhmad, Adji, and T. Bharata, “Metode Klasifikasi Data Mining dan Teknik Sampling SMOTE Menangani Class Imbalance Untuk Segmentasi Customer pada Industri Perbankan,†in Seminar Nasional Sains dan Teknologi, 2016, vol. 1, no. 1, pp. 168–172.
[13] H. Hairani, K. E. Saputro, and S. Fadli, “K-means-SMOTE untuk menangani ketidakseimbangan kelas dalam klasifikasi penyakit diabetes dengan C4.5, SVM, dan naive Bayes,†Jurnal Teknologi dan Sistem Komputer, vol. 8, no. 2, pp. 89–93, 2020.
[14] X. Wu et al., “Top 10 algorithms in data mining,†Knowledge and information systems, vol. 14, no. 1, pp. 1–37, 2008.
[15] Hairani and M. Innuddin, “Kombinasi Metode Correlated Naive Bayes dan Metode Seleksi Fitur Wrapper untuk Klasifikasi Data Kesehatan,†Jurnal Teknik Elektro, vol. 11, no. 2, pp. 50–55, 2019.
[16] L. Nurellisa et al., “Analisis Rekomendasi Calon Debitur Motor pada PT. XYZ Menggunakan Algoritma C4.5,†Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 7, no. 4, pp. 673–682, 2020.
[17] G. Douzas, F. Bacao, and F. Last, “Improving imbalanced learning through a heuristic oversampling method based on k-means and SMOTE,†Information Sciences, vol. 465, pp. 1–20, 2018.
Downloads
Published
Issue
Section
How to Cite
Similar Articles
- Muhammad Ibnu Choldun Rachmatullah, The Application of Repeated SMOTE for Multi Class Classification on Imbalanced Data , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 1 (2022)
- Erlin Erlin, Yenny Desnelita, Nurliana Nasution, Laili Suryati, Fransiskus Zoromi, Dampak SMOTE terhadap Kinerja Random Forest Classifier berdasarkan Data Tidak seimbang , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 3 (2022)
- Darwan Darwan, Penggunaan Jaringan Syaraf Tiruan dan Wavelet Pada Citra EKG 12 Lead , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 20 No. 2 (2021)
- Gibran Satya Nugraha, Hairani Hairani, Aplikasi Pemetaan Kualitas Pendidikan di Indonesia Menggunakan Metode K-Means , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 17 No. 2 (2018)
- Arief Herdiansah, Sistem Pendukung Keputusan Referensi Pemilihan Tujuan Jurusan Teknik di Perguruan Tinggi Bagi Siswa Kelas XII IPA Mengunakan Metode AHP , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 19 No. 2 (2020)
- Pardomuan Robinson Sihombing, Istiqomatul Fajriyah Yuliati, Penerapan Metode Machine Learning dalam Klasifikasi Risiko Kejadian Berat Badan Lahir Rendah di Indonesia , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 20 No. 2 (2021)
- Cherfly Kaope, Yoga Pristyanto, The Effect of Class Imbalance Handling on Datasets Toward Classification Algorithm Performance , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 2 (2023)
- Yarza Aprizal, Rabin Ibnu Zainal, Afriyudi Afriyudi, Perbandingan Metode Backpropagation dan Learning Vector Quantization (LVQ) Dalam Menggali Potensi Mahasiswa Baru di STMIK PalComTech , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 18 No. 2 (2019)
- Christofer Satria, Peter Wijaya Sugijanto, Anthony Anggrawan, I Nyoman Yoga Sumadewa, Aprilia Dwi Dayani, Rini Anggriani, Multi-Algorithm Approach to Enhancing Social Assistance Efficiency Through Accurate Poverty Classification , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 24 No. 1 (2024)
- Heroe Santoso, Ahmad Wilda Yulianto, ANALISA DAN PERANCANGAN SISTEM ABSENSI SISWA BERBASIS WEB DAN SMS GATEWAY , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 16 No. 2 (2017)
You may also start an advanced similarity search for this article.
Most read articles by the same author(s)
- Khairul Imtihan, Muhamad Rodi, Maulana Ashari, Mohamad Taufan Asri Zaen, Khairan Marzuki, Audit Tata Kelola Teknologi Informasi Menggunakan Framework Cobit 4.1 , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 2 (2022)
- Dyah Susilowati, Hairani Hairani, Indah Puji Lestari, Khairan Marzuki, Lalu Zazuli Azhar Mardedi, Segmentasi Lokasi Promosi Penerimaan Mahasiswa Baru Menggunakan Metode RFM dan K-Means Clustering , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 2 (2022)
- Muhamad Azwar, Sri Winarni Sofya, Riwayati Malika, Hairani Hairani, Juvinal Ximenes Guterres, Combination Forward Chaining and Certainty Factor Methods for Selecting the Best Herbs to Support Independent Health , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 24 No. 2 (2025)
- Helna Wardhana, I Made Yadi Dharma, Khairan Marzuki, Ibjan Syarif Hidayatullah, Implementation of Neural Machine Translation in Translating from Indonesian to Sasak Language , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 23 No. 2 (2024)
- Putu Tisna Putra, Anthony Anggrawan, Hairani Hairani, Comparison of Machine Learning Methods for Classifying User Satisfaction Opinions of the PeduliLindungi Application , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 3 (2023)
- Donny Kurniawan, Anthony Anggrawan, Hairani Hairani, Graduation Prediction System on Students Using C4.5 Algorithm , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 19 No. 2 (2020)
- Dadang Priyanto, Bambang Krismono Triwijoyo, Deny Jollyta, Hairani Hairani, Ni Gusti Ayu Dasriani, Data Mining Earthquake Prediction with Multivariate Adaptive Regression Splines and Peak Ground Acceleration , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 22 No. 3 (2023)
- I Putu Hariyadi, Khairan Marzuki, Implementation of Configuration Management Virtual Private Server Using Ansible , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 19 No. 2 (2020)
- Jusmita Weriza, Ismail Husein, Noranizamardia Noranizamardia, M Fakhariza, Khairan Marzuki, Development of OnlineWeb-Based New Student Graduation Application in Junior High School , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 21 No. 3 (2022)
- Lalu Zazuli Azhar Mardedi, Khairan Marzuki, Rancang Bangun Jaringan Komputer LAN Berdasarkan Perbandingan Kinerja Routing Protokol EIGRP dan Routing Protokol OSPF , MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer: Vol. 18 No. 2 (2019)
.png)











