Analisis Seleksi Fitur  Menggunakan Metode ANOVA F-test dan Algoritma Random Forest Untuk Deteksi Diabetes

Authors

  • Galih Hendro Martono Universitas Bumigora, Mataram, Indonesia
  • Ria Rismayati Universitas Bumigora, Mataram, Indonesia
  • Iptijanul Karor Universitas Bumigora, Mataram, Indonesia

DOI:

https://doi.org/10.30812/corisindo.v1.5282

Keywords:

Diabetes, Klasifikasi, Seleksi Fitur, ANOVA F-test, Random Forest

Abstract

Peningkatan level kadar glukosa darah yang melampaui batas normal merupakan ciri-ciri utama dari gangguan metabolisme yang dikenal sebagai diabetes mellitus, atau yang secara umum disebut penyakit kencing manis. Hal ini biasanya terjadi karena gangguan produksi atau fungsi insulin, baik secara absolut maupun relatif.  Diperkirakan  pada tahun 2030 diabetes akan menjadi penyebab kematian  terbesar ke-7 di dunia hal ini didasari laporan dari World Health Organization (WHO).  Ironisnya, sekitar 70% penderita diabetes tidak menyadari bahwa mereka mengidap penyakit ini, dan sekitar 25% telah mengalami komplikasi serius sebelum diagnosis ditegakkan. Oleh karena itu, deteksi dini serta manajemen risiko yang efektif sangat krusial untuk mencegah dampak kesehatan yang lebih berat.

Pentingnya pemilihan fitur dalam meningkatkan akurasi prediksi diabetes adalah fokus penelitian ini. Metode seleksi fitur berbasis ANOVA F-test yang digabungkan dengan algoritma Random Forest dalam penyusunan model prediksi diabetes digunakan pada penelitian ini . Dataset yang digunakan terdiri dari 70.000 data dengan 33 atribut, yang kemudian diseleksi hingga diperoleh 13 fitur paling relevan berdasarkan nilai P-value < 0,05. Hasil evaluasi menunjukkan bahwa penerapan seleksi fitur secara signifikan meningkatkan performa model. Akurasi prediksi mencapai 73% saat menggunakan 5 fitur, meningkat menjadi 86% dengan 10 fitur, dan mencapai 90% ketika menggunakan 13 fitur. Temuan ini menggaris bawahi pentingnya proses seleksi fitur dalam pengembangan model prediktif penyakit diabetes, serta memberikan kontribusi penting dalam mendukung upaya deteksi dini dan pengelolaan risiko secara lebih optimal.

References

[1] T. Gita Miranda, L. Yovita Sari, Stik. Bhakti Husada Bengkulu, and U. Dehasen, “Faktor Risiko Kejadian Diabetes Melitus (dm) Tipe 2 Di Poliklinik Penyakit Dalam Rs Kota Bengkulu,” 2023.

[2] I. Maulida, A. Suyatno, H. Rahmania Hatta, and U. Mulawarman, “Seleksi Fitur Pada Dokumen Abstrak Teks Bahasa Indonesia Menggunakan Metode Information Gain,” OKTOBER 2016 IJCCS, vol. 17, pp. 1–5, 2016.

[3] S. Ahmed, M. Shamim Kaiser, M. S. Hossain, and K. Andersson, “A Comparative Analysis of LIME and SHAP Interpreters with Explainable ML-Based Diabetes Predictions,” IEEE Access, 2024, doi: 10.1109/ACCESS.2024.3422319.

[4] N. F. Cleymans, M. Van De Casteele, J. Vandewalle, A. K. Desouter, F. K. Gorus, and K. Barbe, “Analyzing Random Forest’s predictive capability for Type 1 Diabetes progression,” IEEE Open Journal of Instrumentation and Measurement, 2025, doi: 10.1109/OJIM.2025.3551837.

[5] D. R. Manjunath, J. J. Lohith, S. Selva Kumar, and A. Das, “Predicting Diabetic Retinopathy and Nephropathy Complications Using Machine Learning Techniques,” IEEE Access, 2025, doi: 10.1109/ACCESS.2025.3562483.

[6] M. D. Purbolaksono, M. Irvan Tantowi, A. Imam Hidayat, and A. Adiwijaya, “Perbandingan Support Vector Machine dan Modified Balanced Random Forest dalam Deteksi Pasien Penyakit Diabetes,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 2, pp. 393–399, Apr. 2021, doi: 10.29207/resti.v5i2.3008.

[7] C. Z. V. Junus, T. Tarno, and P. Kartikasari, “Klasifikasi Menggunakan Metode Support Vector Machine Dan Random Forest Untuk Deteksi Awal Risiko Diabetes melitus,” Jurnal Gaussian, vol. 11, no. 3, pp. 386–396, Jan. 2023, doi: 10.14710/j.gauss.11.3.386-396.

[8] R. B. Prasetyo, “Prediksi Dini Penyakit Diabetes Pada Ibu Hamil Dengan Algoritma Random Forest,” 2024.

[9] T. Z. Jasman, E. Hasmin, Sunardi, C. Susanto, and W. Musu, “Perbandingan Logistic Regression, Random Forest, dan Perceptron pada Klasifikasi Pasien Gagal Jantung,” CSRID (Computer Science Research and Its Development Journal), vol. 14, no. 3, pp. 271–286, Dec. 2022, doi: 10.22303/csrid.14.3.2022.271-286.

[10] F. Putra, H. F. Tahiyat, R. M. Ihsan, R. Rahmaddeni, and L. Efrizoni, “Penerapan Algoritma K-Nearest Neighbor Menggunakan Wrapper Sebagai Preprocessing untuk Penentuan Keterangan Berat Badan Manusia,” MALCOM: Indonesian Journal of Machine Learning and Computer Science, vol. 4, no. 1, pp. 273–281, Jan. 2024, doi: 10.57152/malcom.v4i1.1085.

[11] A. Agung, A. Daniswara, I. Kadek, and D. Nuryana, “Data Preprocessing Pola Pada Penilaian Mahasiswa Program Profesi Guru,” Journal of Informatics and Computer Science, vol. 05, 2023.

[12] Y. A. Prasetyo, E. Utami, and A. Yaqin, “Pengaruh Komposisi Split Data Terhadap Performa Akurasi Analisis Sentimen Algoritma Naïve Bayes dan SVM,” Journal homepage: Journal of Electrical Engineering and Computer (JEECOM), vol. 6, no. 2, 2024, doi: 10.33650/jeecom.v4i2.

[13] E. Hariyanti, D. Pramana Hostiadi, Y. Priyo Atmojo, I. Made Darma Susila, and I. Tangkawarow, “Analisis Perbandingan Metode Seleksi Fitur pada Model Klasifikasi Decission Tree untuk Deteksi Serangan di Jaringan Komputer”.

[14] Hasna Marhamah Auliya, “Seleksi Fitur Pada Klasifikasi Kesejahteraan Janin Berdasarkan Data Kardiotokografi (KTG) Berbasis Machine Learning,” 2025.

[15] D. Haganta Depari et al., “Perbandingan Model Decision Tree, Naive Bayes dan Random Forest untuk Prediksi Klasifikasi Penyakit Jantung,” JURNAL INFORMATIK Edisi ke, vol. 18, p. 2022.

[16] S. Devella and F. Novia Rahmawati, “Implementasi Random Forest Untuk Klasifikasi Motif Songket Palembang Berdasarkan SIFT,” Jurnal Teknik Informatika dan Sistem Informasi, vol. 7, no. 2, 2020, [Online]. Available: http://jurnal.mdp.ac.id

[17] A. U. Zailani and N. L. Hanun, “Penerapan Algoritma Klasifikasi Random Forest Untuk Penentuan Kelayakan Pemberian Kredit Di Koperasi Mitra sejahtera,” Infotech: Journal of Technology Information, vol. 6, no. 1, pp. 7–14, Jun. 2020, doi: 10.37365/jti.v6i1.61.

[18] Suci Amaliah, M. Nusrang, and A. Aswi, “Penerapan Metode Random Forest Untuk Klasifikasi Varian Minuman Kopi di Kedai Kopi Konijiwa Bantaeng,” VARIANSI: Journal of Statistics and Its application on Teaching and Research, vol. 4, no. 3, pp. 121–127, Dec. 2022, doi: 10.35580/variansiunm31.

[19] M. Fadli and R. A. Saputra, “Klasifikasi Dan Evaluasi Performa Model Random Forest Untuk Prediksi Stroke Classification And Evaluation Of Performance Models Random Forest For Stroke Prediction,” vol. 12, 2023, [Online]. Available: http://jurnal.umt.ac.id/index.php/jt/index

[20] N. Sulistianingsih and G. H. Martono, “Feature Selection versus Feature Extraction Models for IoT Intrusion Detection System Using Convolutional Neural Network,” in COMNETSAT 2024 - IEEE International Conference on Communication, Networks and Satellite, Institute of Electrical and Electronics Engineers Inc., 2024, pp. 35–42. doi: 10.1109/COMNETSAT63286.2024.10862350.

Downloads

Published

2025-09-19