Penerapan Metode Machine Learning dalam Klasifikasi Risiko Kejadian Berat Badan Lahir Rendah di Indonesia

  • Pardomuan Robinson Sihombing bps
  • Istiqomatul Fajriyah Yuliati Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN) Jakarta
Keywords: CART, machine learning, naïve bayes, SVM, random forest

Abstract

Penelitian ini akan mengkaji penerapan beberapa metode machine learning dengan memperhatikan kasus imbalanced data dalam pemodelan klasifikasi untuk penentuan risiko kejadian bayi dengan BBLR yang diharapkan dapat menjadi solusi dalam menurunkan kelahiran bayi dengan BBLR di Indonesia. Adapun metode meachine learning yang digunakan adalah Classification and Regression Tree (CART), Naïve Bayes, Random Forest dan Support Vector Machine (SVM). Pemodelan klasifikasi dengan menggunakan teknik resample pada kasus imbalanced data dan set data besar terbukti mampu meningkatkan ketepatan klasifikasi khususnya terhadap kelas minoritas yang dapat diihat dari nilai sensitivity yang tinggi dibandingkan data asli (tanpa treatment). Selanjutnya, dari kelima model klasifikasi yang iuji menunjukkan bahwa model random forest memberikan kinerja terbaik berdasarkan nilai sensitivity, specificity, G-mean dan AUC tertinggi. Variabel terpenting/paling berpengaruh dalam klasifikasi resiko kejadian BBLR adalah jarak dan urutan kelahiran, pemeriksaan kehamilan, dan umur ibu

Downloads

Download data is not yet available.

References

[1] Bappenas, Metadata Indikator Tujuan Pembangunan Berkelanjutan (TPB)/Sustainable Development Goals (SDGs) Indonesia Pilar Pembangunan Sosial. Jakarta: Bappenas, 2020.
[2] Bkkbn, “Bkkbn Survei Demografi Dan Kesehatan Indonesia 2017,” 10 Februari 2017, 2017. https://www.bkkbn.go.id/detailpost/bkkbn-survei-demografi-dan-kesehatan-indonesia-2017 (accessed May 22, 2021).
[3] Kemenskes, Profil Kesehatan Indonesia Tahun 2019. Jakarta: Kementerian Kesehatan RI, 2019.
[4] J. Han, M. Kamber, and J. Pei, “Data Mining Concepts and Techniques,” Third Edit., Elsevier, 2012.
[5] M. Maalouf and M. Siddiqi, “Weighted logistic regression for large-scale imbalanced and rare events data,” Knowledge-Based Syst., vol. 59, pp. 142–148, 2014, doi: https://doi.org/10.1016/j.knosys.2014.01.012.
[6] G. King and L. Zeng, “Logistic Regression in Rare Events Data,” Polit. Anal., vol. 9, no. 2, pp. 137–163, 2001, doi: 10.1093/oxfordjournals.pan.a004868.
[7] T. Purwa, “Perbandingan Metode Regresi Logistik dan Random Forest untuk Klasifikasi Data Imbalanced (Studi Kasus: Klasifikasi Rumah Tangga Miskin di Kabupaten Karangasem, Bali Tahun 2017),” J. Mat. Stat. dan Komputasi, vol. 16, no. 1, pp. 58–73, 2019.
[8] S. H. Sumartini and S. W. Purnami, “Penggunaan Metode Classification and Regression Trees (CART) untuk Klasifikasi Rekurensi Pasien Kanker Serviks di RSUD Dr. Soetomo Surabaya,” J. Sains dan Seni ITS, vol. 4, no. 2, pp. 211–216, 2015, [Online]. Available: https://www.neliti.com/publications/15687/penggunaan-metode-classification-and-regression-trees-cart-untuk-klasifikasi-rek.
[9] M. Mambang and A. Byna, “Analisis Perbandingan Algoritma C. 45, Random Forest Dengan Chaid Decision Tree Untuk Klasifikasi Tingkat Kecemasan Ibu Hamil,” Semin. Naisonal Teknol. Inf. dan Multimed. 2017, vol. 5, no. 1, pp. 103–108, 2017.
[10] C. Oganis, S. Musdalifah, and D. Lusiyanti, “Klasifikasi Status Gizi Ibu Hamil Untuk Mengidentifikasi Bayi Berat Lahir Rendah (Bblr) Menggunakan Metode Support Vector Machine (Svm)(Studi Kasus Di Puskesmas Labuan),” J. Ilm. Mat. Dan Terap., vol. 14, no. 2, pp. 144–151, 2017.
[11] P. L. Kumalasari, “Sistem Pengambilan Keputusan untuk Menentukan Proses Persalinan dengan Metode Naïve Bayes dan Forward Chaining,” UNNES, 2020.
[12] M. S. Kosim, A. Yunanto, R. Dewi, G. I. Sarosa, and A. Usman, “Buku ajar neonatologi,” IDI, Jakarta, 2008.
[13] A. B. Setyawan, K. A. Notodiputro, and Indahwati, “Pemodelan Regresi Logistik Pada Kasus Berat Badan Lahir Rendah (Bblr) Dan Pengaruh Agregasi Data Terhadap Hasil Pendugaan,” IPB University, 2015.
[14] M. B. Johra, “Perbandingan Kernel Trick pada Non Linier Support Vector Machine (Studi Kasus: Pemilihan Penolong Persalinan di Provinsi Maluku Utara 2016).,” Universitas Padjadjaran, 2018.
[15] R. J. Lewis, “An introduction to classification and regression tree (CART) analysis,” in Annual meeting of the society for academic emergency medicine in San Francisco, California, 2000, vol. 14.
[16] L. Breiman, J. Friedman, C. J. Stone, and R. A. Olshen, Classification and regression trees. CRC press, 1984.
[17] K. Schouten, F. Frasincar, and R. Dekker, “An Information Gain-Driven Feature Study for Aspect-Based Sentiment Analysis,” in Natural Language Processing and Information Systems, 2016, pp. 48–59.
[18] S. R. Gunn, “Support vector machines for classification and regression,” ISIS Tech. Rep., vol. 14, no. 1, pp. 5–16, 1998.
[19] M. Maalouf and T. B. Trafalis, “Rare events and imbalanced datasets: an overview,” Int. J. Data Mining, Model. Manag., vol. 3, no. 4, pp. 375–388, 2011.
[20] M. Kubat and S. Matwin, “Addressing the curse of imbalanced training sets: one-sided selection,” in Icml, 1997, vol. 97, pp. 179–186.
Published
2021-05-30
How to Cite
Sihombing, P., & Yuliati, I. (2021). Penerapan Metode Machine Learning dalam Klasifikasi Risiko Kejadian Berat Badan Lahir Rendah di Indonesia. MATRIK : Jurnal Manajemen, Teknik Informatika Dan Rekayasa Komputer, 20(2), 417-426. https://doi.org/https://doi.org/10.30812/matrik.v20i2.1174
Section
Articles