Penerapan Logistic Regression dan SMOTE untuk Memprediksi Atrisi Karyawan pada Imbalanced Data
DOI:
https://doi.org/10.30812/corisindo.v1.5245Keywords:
Atrisi Karyawan, Klasifikasi, Logistic Regression, SMOTE, Machine LearningAbstract
Atrisi karyawan merupakan tantangan bagi perusahaan karena berdampak langsung pada meningkatnya biaya pelatihan, hilangnya pengetahuan, serta menurunnya produktivitas dan stabilitas tim. Penelitian ini bertujuan untuk membangun model prediksi atrisi karyawan menggunakan pendekatan machine learning. Dataset yang digunakan terdiri dari 1.470 data karyawan, yang telah melalui tahap preprocessing, termasuk penanganan nilai kategorikal, normalisasi, serta seleksi fitur menggunakan Recursive Feature Elimination (RFE). Untuk mengatasi ketidakseimbangan data antara kelas tidak resign dan resign, digunakan teknik SMOTE. Model logistic regression dipilih untuk mendapatkan performa terbaik. Hasil evaluasi menunjukkan bahwa model mampu memberikan hasil yang baik dengan akurasi sebesar 0.74, ROC AUC sebesar 0.82, dan recall 0.79 pada kelas minoritas. Temuan ini diharapkan dapat digunakan oleh perusahaan sebagai alat bantu dalam pengambilan keputusan untuk mengelola risiko atrisi secara lebih efektif.
References
[1] N. Basuki, “Mengoptimalkan Modal Manusia: Strategi Manajemen Sumber Daya Manusia Yang Efektif Untuk Pertumbuhan Organisasi Yang Berkelanjutan,” J. Ilm. Manaj., vol. 4, no. 2, pp. 182–192, 2023, doi: 10.15575/jim.v4i2.28606.
[2] G. Sartika, “Peran Strategis Manajemen Sumber Daya Manusia dalam Mendukung Keberlanjutan Organisasi melalui Penerapan Triple Bottom Line,” J. Ekon. dan Bisnis, vol. 4, no. 1, pp. 177–188, 2024, doi: 10.56145/ekonomibisnis.v4i1.155.
[3] W. A. Medyanti and M. Faisal, “Sistem Prediksi Awal Pada Atrisi Karyawan Perusahaan ‘XYZ’ Menggunakan Algoritma Support Vector Machine,” CESS (Journal Comput. Eng. Syst. Sci., vol. 8, no. 2, p. 429, 2023, doi: 10.24114/cess.v8i2.46494.
[4] S. Sumarita and M. Muzakki, “Pengaruh Kepemimpinan Transformasional pada Intensi Karyawan Keluar dari Perusahaan,” Indones. Bus. Rev., vol. 6, no. 1, p. 61, 2023, doi: 10.21632/ibr.6.1.61-70.
[5] A. R. B. Jamroni, W. Hadikristanto, and M. Fatchan, “Analisis Faktor dan Prediksi Atrisi untuk Optimalisasi Retensi Karyawan Menggunakan Machine Learning,” Bit-Tech (Binary Digit. - Technol., vol. 7, no. 3, 2025, doi: 10.32877/bt.v7i3.2301.
[6] M. Arfah and S. A. Pramono, “Eksplorasi Transformasi Digital dalam MSDM: Dampak Integrasi Artificial Intelligence dan Big Data Analytics terhadap Pengambilan Keputusan Strategis,” J. Minfo Polgan, vol. 14, pp. 183–192, 2025, doi: 10.33395/jmp.v14i1.14673.
[7] Louis Madaerdo Sotarjua and Dian Budhi Santoso, “Perbandingan Algoritma Knn, Decision Tree, Dan Random Forest Pada Data Imbalanced Class Untuk Klasifikasi Promosi Karyawan,” J. INSTEK (Informatika Sains dan Teknol., vol. 7, no. 2, pp. 192–200, 2022, doi: 10.24252/instek.v7i2.31385.
[8] A. Masruriyah, H. Novita, C. Sukmawati, A. Ramadhan, S. Arif, and B. Dermawan, “Pengukuran Kinerja Model Klasifikasi dengan Data Oversampling pada Algoritma Supervised Learning untuk Penyakit Jantung,” Comput. Sci., vol. 4, no. 1, pp. 62–70, 2024, doi: 10.31294/coscience.v4i1.2389.
[9] K. S. Uswatun Hasanah, Agus Mohamad Soleh, “Effect of Random Under sampling, Oversampling, and SMOTE on the Performance of Cardiovascular Disease Prediction Models,” J. Mat. Stat. Dan Komputasi, vol. 21, no. 1, pp. 88–102, 2024, doi: 10.20956/j.v21i1.35552.
[10] K. Nisa and S. Kartika Wibisono, “Klasifikasi Penyakit Skizofrenia menggunakan Algoritma Logistic Regresion,” J. Ris. Sist. Inf. Dan Tek. Inform., vol. 8, no. 2, pp. 696–704, 2023, [Online]. Available: https://tunasbangsa.ac.id/ejurnal/index.php/jurasik
[11] F. Daewana, “Perbandingan Algoritma Naïve Bayes Dan C4.5 Dalam Prediksi Keputusan Karyawan Untuk Meninggalkan Perusahaan,” Innov. J. Soc. Sci. Res., vol. 5, no. 1, pp. 1712–1726, 2025, doi: 10.31004/innovative.v5i1.17664.
[12] C. Chaedar, B. Lirna, and A. T. Damaliana, “Prediksi Atrisi Voluntary Karyawan Pt.Xyz: Pendekatan Ensemble Machine Learning Dengan Soft Voting Classifier,” J. Tek. Inform., vol. 5, no. 5, pp. 1231–1239, 2024, [Online]. Available: https://repository.upnjatim.ac.id/28002/
[13] D. A. Fauziah, A. Muliawan, and M. Dimyati, “Implementasi Machine Learning Pada Atrisi Karyawan Berdasarkan Parameter Kinerja Dengan Menggunakan Metode Particle Swarm Optimization Dan Ensemble Classifer,” J. Tek. Inform., vol. 5, no. 6, pp. 1823–1831, 2024, doi: 10.52436/1.jutif.2024.5.6.3442.
[14] M. Fadel, Z. Arifin, and G. Triyono, “Application Of Ensemble Method For Employee Turnover Predictions In Financial Services Company,” J. Tek. Inform., vol. 5, no. 3, pp. 767–775, 2024, [Online]. Available: https://jutif.if.unsoed.ac.id/index.php/jurnal/article/view/1871
[15] R. Nurul, S. Hakim, and S. R. Nudin, “Pengembangan Sistem Prediksi Employee Attrition Menggunakan Algoritma Random Forest Berbasis Web Di Ud. Mas Achiad,” J. Manaj. Inform., vol. 16, no. 2, 2024, [Online]. Available: https://ejournal.unesa.ac.id/index.php/jurnal-manajemen-informatika/article/view/60074
[16] Muhajirin, Risnita, and Asrulla, “Pendekatan Penelitian Kuantitatif Dan Kualitatif Serta Tahapan Penelitian,” J. Genta Mulia, vol. 15, no. 1, pp. 82–92, 2024, [Online]. Available: https://ejournal.uncm.ac.id/index.php/gm/article/view/903
[17] Y. Rifa’i, “Analisis Metodologi Penelitian Kulitatif dalam Pengumpulan Data di Penelitian Ilmiah pada Penyusunan Mini Riset,” Cendekia Inov. Dan Berbudaya, vol. 1, no. 1, pp. 31–37, 2023, doi: 10.59996/cendib.v1i1.155.
[18] I. N. Rizki, D. Prayoga, M. L. Puspita, and M. Q. Huda, “Implementasi Exploratory Data Analysis Untuk Analisis Dan Visualisasi Data Penderita Stroke Kalimantan Selatan Menggunakan Platform Tableau,” J. Inform. dan Tek. Elektro Terap., vol. 12, no. 1, 2024, doi: 10.23960/jitet.v12i1.3856.
[19] T. M. A. Admira and M. Saefudin, “Model Sentiment Analysis Berbasis Machine Learning Untuk Data Genz-Career Aspiration Menggunakan Flask Dan Naive Bayes,” J. Inf. Syst. Informatics Comput., vol. 9, no. 1, pp. 25–39, 2025, doi: 10.52362/jisicom.v9i1.1880.
[20] F. R. Lumbanraja, E. C. L. Gaol, D. A. Shofiana, and A. Junaidi, “Implementasi SMOTE dan Support Vector Machine Pada Klasifikasi Data Tidak Seimbang Metilasi Arginin,” J. Pepadun, vol. 5, no. 1, pp. 27–37, 2024, doi: 10.23960/pepadun.v5i1.209.
[21] A. Rohanah, D. L. Rianti, and B. N. Sari, “Perbandingan Naïve Bayes dan Support Vector Machine untuk Klasifikasi Ulasan Pelanggan Indihome,” STRING (Satuan Tulisan Ris. dan Inov. Teknol., vol. 6, no. 1, p. 23, 2021, doi: 10.30998/string.v6i1.9232.
[22] N. R. Febriyanti and A. D. Hartanto, “Analisis Perbandingan Algoritma SVM, Random Forest dan Logistic Regression untuk Prediksi Stunting Balita,” Edumatic J. Pendidik. Inform., vol. 9, no. 1, pp. 149–158, 2025, doi: 10.29408/edumatic.v9i1.29407.
[23] R. R. Rahmah, I. R. Setiawan, and F. F. Az-zahra, “Prediksi Keterlambatan Mahasiswa Dalam Membayar Biaya Kuliah Menggunakan Algoritma C4.5 (Studi Kasus : Universitas Muhammadiyah Sukabumi),” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 5, pp. 10792–10800, 2024, [Online]. Available: https://ejournal.itn.ac.id/index.php/jati/article/view/11145