Optimalisasi Hybrid Sampling pada SVM dan Ensemble Learning untuk Prediksi Churn

Authors

  • Hartono Wijaya Universitas Bumigora, Mataram, Indonesia
  • Hairani Universitas Bumigora, Mataram, Indonesia
  • Viviana Herlita Vidiasari Universitas Bumigora, Mataram, Indonesia
  • Farda Milanda Amin Universitas Bumigora, Mataram, Indonesia

DOI:

https://doi.org/10.30812/corisindo.v1.5246

Keywords:

Churn, Support Vector Machine, ensemble Learning, Hybrid Sampling, Imbalanced data

Abstract

Churn merupakan kondisi ketika pelanggan menghentikan penggunaan produk atau layanan suatu perusahaan, yang secara langsung berdampak terhadap penurunan pendapatan dan peningkatan biaya akuisisi pelanggan baru. Ketidakmampuan model pembelajaran mesin dalam mengenali pelanggan yang berisiko churn akibat ketidakseimbangan data menjadi tantangan utama dalam sistem prediksi churn. Penelitian ini bertujuan untuk mengembangkan model prediksi churn yang lebih akurat dan sensitif dengan mengombinasikan algoritma Support Vector Machine (SVM) dan metode ensemble (Bagging dan Stacking), disertai penerapan teknik hybrid sampling seperti SMOTE. Metode penelitian meliputi pengumpulan data, preprocessing data, pembagian data, pelatihan model dan evaluasi . Hasil penelitian menunjukkan bahwa model Stacking memberikan performa terbaik dengan akurasi dan F1-score mencapai 86%, serta nilai AUC sebesar 0,93. Fitur products number, age, dan active member teridentifikasi sebagai variabel paling berpengaruh terhadap churn. Batasan utama penelitian ini terletak pada keterbatasan sumber data dan belum dilakukannya tuning parameter secara mendalam. Penelitian ini juga memberikan kontribusi praktis bagi strategi retensi pelanggan dan dapat dikembangkan lebih lanjut dengan validasi pada dataset lintas industri dan tuning parameter yang lebih luas.

References

[1] M. Rizki Kurniawan, P. Nurul Sabrina, and R. Ilyas, “Prediksi Customer Churn Pada Perusahaan Telekomunikasi Menggunakan Algoritma C4.5 Berbasis Particle Swarm Optimization,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 5, pp. 3369–3375, 2024, doi: 10.36040/jati.v7i5.7476.

[2] M. Amirulhaq Iskandar and U. Latifa, “Website Prediksi Customer Churn Untuk Mempertahankan Pelanggan Pada Perusahaan Telekomunikasi,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 2, pp. 1308–1316, 2023, doi: 10.36040/jati.v7i2.6639.

[3] F. S. Pratiwi et al., “Implementasi Metode Smote dan Random OverSampling pada Algoritma Machine Learning,” vol. 8, no. 1, pp. 87–98, 2025.

[4] M. A. Syawaludin and R. Hidayat, “Prediksi Churn Pelanggan Multinational Bank Menggunakan Algoritma Machine Learning,” vol. 4, no. 2, pp. 89–97, 2024.

[5] D. A. Kusuma, A. R. Dewi, and A. R. Wijaya, “Perbandingan Random Forest dan Convolutional Neural Network dalam Memprediksi Peralihan Pelanggan,” JISKA (Jurnal Inform. Sunan Kalijaga), vol. 10, no. 1, pp. 186–194, 2025.

[6] M. T. Rfe and D. A. N. Adaboost, “Optimalisasi prediksi kehilangan karyawan menggunakan teknik rfe, smote, dan adaboost,” vol. 9, no. 4, pp. 2131–2145, 2024.

[7] M. Manalu and L. Wulandari, “Customer Churn Classification Using Support Vector Machine ( SVM ) Algorithm,” vol. 9, no. 3, pp. 74–79, 2024.

[8] B. Durkaya Kurtcan and T. Ozcan, “Predicting customer churn using grey wolf optimization-based support vector machine with principal component analysis,” J. Forecast., vol. 42, no. 6, pp. 1329–1340, 2023, doi: 10.1002/for.2960.

[9] H. Hairani and D. Priyanto, “A New Approach of Hybrid Sampling SMOTE and ENN to the Accuracy of Machine Learning Methods on Unbalanced Diabetes Disease Data,” Int. J. Adv. Comput. Sci. Appl., vol. 14, no. 8, pp. 585–590, 2023, doi: 10.14569/IJACSA.2023.0140864.

[10] N. Y. Nhu, T. Van Ly, and D. V. Truong Son, “Churn prediction in telecommunication industry using kernel Support Vector Machines,” PLoS One, vol. 17, no. 5 May, 2022, doi: 10.1371/journal.pone.0267935.

[11] F. C. Lucky Lhaura Van, M. K. Anam, S. Bukhori, A. K. Mahamad, S. Saon, and R. L. V. Nyoto, “The Development of Stacking Techniques in Machine Learning for Breast Cancer Detection,” J. Appl. Data Sci., vol. 6, no. 1, pp. 71–85, 2025, doi: 10.47738/jads.v6i1.416.

[12] R. Pratama, M. I. Herdiansyah, D. Syamsuar, and A. Syazili, “Prediksi Customer Retention Perusahaan Asuransi Menggunakan Machine Learning,” J. Sisfokom (Sistem Inf. dan Komputer), vol. 12, no. 1, pp. 96–104, 2023, doi: 10.32736/sisfokom.v12i1.1507.

[13] A. M. Husein and M. Harahap, “Pendekatan Data Science untuk Menemukan Churn Pelanggan pada Sector Perbankan dengan Machine Learning,” Data Sci. Indones., vol. 1, no. 1, pp. 8–13, 2021, doi: 10.47709/dsi.v1i1.1169.

[14] J. Faran and A. Triayudi, “Analysis of the Effectiveness of Polynomial Fit Smote Mesh on Imbalance Dataset for Bank Customer Churn Prediction With Xgboost and Bayesian Optimization,” J. Tek. Inform., vol. 5, no. 3, pp. 661–667, 2024, [Online]. Available: https://doi.org/10.52436/1.jutif.2024.5.3.1284.

[15] J. K. Sana, M. Z. Abedin, M. S. Rahman, and M. S. Rahman, “A novel customer churn prediction model for the telecommunication industry using data transformation methods and feature selection,” PLoS One, vol. 17, no. 12 December, 2022, doi: 10.1371/journal.pone.0278095.

[16] A. R. B. Jamroni, W. Hadikristanto, and M. Fatchan, “Analisis Faktor dan Prediksi Atrisi untuk Optimalisasi Retensi Karyawan Menggunakan Machine Learning,” vol. 7, no. 3, pp. 1059–1067, 2025, doi: 10.32877/bt.v7i3.2301.

Downloads

Published

2025-09-19