Klasifikasi Indeks Pembangunan Manusia Menggunakan Model Stacking Random Forest-XGBoost
Keywords:
IPM, XGBoost, Klasifikasi, Random Forest, Ensemble LearningAbstract
Pembangunan manusia merupakan indikator kunci keberhasilan pembangunan, di mana Indeks Pembangunan Manusia (IPM) menjadi untuk mengukur kualitas sumber daya manusia dan membedakan kategori wilayah (rendah, sedang, tinggi, sangat tinggi). Penelitian ini bertujuan untuk mengembangkan dan menguji model klasifikasi IPM yang robust dengan memanfaatkan keunggulan ensemble learning melalui teknik Stacking yang mengintegrasikan Random Forest (RF) dan XGBoost. Data yang digunakan adalah IPM Kabupaten/Kota di Provinsi Jawa Timur tahun 2024 (38 sampel dari BPS), yang diproses dengan LabelEncoder dan StandardScaler sebelum dibagi menjadi 75% data latih dan 25% data uji. Model RF dan XGBoost digunakan sebagai base learner yang kemudian digabungkan melalui Stacking. Hasil penelitian menunjukkan bahwa Model Stacking mencapai performa klasifikasi yang sempurna dengan akurasi 100% pada data uji, terkonfirmasi melalui Confusion matrix tanpa adanya kesalahan prediksi. Akurasi ini menyamai RF dan mengungguli XGBoost (90%). Analisis Feature importance secara konsisten mengidentifikasi Rata-rata Lama Sekolah, Indeks Pengetahuan, dan Pengeluaran sebagai variabel paling dominan dalam klasifikasi IPM. Terbukti bahwa model Stacking Ensemble XGBoost-Random Forest terbukti efektif dan sangat andal untuk klasifikasi IPM. Temuan ini menegaskan bahwa faktor pendidikan dan ekonomi adalah kunci utama penentu kategori pembangunan manusia, yang dapat menjadi landasan strategis untuk intervensi kebijakan.
Downloads
References
S. Y. Kusumastuti, L. Judijanto, T. Kunawangsih, and S. Sa’dianoor, Ekonomi Pembangunan Lanjutan. PT. Sonpedia Publishing Indonesia, 2025.
M. P. Hababil, M. K. Firdaus, N. Nazhmi, M. D. Hamdani, M. R. Alghifary, and A. Fadilla, “Analisis pengaruh pemerataan ekonomi dalam upaya menghapus ketimpangan sosial-ekonomi antar masyarakat,” J. Macroecon. Soc. Dev., vol. 1, no. 4, pp. 1–9, 2024.
N. Ramadhani and Y. P. Utomo, “Analisis Faktor-Faktor yang Mempengaruhi Indeks Pembangunan Manusia (IPM) di Jawa Timur Tahun 2010-2020,” J. Bisnis Dan Manaj., vol. 3, no. 2, pp. 269–276, 2023.
R. Ningsih, “Pengaruh Pertumbuhan Ekonomi, Upah Minimum dan Indeks Pembangunan Manusia Terhadap Jumlah Penduduk Miskin di Provinsi Lampung,” IAIN Metro, 2025.
“indeks-pembangunan-manusia-provinsi-jawa-timur-2024.” [Online]. Available: https://jatim.bps.go.id/id/publication/2025/05/27/47fde052cb353c601c21c209/indeks-pembangunan-manusia-provinsi-jawa-timur-2024.html
C. Supriyanto and A. Marjuni, “Peningkatan keberagaman data untuk klasifikasi penyakit diabetes berbasis stacking ensemble learning,” J. Inform. J. Pengemb. IT, vol. 10, no. 1, pp. 1–10, 2025.
R. I. Arumnisaa and A. W. Wijayanto, “Comparison of Ensemble Learning Method: Random Forest, Support Vector Machine, AdaBoost for Classification Human Development Index (HDI),” SISTEMASI, vol. 12, no. 1, pp. 206–218, 2023.
Z. B. P. Pratama and Y. P. Astuti, “Comparison of Machine learning Methods (Linear Regression, Random Forest, and XGBoost) for Predicting Poverty in Central Java in 2024,” Sist. J. Sist. Inf., vol. 14, no. 5, pp. 2492–2499, 2025.
A. Arisandi and S. Syarifuddin, “Memprediksikan Indeks Pembangunan Manusia di Wilayah Indonesia Bagian Timur Menggunakan Random Forest Classification,” J. Math. Theory Appl., pp. 1–6, 2023.
A. Syaifuddin and T. Prabowo, “Optimasi Akurasi Model Prediksi Magnitudo Gempa Bumi dengan Integrasi Clustering DBSCAN pada Ensemble Learning (Random Forest & XGBoost),” 2024.
M. N. Cholil, “Implementasi algoritma Random Forest pada model klasifikasi sekuens DNA manusia dalam penyakit diabetes,” Universitas Islam Negeri Maulana Malik Ibrahim, 2025.
P. Zhang and X. Chen, “An Unsupervised learning Approach for Coal Spontaneous Combustion Warning Level Classification Using t-SNE and k-Means Clustering,” Appl. Sci., vol. 15, no. 7, p. 3756, 2025.
M. B. Prayogi and F. Apriani, “Prediksi Angka Harapan Hidup Menggunakan Random Forest dan XGBoost Regression,” JICode J. Inform. Dan Komput., vol. 2, no. 1, pp. 112–121, 2025.
J. M. A. S. Dachi and P. Sitompul, “Analisis Perbandingan Algoritma XGBoost dan Algoritma Random Forest Ensemble Learning pada Klasifikasi Keputusan Kredit,” J. Ris. Rumpun Mat. Dan Ilmu Pengetah. Alam, vol. 2, no. 2, pp. 87–103, 2023.
M. Heydarian, T. E. Doyle, and R. Samavi, “MLCM: Multi-label confusion matrix,” Ieee Access, vol. 10, pp. 19083–19095, 2022.
H. Zhang, Y. Wang, F. Dayoub, and N. Sunderhauf, “Varifocalnet: An iou-aware dense object detector,” in Proceedings of the IEEE/CVF conference on computer vision and pattern recognition, 2021, pp. 8514–8523.
M. El-Geneedy, H. El-Din Moustafa, H. Khater, S. Abd-Elsamee, and S. A. Gamel, “Advanced real-time detection of acute ischemic stroke using YOLOv12, YOLOv11, and YOLO-NAS: a comparative study for multi-class classification,” Sci. Rep., vol. 15, no. 1, p. 32546, 2025.
S. Saidah, Y. N. Fuadah, F. Alia, N. Ibrahim, R. Magdalena, and S. Rizal, “Facial skin type classification based on microscopic images using convolutional neural network (CNN),” in Proceedings of the 1st International Conference on Electronics, Biomedical Engineering, and Health Informatics: ICEBEHI 2020, 8-9 October, Surabaya, Indonesia, Springer, 2021, pp. 75–83.
N. M. Alahdal, F. Abukhodair, L. H. Meftah, and A. Cherif, “Real-time object detection in autonomous vehicles with YOLO,” Procedia Comput. Sci., vol. 246, pp. 2792–2801, 2024.
G. Canbek, T. Taskaya Temizel, and S. Sagiroglu, “PToPI: A comprehensive review, analysis, and knowledge representation of binary classification performance measures/metrics,” SN Comput. Sci., vol. 4, no. 1, p. 13, 2022.





