مقایسه الگوریتمهای یادگیری ماشین در پیشبینی موفقیت و افت تحصیلی دانشجویان با تاکید بر معیارهای عملکرد
چکیده
هدف: پیشبینی وضعیت تحصیلی دانشجویان، از جمله فارغالتحصیلی، ترک تحصیل یا ادامه تحصیل از موضوعات مهم در مدیریت آموزش عالی است. این پژوهش با هدف ارزیابی کارایی الگوریتمهای یادگیری ماشین در پیشبینی وضعیت تحصیلی دانشجویان انجام شد.
روششناسی پژوهش: در این مطالعه، مجموعه دادهای شامل ۴۴۲۴ نمونه و ۳۵ ویژگی فردی، تحصیلی و اجتماعی–اقتصادی مورد استفاده قرار گرفت. الگوریتمهای مختلف یادگیری ماشین شامل درخت تصمیم، جنگل تصادفی، ماشین بردار پشتیبان، XGBoost، LightGBM و CatBoost پیادهسازی و مقایسه شدند. پیشپردازش دادهها با مقیاسبندی ویژگیهای عددی و متعادلسازی کلاسها با روش SMOTE انجام شد. برای ارزیابی عملکرد، اعتبارسنجی متقابل و معیارهای Accuracy، F1-score و AUC بهکار گرفته شد.
یافتهها: نتایج نشان داد که مدلهای مبتنی بر Boosting، بهویژه CatBoost و LightGBM، بهترین عملکرد را در پیشبینی وضعیت تحصیلی ارایه کردند و نسبت به سایر الگوریتمها دقت و پایداری بیشتری داشتند. این الگوریتمها توانستند الگوهای پیچیدهتری را در دادهها شناسایی کرده و عملکردی قابلاتکا ارایه دهند.
اصالت/ارزش افزوده علمی: یافتهها بیانگر ظرفیت بالای روشهای یادگیری ماشین در تحلیل دادههای آموزشی و پشتیبانی از تصمیمگیری در مدیریت آموزش عالی است [1]. استفاده از مدلهای پیشرفته مانند CatBoost و LightGBM میتواند ابزار موثری برای شناسایی دانشجویان در معرض ترک تحصیل و بهبود برنامهریزی آموزشی باشد.
کلمات کلیدی:
یادگیری ماشین، پیشبینی وضعیت تحصیلی، افت تحصیلی دانشجویان، CatBoost، LightGBMمراجع
- [1] Villar, A., & de Andrade, C. R. V. (2024). Supervised machine learning algorithms for predicting student dropout and academic success: a comparative study. Discover artificial intelligence, 4(1), 2. https://doi.org/10.1007/s44163-023-00079-z
- [2] Mduma, N., Kalegele, K., & Machuve, D. (2019). A survey of machine learning approaches and techniques for student dropout prediction. Data science journa, 18(14), 1–10. https://doi.org/10.5334/dsj-2019-014
- [3] Sulak, S. A., & Koklu, N. (2024). Predicting student dropout using machine learning algorithms. Intelligent methods in engineering sciences, 3(3), 91–98. https://doi.org/10.58190/imiens.2024.103
- [4] Goren, O., Cohen, L., & Rubinstein, A. (2024). Early prediction of student dropout in higher education using machine learning models. Proceedings of the 17th international conference on educational data mining (pp. 349–359). International (CC BY-NC-ND 4.0) License. https://doi.org/10.5281/zenodo.12729834
- [5] Cho, C. H., Yu, Y. W., & Kim, H. G. (2023). A study on dropout prediction for university students using machine learning. Applied sciences, 13(21), 1204. https://doi.org/10.3390/app132112004
- [6] Quimiz-Moreira, M., Delgadillo, R., Parraga-Alava, J., Maculan, N., & Mauricio, D. (2025). Factors, prediction, explainability, and simulating university dropout through machine learning: A systematic Review, 2012–2024. Computation, 13(8), 198. https://doi.org/10.3390/computation13080198
- [7] Mduma, N. (2023). Data balancing techniques for predicting student dropout using machine learning. Data, 8(3), 49. https://doi.org/10.3390/data8030049
- [8] Wijayaningrum, V. N., Kirana, A. P., & Putri, I. K. (2024). Student academic performance prediction framework with feature selection and imbalanced data handling. Jurnal ilmiah kursor, 12(3), 123–134. http://kursorjournal.org/index.php/kursor/article/view/356/159
- [9] Joshi, A., Saggar, P., Jain, R., Sharma, M., Gupta, D., & Khanna, A. (2021). CatBoost — an ensemble machine learning model for prediction and classification of student academic performance. Advances in data science and adaptive analysis, 13(03n04), 2141002. https://doi.org/10.1142/S2424922X21410023
- [10] Syed Mustapha, S. M. F. D. (2023). Predictive analysis of students’ learning performance using data mining techniques: A comparative study of feature selection methods. Applied system innovation, 6(5), 86. https://doi.org/10.3390/asi6050086