Una propuesta metodológica para abordar el fenómeno de la deserción académica a partir de un modelo de predicción inteligente: un caso de estudio
DOI:
https://doi.org/10.29352/mill0223.31378Palabras clave:
estudio de caso; modelo dinámico; minería de datos educativos; metaheurísticaResumen
Introducción: La deserción universitaria se considera actualmente como un fenómeno complejo que va más alla del número de estudiantes no matriculados, y que viene en continuo crecimiento sobre todo en los primeros años de estudio.
Objetivo: En el presente estudio se propone un modelo de predicción que combina el Análisis de Supervivencia, Árboles de Decisión y Random Forest, bajo la filosofía de Machine Learning, para el diagnóstico temprano de los posibles factores de la deserción en estudiantes universitarios.
Métodos: La propuesta consta de 3 fases: el Análisis de Supervivencia que permite estimar la probabilidad de permanencia del alumno (supervivencia). La fase 2 parte del valor de probabilidad obtenido en la fase anterior y lo utiliza como variable respuesta en el proceso de modelado basado en los árboles de decisión para establecer patrones de supervivencia en torno a las variables consideradas. Finalmente, en la fase 3 se identifican las variables más importantes en el modelo, utilizando Random Forest.
Resultados: La metodología propuesta permitió diseñar un modelo de predicción, que identifica las principales variables de segmentación en patrones de comportamiento de posibles casos de deserción académica.
Conclusión: Si bien la propuesta fue desarrollada considerando un caso particular de una universidad chilena, la eficiente combinación de la metaheurística permite la extrapolación de la metodología a cualquier contexto y realidad académica. Sin embargo, se deben considerar las condiciones y necesidades de cada institución.
Descargas
Citas
Acevedo, F. (2021), “Concepts and measurement of dropout in higher education: A critical perspective from Latin America,” Issues in Educational Research, 31, 661–678. https://www.iier.org.au/iier31/acevedo.pdf.
Agrusti, F., Bonavolontà, G., and Mezzini, M. (2019), “University dropout prediction through educational data mining techniques: A systematic review,” Journal of E-Learning and Knowledge Society, 15, 161–182. https://doi.org/10.20368/1971-8829/1135017.
Bramer, M. (2016), Principles of Data Mining, London: Springer. https://doi.org/10.1007/978-1-4471-7307-6_1.
Breiman, L. (2001), “Random Forests,” Machine Learning, 45, 5–32. https://doi.org/10.1007/978-3-030-62008-0_35.
Breiman, L., Friedman, J., Olsen, R., and Stone, C. (1984), Classification and Regression Trees, Encyclopedia of Data Warehousing and Mining, Monterey, California, U.S.A: Wadsworth, Inc. https://doi.org/10.4018/9781591405573.ch027.
Dekker, G. W., Pechenizkiy, M., and Vleeshouwers, J. M. (2009), “Predicting students drop out: A case study,” in EDM’09 - Educational Data Mining 2009: 2nd International Conference on Educational Data Mining, eds. T. Barnes, M. Desmarais, C. Romero, and S. Ventura, Córdoba, Spain, pp. 41–50. https://files.eric.ed.gov/fulltext/ED539041.pdf
Feng, G., Fan, M., and Chen, Y. (2022), “Analysis and Prediction of Students’ Academic Performance Based on Educational Data Mining,” IEEE Access, IEEE, 10, 19558–19571. https://doi.org/10.1109/ACCESS.2022.3151652.
González, J., Galvis, D., and Hurtado, L. (2014), “La distribución Beta Generalizada como un modelo de sobrevivencia para analizar la evasión universitaria,” Estudios pedagógicos, 40, 133–144. https://doi.org/10.4067/s0718-07052014000100008.
Hastie, T., Tibshirani, R., and Friedman, J. (2009), The elements of Statistical learning: data mining, inference, and prediction, Springer.
Iam-On, N., and Boongoen, T. (2017), “Improved student dropout prediction in Thai University using an ensemble of mixed-type data clusterings,” International Journal of Machine Learning and Cybernetics, Springer Berlin Heidelberg, 8, 497–510. https://doi.org/10.1007/s13042-015-0341-x.
Kleinbaum, D. G., and Klein, M. (2012), Statistics for Biology and Health, Survival Analysis: a self-learning text, Springer.
Kubat, M. (2017), An Introduction to Machine Learning, Cham, Switzerland: Springer International Publishing. https://doi.org/10.1002/9781119720492.ch7.
Miranda, M. A., and Guzmán, J. (2017), “Análisis de la deserción de estudiantes universitarios usando técnicas de minería de datos,” Formacion Universitaria, 10, 61–68. https://doi.org/10.4067/S0718-50062017000300007.
Munizaga, F., Cifuentes, M., and Beltrán, A. (2018), “Retención y abandono estudiantil en la Educación Superior Universitaria en América Latina y el Caribe: una revisión sistemática,” Archivos Analíticos de Políticas Educativas, 26, 1–31. https://doi.org/10.14507/epaa.26.3348.
Pérez-Gutiérrez, B. R. (2020), “Comparación de técnicas de minería de datos para identificar indicios de deserción estudiantil, a partir del desempeño académico,” Revista UIS Ingenierías, 19, 193–204. https://doi.org/10.18273/revuin.v19n1-2020018.
R Core Team (2018), R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.r-project.org/
Segal, M. R. (2004), Machine Learning Benchmarks and Random Forest Regression, UCSF: Center for Bioinformatics and Molecular Biostatistics. https://escholarship.org/uc/item/35x3v9t4
Siroky, D. S. (2009), “Navigating random forests and related advances in algorithmic modeling,” Statistics Surveys, 3, 147–163. https://doi.org/10.1214/07-SS033.
Torrado Fonseca, M., and Figuera Gazo, P. (2019), “Estudio longitudinal del proceso de abandono y reingreso de estudiantes de Ciencias Sociales. El caso de Administración y Dirección de Empresas,” Educar, 55, 401–417. https://doi.org/10.5565/rev/educar.1022.
Villa-Murillo, A. (2012), “Optimización del diseño de parametros metodos Forest-Genetic,” Universitat Politecnica de Valencia. https://dialnet.unirioja.es/servlet/tesis?codigo=25802
Yamao, E., Saavedra, L. C., Campos Pérez, R., De Jesús, V., and Hurtado, H. (2018), “Prediction of academic performance using data mining in first year students of peruvian university,” Revista Campus, 23, 151–160.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2023 Millenium - Journal of Education, Technologies, and Health
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Los autores que sometan propuestas para esta revista estarán de acuerdo con los siguientes términos:
a) Los artículos serán publicados según la licencia Licença Creative Commons (CC BY 4.0), conforme el régimen open-access, sin cualquier coste para el autor o para el lector.
b) Los autores conservan los derechos de autor y conceden a la revista el derecho de la primera publicación, se permite la divulgación libre del trabajo, desde que sea correctamente atribuida la autoría y la publicación inicial en esta revista.
c) Los autores están autorización para firmar contratos adicionales separadamente, para la distribución no exclusiva de la versión del trabajo publicada en esta revista (ej.: publicar en un repositorio institucional o como capítulo de un libro), con reconocimiento de la autoría y publicación inicial e esta revista.
d) Los autores tienen permiso y son alentados a publicar y distribuir su trabajo on-line (ej.: en repositorios instituciones o en su página personal) ya que eso podrá generar alteraciones productivas, así como aumentar el impacto y la citación del trabajo publicado.
Documentos necesarios para la sumisión
Plantilla del artículo (formato editable)