Estimación de las principales causas de la deserción universitaria mediante el uso de técnicas de machine learning
Palavras-chave:
Deserción, muestreo, multivariado, machine learning, componentes principales, agrupamiento, k-meansResumo
Según el reporte del banco mundial para el año 2015, la deserción estudiantil universitaria en Colombia había llegado a una tasa del 42%, ocupando el segundo lugar en Latinoamérica, lo que refleja una problemática social y económica de gran impacto. De acuerdo con lo anterior, el presente estudio realiza un análisis para identificar las causas que influyeron en la deserción estudiantil de una Institución de Educación Superior en la ciudad de Bogotá, aplicando técnicas computacionales como el Machine Learning. Para la identificación de las causas se emplearon técnicas del aprendizaje no supervisado como el análisis de componentes principales (PCA) y la descomposición en valores singulares (SVD) para la reducción de la dimensionalidad a 24 componentes con el 71% de la variabilidad explicada y el algoritmo de k-means posibilitó el agrupamiento en tres grupos con información recolectada de 207 estudiantes que desertaron durante el 2020. Este análisis permite establecer patrones de asociación entre algunas variables como los aspectos institucionales, encontrando semejanzas y diferencias, además de la identificación de factores de deserción relevantes en la población, siendo las dificultades económicas la principal causa de deserción en hombres (67.6%) de los programas de ingeniería mecánica y ambiental.
Referências
Bacos, C. A. Machine learning and education in the human age: a review of emerging technologies. In Science and information conference (pp. 536-543). Springer, Cham. (2019, April)
Bravo Núñez A. et al. Reducción de dimensiones: revisión y aplicaciones en clasificación automática. 2020.
Casanova, J. R., Cervero Fernández-Castañón, A., Núñez Pérez, J. C., Almeida, L. S., & Bernardo Gutiérrez, A. B. (2018). Factors that determine the persistence and dropout of university students. Psicothema, 30.
Castiblanco W. Modelo de ausentismo y deserción retención y permanencia estudiantil en la universidad ECCI. 2020.
Castillo, G. T. U., & Sánchez, B. A. M. (2021). Factores que inciden en la deserción universitaria. TZHOECOEN, 13(2), 56-65.
Chaves, V. E. J., & Torres, M. G. (2019). Análisis de la Educación Inicial en Paraguay a través de las Técnicas de Aprendizaje Automático. Revista de la Sociedad Científica del Paraguay, 24(2), 293-304.
Giraldo Otálvaro, J. D. (2021). Estudio de las técnicas de reducción de dimensión basadas en componentes principales: Análisis de componentes principales no lineales.
Gutiérrez, D., Díaz, J. F. V., & López, J. (2021). Indicadores de deserción universitaria y factores asociados. EducaT: Educación virtual, Innovación y Tecnologías, 2(1), 15-26.
Hernández Sampieri, Roberto. (2018). Metodología de la investigación: las rutas: cuantitativa y cualitativa y mixta. México: Mc Graw Hill- educación.
Jolliffe, IT (2002). Representación gráfica de datos utilizando componentes principales. Análisis de componentes principales, 78-110.
Kuvcak, Danijel y Jurieié. (2018). Aprendizaje máquina en educación: Una encuesta de las tendencias actuales de investigación. Annals of DAAAM Proceedings.
Martínez, J. (2022). Clustering (Agrupamiento), K-Means con ejemplos en Python. IArtificial.net. https://www.iartificial.net/clustering-agrupamiento-kmeans-ejemplos-en-python/
Mysiak, K. (2015). Explicación de la agrupación en clústeres de DBSCAN. Hacia la ciencia de datos. https://towardsdatascience.com/explaining-dbscan-clustering-18eaf5c83b31
Nainggolan, R. Perangin-angin, E. Simarmata, and A. F. Tarigan. (2019). Improved the performance of the k-means cluster using the sum of squared error (sse) optimized by using the elbow method. In Journal of Physics: Conference Series, volume 1361, page 012015. IOP Publishing.
Navarro Céspedes J. M. (2008). Análisis de Componentes Principales y Análisis de Regresión para datos categóricos. Aplicación en HTA. PhD thesis, Universidad Central “Marta Abreu” de Las Villas.
Patiño Garzón L. and A. M. Cardona Pérez. (2012). Revisión de algunos estudios sobre la deserción estudiantil universitaria en Colombia y Latinoamérica. Theoría: Ciencia, Arte y Humanidades, 21(1):9 – 20. ISSN 0717196X. URL https://search-ebscohost-com.craiustadigital.usantotomas.edu.co/login.aspx?direct=true&db=a9h&AN=112611591&lang=es&site=ehost-live.
Sánchez L. G., G. A. Osorio, and J. F. Suárez. (2008). Introducción a kernel acp y otros métodos espectrales aplicados al aprendizaje no supervisado. Revista Colombiana de Estadística, 31(1):19–40.
Suárez Rodríguez J. M. (2015). Caracterización de los hurtos a personas que afectan la localidad los mártires de la ciudad de Bogotá mediante el uso de los algoritmos de agrupamiento de minería de datos espaciales dbscan y k-means. Tesis de Ingeniería Catastral y Geodesia. Universidad Distrital Francisco José de Caldas.
Tinto V. (1975). Dropout from higher education: A theoretical synthesis of recent research. Review of Educational Research, 45(1):89–125. ISSN 00346543, 19351046. URL http://www.jstor.org/stable/1170024.
Toledo, J. A. J., & Pereira, S. R. T. (2015). Caracterización de la deserción estudiantil en educación superior con minería de datos. Revista Tecnológica-ESPOL, 28(5).
Vélez White C. et al. (2008). Deserción estudiantil en la educación superior colombiana. Elementos para su diagnóstico y Tratamiento. Ministerio de Educación Nacional. Bogotá. Colombia, pages 7–34
Vries, W. D., León Arenas, P., Romero Muñoz, J. F., & Hernández Saldaña, I. (2011). ¿Desertores o decepcionados? Distintas causas para abandonar los estudios universitarios. Revista de la educación superior, 40(160), 29-49.
Zúñiga, J. (2021). El algoritmo k-means aplicado a clasificación y procesamiento de imágenes. Disponible en https://www.unioviedo.es/compnum/laboratorios_py/kmeans/kmeans.html
Downloads
Publicado
Versões
- 2021-12-16 (4)
- 2021-12-16 (3)
- 2022-09-29 (2)
- 2021-12-16 (1)
Edição
Seção
Licença
Los autores que publican en esta revista están de acuerdo con los siguientes términos:
- Los autores ceden a la revista de manera no exclusiva sus derechos sobre el artículo para que la revista lo publique por primera vez al igual que licenciado bajo una Creative Commons Attribution License que permite a otros compartir el trabajo con un reconocimiento de la autoría del trabajo y la publicación inicial en esta revista.
- Los autores pueden establecer por separado acuerdos adicionales para la distribución no exclusiva de la versión de la obra publicada en la revista (por ejemplo, situarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en esta revista.
- Se permite y se anima a los autores a difundir sus trabajos electrónicamente (por ejemplo, en repositorios institucionales o en su propio sitio web) antes y durante el proceso de envío, ya que puede dar lugar a intercambios productivos, así como a una citación más temprana y mayor de los trabajos publicados (Véase The Effect of Open Access) (en inglés).
