Estimación de las principales causas de la deserción universitaria mediante el uso de técnicas de machine learning
Publicado 2021-12-16 — Actualizado el 2022-09-29
Versiones
- 2021-12-16 (4)
- 2021-12-16 (3)
- 2022-09-29 (2)
- 2021-12-16 (1)
Palabras clave
- Deserción,
- muestreo,
- multivariado,
- machine learning,
- componentes principales
- agrupamiento,
- k-means ...Más
Cómo citar
Resumen
Según el reporte del banco mundial para el año 2015, la deserción estudiantil universitaria en Colombia había llegado a una tasa del 42%, ocupando el segundo lugar en Latinoamérica, lo que refleja una problemática social y económica de gran impacto. De acuerdo con lo anterior, el presente estudio realiza un análisis para identificar las causas que influyeron en la deserción estudiantil de una Institución de Educación Superior en la ciudad de Bogotá, aplicando técnicas computacionales como el Machine Learning. Para la identificación de las causas se emplearon técnicas del aprendizaje no supervisado como el análisis de componentes principales (PCA) y la descomposición en valores singulares (SVD) para la reducción de la dimensionalidad a 24 componentes con el 71% de la variabilidad explicada y el algoritmo de k-means posibilitó el agrupamiento en tres grupos con información recolectada de 207 estudiantes que desertaron durante el 2020. Este análisis permite establecer patrones de asociación entre algunas variables como los aspectos institucionales, encontrando semejanzas y diferencias, además de la identificación de factores de deserción relevantes en la población, siendo las dificultades económicas la principal causa de deserción en hombres (67.6%) de los programas de ingeniería mecánica y ambiental.
Descargas
Citas
- Bacos, C. A. Machine learning and education in the human age: a review of emerging technologies. In Science and information conference (pp. 536-543). Springer, Cham. (2019, April)
- Bravo Núñez A. et al. Reducción de dimensiones: revisión y aplicaciones en clasificación automática. 2020.
- Casanova, J. R., Cervero Fernández-Castañón, A., Núñez Pérez, J. C., Almeida, L. S., & Bernardo Gutiérrez, A. B. (2018). Factors that determine the persistence and dropout of university students. Psicothema, 30.
- Castiblanco W. Modelo de ausentismo y deserción retención y permanencia estudiantil en la universidad ECCI. 2020.
- Castillo, G. T. U., & Sánchez, B. A. M. (2021). Factores que inciden en la deserción universitaria. TZHOECOEN, 13(2), 56-65.
- Chaves, V. E. J., & Torres, M. G. (2019). Análisis de la Educación Inicial en Paraguay a través de las Técnicas de Aprendizaje Automático. Revista de la Sociedad Científica del Paraguay, 24(2), 293-304.
- Giraldo Otálvaro, J. D. (2021). Estudio de las técnicas de reducción de dimensión basadas en componentes principales: Análisis de componentes principales no lineales.
- Gutiérrez, D., Díaz, J. F. V., & López, J. (2021). Indicadores de deserción universitaria y factores asociados. EducaT: Educación virtual, Innovación y Tecnologías, 2(1), 15-26.
- Hernández Sampieri, Roberto. (2018). Metodología de la investigación: las rutas: cuantitativa y cualitativa y mixta. México: Mc Graw Hill- educación.
- Jolliffe, IT (2002). Representación gráfica de datos utilizando componentes principales. Análisis de componentes principales, 78-110.
- Kuvcak, Danijel y Jurieié. (2018). Aprendizaje máquina en educación: Una encuesta de las tendencias actuales de investigación. Annals of DAAAM Proceedings.
- Martínez, J. (2022). Clustering (Agrupamiento), K-Means con ejemplos en Python. IArtificial.net. https://www.iartificial.net/clustering-agrupamiento-kmeans-ejemplos-en-python/
- Mysiak, K. (2015). Explicación de la agrupación en clústeres de DBSCAN. Hacia la ciencia de datos. https://towardsdatascience.com/explaining-dbscan-clustering-18eaf5c83b31
- Nainggolan, R. Perangin-angin, E. Simarmata, and A. F. Tarigan. (2019). Improved the performance of the k-means cluster using the sum of squared error (sse) optimized by using the elbow method. In Journal of Physics: Conference Series, volume 1361, page 012015. IOP Publishing.
- Navarro Céspedes J. M. (2008). Análisis de Componentes Principales y Análisis de Regresión para datos categóricos. Aplicación en HTA. PhD thesis, Universidad Central “Marta Abreu” de Las Villas.
- Patiño Garzón L. and A. M. Cardona Pérez. (2012). Revisión de algunos estudios sobre la deserción estudiantil universitaria en Colombia y Latinoamérica. Theoría: Ciencia, Arte y Humanidades, 21(1):9 – 20. ISSN 0717196X. URL https://search-ebscohost-com.craiustadigital.usantotomas.edu.co/login.aspx?direct=true&db=a9h&AN=112611591&lang=es&site=ehost-live.
- Sánchez L. G., G. A. Osorio, and J. F. Suárez. (2008). Introducción a kernel acp y otros métodos espectrales aplicados al aprendizaje no supervisado. Revista Colombiana de Estadística, 31(1):19–40.
- Suárez Rodríguez J. M. (2015). Caracterización de los hurtos a personas que afectan la localidad los mártires de la ciudad de Bogotá mediante el uso de los algoritmos de agrupamiento de minería de datos espaciales dbscan y k-means. Tesis de Ingeniería Catastral y Geodesia. Universidad Distrital Francisco José de Caldas.
- Tinto V. (1975). Dropout from higher education: A theoretical synthesis of recent research. Review of Educational Research, 45(1):89–125. ISSN 00346543, 19351046. URL http://www.jstor.org/stable/1170024.
- Toledo, J. A. J., & Pereira, S. R. T. (2015). Caracterización de la deserción estudiantil en educación superior con minería de datos. Revista Tecnológica-ESPOL, 28(5).
- Vélez White C. et al. (2008). Deserción estudiantil en la educación superior colombiana. Elementos para su diagnóstico y Tratamiento. Ministerio de Educación Nacional. Bogotá. Colombia, pages 7–34
- Vries, W. D., León Arenas, P., Romero Muñoz, J. F., & Hernández Saldaña, I. (2011). ¿Desertores o decepcionados? Distintas causas para abandonar los estudios universitarios. Revista de la educación superior, 40(160), 29-49.
- Zúñiga, J. (2021). El algoritmo k-means aplicado a clasificación y procesamiento de imágenes. Disponible en https://www.unioviedo.es/compnum/laboratorios_py/kmeans/kmeans.html