Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca

Ayala-Yaguara, Holmes Yesid; Valenzuela-Sabogal, Gina Maribel; Espinosa-García, Alexander

doi:10.21158/23823399.v7.n0.2019.2676

Titulo:

Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca
.

Sumario:

En el presente artículo se describe la obtención de un modelo de minería de datos aplicado al problema de la deserción universitaria en el programa de Ingeniería de Sistemas de la Universidad de Cundinamarca, extensión Facatativá. El modelo se estructuró mediante la metodología de minería de datos KDD (knowledge discovery in databases) haciendo uso del lenguaje de programación Python, la librería de procesamiento de datos Pandas y de machine learning Sklearn. Para el proceso se tuvieron en cuenta problemas adicionales al proceso de minería, como, por ejemplo, la alta dimensionalidad, por lo cual se aplicaron los métodos de selección de las variables estadístico univariado, feature importance y SelectFromModel (Sklearn). En el proyecto se se... Ver más

Guardado en:

Revista:

Revista Ontare

ISSN:

2382-3399

EISSN:

2745-2220

Autores:

Ayala-Yaguara, Holmes Yesid

Valenzuela-Sabogal, Gina Maribel

Espinosa-García, Alexander

Editor:

UNIVERSIDAD EAN

DOI:

10.21158/23823399.v7.n0.2019.2676

Volumen:

Año de publicación:

2020-04-11

Pagina inicial:

134

Pagina final:

150

Pais:

Colombia

Palabras claves:

Minería de datos

Deserción universitaria

Universidad de Cundinamarca, extensión Facatativá

Análisis de regresión logística

Licencia:

Revista Ontare - 2019

info:eu-repo/semantics/openAccess

http://purl.org/coar/access_right/c_abf2

Descripción
Sumario:	En el presente artículo se describe la obtención de un modelo de minería de datos aplicado al problema de la deserción universitaria en el programa de Ingeniería de Sistemas de la Universidad de Cundinamarca, extensión Facatativá. El modelo se estructuró mediante la metodología de minería de datos KDD (knowledge discovery in databases) haciendo uso del lenguaje de programación Python, la librería de procesamiento de datos Pandas y de machine learning Sklearn. Para el proceso se tuvieron en cuenta problemas adicionales al proceso de minería, como, por ejemplo, la alta dimensionalidad, por lo cual se aplicaron los métodos de selección de las variables estadístico univariado, feature importance y SelectFromModel (Sklearn). En el proyecto se seleccionaron cinco técnicas de minería de datos para evaluarlas: vecinos más cercanos (K nearest neighbors, KNN), árboles de decisión (decision tree, DT), árboles aleatorios (random forest, RF), regresión logística (logistic regression, LR) y máquinas de vectores soporte (support vector machines, SVM). Respecto a la selección del modelo final se evaluaron los resultados de cada modelo en las métricas de precisión, matriz de confusión y métricas adicionales de la matriz de confusión. Por último, se ajustaron los parámetros del modelo seleccionado y se evaluó la generalización del modelo al graficar su curva de aprendizaje.
ISSN:	2382-3399

Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca .

Código QR

Estadísticas y Métricas Alternativas

Títulos similares

Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca
.