CatBoost: Aprendizaje automático de conjunto para la analítica de los factores socioeconómicos que inciden en el rendimiento escolar

El rendimiento académico de los niños es una importante tarea para las escuelas y es de atracción desde el campo de la ciencia de datos que atiende esta problemática multifactorial con diversas técnicas de minería de datos sobre conjuntos de datos cada vez más completos que abordan factores s...

Full description

Saved in:
Bibliographic Details
Main Authors: Jorge Iván Pincay Ponce (Author), Armando E. De Giusti (Author), Diana Alexandra Sánchez Andrade (Author), Juan Alberto Figueroa Suárez (Author)
Format: Book
Published: Red de Universidades Nacionales con Carreras de Informática, 2024-06-01T00:00:00Z.
Subjects:
Online Access:Connect to this object online.
Tags: Add Tag
No Tags, Be the first to tag this record!

MARC

LEADER 00000 am a22000003u 4500
001 doaj_fbdf00922f51465fb48e1eab121a54b6
042 |a dc 
100 1 0 |a Jorge Iván Pincay Ponce  |e author 
700 1 0 |a Armando E. De Giusti  |e author 
700 1 0 |a Diana Alexandra Sánchez Andrade  |e author 
700 1 0 |a Juan Alberto Figueroa Suárez  |e author 
245 0 0 |a CatBoost: Aprendizaje automático de conjunto para la analítica de los factores socioeconómicos que inciden en el rendimiento escolar 
260 |b Red de Universidades Nacionales con Carreras de Informática,   |c 2024-06-01T00:00:00Z. 
500 |a 10.24215/18509959.38.e3 
500 |a 1851-0086 
500 |a 1850-9959 
520 |a El rendimiento académico de los niños es una importante tarea para las escuelas y es de atracción desde el campo de la ciencia de datos que atiende esta problemática multifactorial con diversas técnicas de minería de datos sobre conjuntos de datos cada vez más completos que abordan factores socioeconómicos como posibles condicionantes. Presentamos un método que mejora la Exactitud de la predicción del rendimiento escolar combinando la aplicación del modelo de aprendizaje automático en conjunto CatBoost con la explicación y mejora de la transparencia de la clasificación que efectúa, mediante la puntuación de las características con base en los valores SHAP (SHapley Additive exPlanations). Se dispone de cuatro tipos de promedios: Domina los aprendizajes requeridos (DAR), Alcanza los aprendizajes requeridos (AAR), Próximo a alcanzar los aprendizajes requeridos (PAAR) y No alcanza los aprendizajes requeridos (NAAR). Cómo los tipos de promedios PAAR y NAAR constituyen clases minoritarias fueron balanceados respecto de las clases mayoritarias DAR y AAR. Se alcanzó una Exactitud y Precisión del 91%. Las características de mayor impacto en la predicción son las habilidades sociales, la ocupación del padre, ingreso familiar, género, posible discapacidad, comportamiento, estructura familiar, número de hermanos, entre otros. 
546 |a ES 
546 |a PT 
690 |a Aprendizaje automático 
690 |a CatBoost 
690 |a Shapley 
690 |a Rendimiento académico 
690 |a métodos de ensamble 
690 |a Education 
690 |a L 
690 |a Special aspects of education 
690 |a LC8-6691 
655 7 |a article  |2 local 
786 0 |n Revista Iberoamericana de Tecnología en Educación y Educación en Tecnología, Iss 38 (2024) 
787 0 |n https://teyet-revista.info.unlp.edu.ar/TEyET/article/view/2492 
787 0 |n https://doaj.org/toc/1851-0086 
787 0 |n https://doaj.org/toc/1850-9959 
856 4 1 |u https://doaj.org/article/fbdf00922f51465fb48e1eab121a54b6  |z Connect to this object online.