Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales
El presente trabajo analiza y compara la precisión de dos algoritmos de aprendizaje automático supervisado -Random Forest y Redes Neuronales- en la imputación de datos faltantes en encuestas escolares. A partir de la base de datos correspondiente a los cuestionarios complementarios respondidos por e...
Guardado en:
| Autor principal: | |
|---|---|
| Formato: | Trabajo final de especialización |
| Lenguaje: | Español |
| Publicado: |
2025
|
| Materias: | |
| Acceso en línea: | https://hdl.handle.net/20.500.14769/5112 |
| Aporte de: |
| id |
I32-R138-20.500.14769-5112 |
|---|---|
| record_format |
dspace |
| spelling |
I32-R138-20.500.14769-51122025-10-13T17:37:36Z Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales Saguier, Malena DATOS FALTANTES, DATOS MISSING, APRENDIZAJE AUTOMÁTICO SUPERVISADO, RANDOM FOREST, REDES NEURONALES ARTIFICIALES, IMPUTACIÓN, ENCUESTAS ESCOLARES El presente trabajo analiza y compara la precisión de dos algoritmos de aprendizaje automático supervisado -Random Forest y Redes Neuronales- en la imputación de datos faltantes en encuestas escolares. A partir de la base de datos correspondiente a los cuestionarios complementarios respondidos por estudiantes de sexto grado del nivel primario de la Ciudad Autónoma de Buenos Aires en el marco del operativo nacional de evaluación Aprender 2023, se simulan valores perdidos en variables vinculadas a la construcción del índice de nivel socioeconómico con el fin de aplicar ambos modelos. Los valores faltantes se generaron de forma artificial siguiendo un mecanismo de pérdida completamente aleatorio (MCAR), lo que permite evaluar la capacidad predictiva de los modelos en un entorno controlado. El estudio analiza el desempeño de cada algoritmo sobre dos variables objetivo de diferente nivel de medición (nominal y ordinal) y complejidad (binaria y con múltiples categorías), a partir de métricas de precisión derivadas de la matriz de confusión. El objetivo es contribuir a la incorporación de estrategias de imputación más modernas en el ámbito educativo, en reemplazo o complemento de enfoques tradicionales, promoviendo la mejora de la calidad de las estimaciones. 2025-10-13T17:37:04Z 2025-10-13T17:37:04Z 2025-05-23 Trabajo final de especialización https://hdl.handle.net/20.500.14769/5112 es application/pdf |
| institution |
Instituto Tecnológico de Buenos Aires (ITBA) |
| institution_str |
I-32 |
| repository_str |
R-138 |
| collection |
Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA) |
| language |
Español |
| topic |
DATOS FALTANTES, DATOS MISSING, APRENDIZAJE AUTOMÁTICO SUPERVISADO, RANDOM FOREST, REDES NEURONALES ARTIFICIALES, IMPUTACIÓN, ENCUESTAS ESCOLARES |
| spellingShingle |
DATOS FALTANTES, DATOS MISSING, APRENDIZAJE AUTOMÁTICO SUPERVISADO, RANDOM FOREST, REDES NEURONALES ARTIFICIALES, IMPUTACIÓN, ENCUESTAS ESCOLARES Saguier, Malena Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales |
| topic_facet |
DATOS FALTANTES, DATOS MISSING, APRENDIZAJE AUTOMÁTICO SUPERVISADO, RANDOM FOREST, REDES NEURONALES ARTIFICIALES, IMPUTACIÓN, ENCUESTAS ESCOLARES |
| description |
El presente trabajo analiza y compara la precisión de dos algoritmos de aprendizaje automático supervisado -Random Forest y Redes Neuronales- en la imputación de datos faltantes en encuestas escolares. A partir de la base de datos correspondiente a los cuestionarios complementarios respondidos por estudiantes de sexto grado del nivel primario de la Ciudad Autónoma de Buenos Aires en el marco del operativo nacional de evaluación Aprender 2023, se simulan valores perdidos en variables vinculadas a la construcción del índice de nivel socioeconómico con el fin de aplicar ambos modelos.
Los valores faltantes se generaron de forma artificial siguiendo un mecanismo de pérdida completamente aleatorio (MCAR), lo que permite evaluar la capacidad predictiva de los modelos en un entorno controlado. El estudio analiza el desempeño de cada algoritmo sobre dos variables objetivo de diferente nivel de medición (nominal y ordinal) y complejidad (binaria y con múltiples categorías), a partir de métricas de precisión derivadas de la matriz de confusión.
El objetivo es contribuir a la incorporación de estrategias de imputación más modernas en el ámbito educativo, en reemplazo o complemento de enfoques tradicionales, promoviendo la mejora de la calidad de las estimaciones. |
| format |
Trabajo final de especialización |
| author |
Saguier, Malena |
| author_facet |
Saguier, Malena |
| author_sort |
Saguier, Malena |
| title |
Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales |
| title_short |
Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales |
| title_full |
Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales |
| title_fullStr |
Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales |
| title_full_unstemmed |
Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales |
| title_sort |
imputación de datos faltantes en encuestas escolares: comparación entre random forest y redes neuronales artificiales |
| publishDate |
2025 |
| url |
https://hdl.handle.net/20.500.14769/5112 |
| work_keys_str_mv |
AT saguiermalena imputaciondedatosfaltantesenencuestasescolarescomparacionentrerandomforestyredesneuronalesartificiales |
| _version_ |
1845932228628971520 |