Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales

El presente trabajo analiza y compara la precisión de dos algoritmos de aprendizaje automático supervisado -Random Forest y Redes Neuronales- en la imputación de datos faltantes en encuestas escolares. A partir de la base de datos correspondiente a los cuestionarios complementarios respondidos por e...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Saguier, Malena
Formato: Trabajo final de especialización
Lenguaje:Español
Publicado: 2025
Materias:
Acceso en línea:https://hdl.handle.net/20.500.14769/5112
Aporte de:
id I32-R138-20.500.14769-5112
record_format dspace
spelling I32-R138-20.500.14769-51122025-10-13T17:37:36Z Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales Saguier, Malena DATOS FALTANTES, DATOS MISSING, APRENDIZAJE AUTOMÁTICO SUPERVISADO, RANDOM FOREST, REDES NEURONALES ARTIFICIALES, IMPUTACIÓN, ENCUESTAS ESCOLARES El presente trabajo analiza y compara la precisión de dos algoritmos de aprendizaje automático supervisado -Random Forest y Redes Neuronales- en la imputación de datos faltantes en encuestas escolares. A partir de la base de datos correspondiente a los cuestionarios complementarios respondidos por estudiantes de sexto grado del nivel primario de la Ciudad Autónoma de Buenos Aires en el marco del operativo nacional de evaluación Aprender 2023, se simulan valores perdidos en variables vinculadas a la construcción del índice de nivel socioeconómico con el fin de aplicar ambos modelos. Los valores faltantes se generaron de forma artificial siguiendo un mecanismo de pérdida completamente aleatorio (MCAR), lo que permite evaluar la capacidad predictiva de los modelos en un entorno controlado. El estudio analiza el desempeño de cada algoritmo sobre dos variables objetivo de diferente nivel de medición (nominal y ordinal) y complejidad (binaria y con múltiples categorías), a partir de métricas de precisión derivadas de la matriz de confusión. El objetivo es contribuir a la incorporación de estrategias de imputación más modernas en el ámbito educativo, en reemplazo o complemento de enfoques tradicionales, promoviendo la mejora de la calidad de las estimaciones. 2025-10-13T17:37:04Z 2025-10-13T17:37:04Z 2025-05-23 Trabajo final de especialización https://hdl.handle.net/20.500.14769/5112 es application/pdf
institution Instituto Tecnológico de Buenos Aires (ITBA)
institution_str I-32
repository_str R-138
collection Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA)
language Español
topic DATOS FALTANTES, DATOS MISSING, APRENDIZAJE AUTOMÁTICO SUPERVISADO, RANDOM FOREST, REDES NEURONALES ARTIFICIALES, IMPUTACIÓN, ENCUESTAS ESCOLARES
spellingShingle DATOS FALTANTES, DATOS MISSING, APRENDIZAJE AUTOMÁTICO SUPERVISADO, RANDOM FOREST, REDES NEURONALES ARTIFICIALES, IMPUTACIÓN, ENCUESTAS ESCOLARES
Saguier, Malena
Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales
topic_facet DATOS FALTANTES, DATOS MISSING, APRENDIZAJE AUTOMÁTICO SUPERVISADO, RANDOM FOREST, REDES NEURONALES ARTIFICIALES, IMPUTACIÓN, ENCUESTAS ESCOLARES
description El presente trabajo analiza y compara la precisión de dos algoritmos de aprendizaje automático supervisado -Random Forest y Redes Neuronales- en la imputación de datos faltantes en encuestas escolares. A partir de la base de datos correspondiente a los cuestionarios complementarios respondidos por estudiantes de sexto grado del nivel primario de la Ciudad Autónoma de Buenos Aires en el marco del operativo nacional de evaluación Aprender 2023, se simulan valores perdidos en variables vinculadas a la construcción del índice de nivel socioeconómico con el fin de aplicar ambos modelos. Los valores faltantes se generaron de forma artificial siguiendo un mecanismo de pérdida completamente aleatorio (MCAR), lo que permite evaluar la capacidad predictiva de los modelos en un entorno controlado. El estudio analiza el desempeño de cada algoritmo sobre dos variables objetivo de diferente nivel de medición (nominal y ordinal) y complejidad (binaria y con múltiples categorías), a partir de métricas de precisión derivadas de la matriz de confusión. El objetivo es contribuir a la incorporación de estrategias de imputación más modernas en el ámbito educativo, en reemplazo o complemento de enfoques tradicionales, promoviendo la mejora de la calidad de las estimaciones.
format Trabajo final de especialización
author Saguier, Malena
author_facet Saguier, Malena
author_sort Saguier, Malena
title Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales
title_short Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales
title_full Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales
title_fullStr Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales
title_full_unstemmed Imputación de datos faltantes en encuestas escolares: comparación entre Random Forest y Redes Neuronales Artificiales
title_sort imputación de datos faltantes en encuestas escolares: comparación entre random forest y redes neuronales artificiales
publishDate 2025
url https://hdl.handle.net/20.500.14769/5112
work_keys_str_mv AT saguiermalena imputaciondedatosfaltantesenencuestasescolarescomparacionentrerandomforestyredesneuronalesartificiales
_version_ 1845932228628971520