Visualización y métodos de imputación de datos faltantes en la Encuesta de Gasto en los Hogares

La presencia de no respuesta es una de las principales dificultades que se presentan en las encuestas. La no respuesta puede ser total o parcial, existiendo una variedad de soluciones dependiendo de la situación. Si la no respuesta es parcial, la imputación de los valores perdidos es una opción usua...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Bussi, Javier, Hernández, Lucia Noelia, Marí, Gonzalo Pablo Domingo, Méndez, Fernanda, Mitas, Gerardo
Otros Autores: Secretaría de Ciencia y Tecnología. Facultad de Ciencias Económicas y Estadística. Universidad Nacional de Rosario
Formato: conferenceObject documento de conferencia
Lenguaje:Español
Publicado: 2019
Materias:
Acceso en línea:http://hdl.handle.net/2133/14011
http://hdl.handle.net/2133/14011
Aporte de:
id I15-R121-2133-14011
record_format dspace
institution Universidad Nacional de Rosario
institution_str I-15
repository_str R-121
collection Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR)
language Español
orig_language_str_mv spa
topic Encuesta de Gastos de los Hogares
imputación
MissForest
spellingShingle Encuesta de Gastos de los Hogares
imputación
MissForest
Bussi, Javier
Hernández, Lucia Noelia
Marí, Gonzalo Pablo Domingo
Méndez, Fernanda
Mitas, Gerardo
Visualización y métodos de imputación de datos faltantes en la Encuesta de Gasto en los Hogares
topic_facet Encuesta de Gastos de los Hogares
imputación
MissForest
description La presencia de no respuesta es una de las principales dificultades que se presentan en las encuestas. La no respuesta puede ser total o parcial, existiendo una variedad de soluciones dependiendo de la situación. Si la no respuesta es parcial, la imputación de los valores perdidos es una opción usualmente utilizada. En el año 2018, se propuso en el Instituto Nacional de Estadística y Censos (INDEC), una revisión de los métodos de imputación aplicados a la Encuesta Nacional de Gastos de los Hogares (ENGHo). El método missForest (Stekhoven y Bühlmann, 2012) es un método de imputación no paramétrico cuyo algoritmo consiste en un proceso iterativo que asigna valores iniciales a los datos perdidos, construye un Forest ajustado el cual permite predecir nuevos datos imputados para cada una de las variables involucradas, y repite este procedimiento hasta su convergencia. En este trabajo se compara este método de imputación con otros métodos sugeridos en la bibliografía aplicados a los datos obtenidos en la ENGHo 2017-2018. Los métodos incluidos en la comparación son: Random Hot Deck (RHD), Vecino más cercano (VMC), Algoritmo Expectation-Maximization (EM), Amelia y Mice. Se determinó que la pérdida podía ser considerada completamente al azar, siendo este patrón uno de los escenarios planteados. Por otra parte, se consideró otro esquema de pérdida en la variable de interés basado en la variable estrato de áreas. Bajo ambos patrones de pérdida, se consideraron distintos porcentajes de valores perdidos. En todos los escenarios planteados, el método iterativo missForest presentó valores de Error Cuadrático Medio Normalizado (NRMSE) inferiores a los competidores, siendo el método Mice el que obtuvo valores similares, si bien en todos los casos levemente superiores. Con respecto a los tiempos de procesamiento, este último método presentó tiempos promedios muy superiores al resto de los métodos, siendo el missForest claramente el segundo método con tiempos promedios de cómputo más altos, pero aun así notablemente inferiores a los del Mice.
author2 Secretaría de Ciencia y Tecnología. Facultad de Ciencias Económicas y Estadística. Universidad Nacional de Rosario
author_facet Secretaría de Ciencia y Tecnología. Facultad de Ciencias Económicas y Estadística. Universidad Nacional de Rosario
Bussi, Javier
Hernández, Lucia Noelia
Marí, Gonzalo Pablo Domingo
Méndez, Fernanda
Mitas, Gerardo
format conferenceObject
documento de conferencia
author Bussi, Javier
Hernández, Lucia Noelia
Marí, Gonzalo Pablo Domingo
Méndez, Fernanda
Mitas, Gerardo
author_sort Bussi, Javier
title Visualización y métodos de imputación de datos faltantes en la Encuesta de Gasto en los Hogares
title_short Visualización y métodos de imputación de datos faltantes en la Encuesta de Gasto en los Hogares
title_full Visualización y métodos de imputación de datos faltantes en la Encuesta de Gasto en los Hogares
title_fullStr Visualización y métodos de imputación de datos faltantes en la Encuesta de Gasto en los Hogares
title_full_unstemmed Visualización y métodos de imputación de datos faltantes en la Encuesta de Gasto en los Hogares
title_sort visualización y métodos de imputación de datos faltantes en la encuesta de gasto en los hogares
publishDate 2019
url http://hdl.handle.net/2133/14011
http://hdl.handle.net/2133/14011
work_keys_str_mv AT bussijavier visualizacionymetodosdeimputaciondedatosfaltantesenlaencuestadegastoenloshogares
AT hernandezlucianoelia visualizacionymetodosdeimputaciondedatosfaltantesenlaencuestadegastoenloshogares
AT marigonzalopablodomingo visualizacionymetodosdeimputaciondedatosfaltantesenlaencuestadegastoenloshogares
AT mendezfernanda visualizacionymetodosdeimputaciondedatosfaltantesenlaencuestadegastoenloshogares
AT mitasgerardo visualizacionymetodosdeimputaciondedatosfaltantesenlaencuestadegastoenloshogares
bdutipo_str Repositorios
_version_ 1764820408135057410