Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes

En muchas situaciones prácticas, los datos se registran sobre un período de tiempo o corresponden a imágenes. Por esta razón, conviene considerarlos como realizaciones de un proceso estocástico en lugar de discretizarlos y estudiarlos como realizaciones de datos multivariados. Un método ampliamente...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Bali, Juan Lucas
Otros Autores: Boente, Graciela
Formato: Tesis doctoral publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2012
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n5153_Bali
Aporte de:
id tesis:tesis_n5153_Bali
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Español
orig_language_str_mv spa
topic ANALISIS DE COMPONENTES PRINCIPALES
COMPONENTES PRINCIPALES COMUNES
DATOS FUNCIONALES
ESTIMADORES ROBUSTOS
FUNCION DE INFLUENCIA
PENALIZACION
COMMON PRINCIPAL COMPONENTS MODEL
FUNCTIONAL DATA
INFLUENCE FUNCTION
PENALIZATION
PRINCIPAL COMPONENT ANALYSIS
ROBUST ESTIMATORS
spellingShingle ANALISIS DE COMPONENTES PRINCIPALES
COMPONENTES PRINCIPALES COMUNES
DATOS FUNCIONALES
ESTIMADORES ROBUSTOS
FUNCION DE INFLUENCIA
PENALIZACION
COMMON PRINCIPAL COMPONENTS MODEL
FUNCTIONAL DATA
INFLUENCE FUNCTION
PENALIZATION
PRINCIPAL COMPONENT ANALYSIS
ROBUST ESTIMATORS
Bali, Juan Lucas
Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes
topic_facet ANALISIS DE COMPONENTES PRINCIPALES
COMPONENTES PRINCIPALES COMUNES
DATOS FUNCIONALES
ESTIMADORES ROBUSTOS
FUNCION DE INFLUENCIA
PENALIZACION
COMMON PRINCIPAL COMPONENTS MODEL
FUNCTIONAL DATA
INFLUENCE FUNCTION
PENALIZATION
PRINCIPAL COMPONENT ANALYSIS
ROBUST ESTIMATORS
description En muchas situaciones prácticas, los datos se registran sobre un período de tiempo o corresponden a imágenes. Por esta razón, conviene considerarlos como realizaciones de un proceso estocástico en lugar de discretizarlos y estudiarlos como realizaciones de datos multivariados. Un método ampliamente usado para describir los principales modos de variación de las observaciones es el de componentes principales funcionales. Sin embargo, los procedimientos clásicos basados en el desvío estándar o el operador de covarianza muestral son muy sensibles a datos atípicos. Para resolver este problema, en esta tesis, se introducen estimadores robustos para las componentes principales mediante un enfoque basado en el método de projection–pursuit. Estimadores de projection–pursuit, para el caso finito– dimensional, fueron inicialmente propuestos en Huber (1981) como una forma de obtener estimadores robustos de la matriz de covarianza. Posteriormente, fueron considerados por Li y Chen (1985) para el problema de componentes principales como una aproximación directa al problema sin necesidad de obtener estimadores robustos de la matriz de escala (ver, también Huber, 1985). En esta tesis, se extiende dicha propuesta al caso funcional. Por otra parte, se consideran diversas variaciones de la misma que permiten obtener estimadores suaves mediante una penalización en la escala o en la norma, o bien, mediante una aproximación finito–dimensional sobre una base con elementos suaves. Bajo condiciones débiles de regularidad, se obtiene la continuidad del funcional asociado, de lo que se deduce la consistencia de los estimadores sin suavizar. Por otra parte, se prueba la consistencia de los estimadores que penalizan la norma y/o la escala así como la de una propuesta basada en aproximaciones por subespacios crecientes, bajo condiciones débiles. Mediante un estudio de simulación, se compara la performance de las propuestas clásicas y robustas bajo diferentes tipos de contaminación. Se complementa el estudio de los estimadores de proyección de las direcciones principales, obteniendo una expresión para la función de influencia del funcional asociado a la dirección principal y su tamaño. Las propuestas anteriores de estimación se extendieron al caso de k poblaciones que cumplen un modelo de componentes principales comunes funcional. Bajo dicho modelo, las diversas poblaciones presentan una estructura común en cuanto a su operador de dispersión compartiendo sus autofunciones y el orden de las mismas. Para ser más precisos, se definen estimadores robustos de projection–pursuit de las direcciones principales bajo un modelo de componentes principales comunes. Para las distintas propuestas, algunas de las cuales incluyen como antes diversos tipos de penalización, se prueba su consistencia, bajo condiciones débiles. Por otra parte, mediante un estudio de Monte Carlo, se estudia el comportamiento de los estimadores introducidos para muestras finitas, bajo diferentes modelos y tipos de contaminación. Finalmente, se proponen algoritmos que permiten calcular aproximaciones de cada una de las propuestas dadas. Se prueba la consistencia del estimador obtenido a través de dicho algoritmo. Mediante un estudio Monte Carlo, se analiza la velocidad de convergencia de dicha propuesta en el caso de procesos con trayectorias suaves e irregulares. Para estas últimas, se propone un método alternativo de cálculo.
author2 Boente, Graciela
author_facet Boente, Graciela
Bali, Juan Lucas
format Tesis doctoral
Tesis doctoral
publishedVersion
author Bali, Juan Lucas
author_sort Bali, Juan Lucas
title Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes
title_short Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes
title_full Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes
title_fullStr Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes
title_full_unstemmed Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes
title_sort métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2012
url https://hdl.handle.net/20.500.12110/tesis_n5153_Bali
work_keys_str_mv AT balijuanlucas metodosrobustosdeestimaciondecomponentesprincipalesfuncionalesyelmodelodecomponentesprincipalescomunes
AT balijuanlucas robustmethodsforestimationoffunctionalprincipalcomponentsandforthemodelofcommonprincipalcomponents
_version_ 1782022868736933888
spelling tesis:tesis_n5153_Bali2023-10-02T20:04:53Z Métodos robustos de estimación de componentes principales funcionales y el modelo de componentes principales comunes Robust methods for estimation of functional principal components and for the model of common principal components Bali, Juan Lucas Boente, Graciela ANALISIS DE COMPONENTES PRINCIPALES COMPONENTES PRINCIPALES COMUNES DATOS FUNCIONALES ESTIMADORES ROBUSTOS FUNCION DE INFLUENCIA PENALIZACION COMMON PRINCIPAL COMPONENTS MODEL FUNCTIONAL DATA INFLUENCE FUNCTION PENALIZATION PRINCIPAL COMPONENT ANALYSIS ROBUST ESTIMATORS En muchas situaciones prácticas, los datos se registran sobre un período de tiempo o corresponden a imágenes. Por esta razón, conviene considerarlos como realizaciones de un proceso estocástico en lugar de discretizarlos y estudiarlos como realizaciones de datos multivariados. Un método ampliamente usado para describir los principales modos de variación de las observaciones es el de componentes principales funcionales. Sin embargo, los procedimientos clásicos basados en el desvío estándar o el operador de covarianza muestral son muy sensibles a datos atípicos. Para resolver este problema, en esta tesis, se introducen estimadores robustos para las componentes principales mediante un enfoque basado en el método de projection–pursuit. Estimadores de projection–pursuit, para el caso finito– dimensional, fueron inicialmente propuestos en Huber (1981) como una forma de obtener estimadores robustos de la matriz de covarianza. Posteriormente, fueron considerados por Li y Chen (1985) para el problema de componentes principales como una aproximación directa al problema sin necesidad de obtener estimadores robustos de la matriz de escala (ver, también Huber, 1985). En esta tesis, se extiende dicha propuesta al caso funcional. Por otra parte, se consideran diversas variaciones de la misma que permiten obtener estimadores suaves mediante una penalización en la escala o en la norma, o bien, mediante una aproximación finito–dimensional sobre una base con elementos suaves. Bajo condiciones débiles de regularidad, se obtiene la continuidad del funcional asociado, de lo que se deduce la consistencia de los estimadores sin suavizar. Por otra parte, se prueba la consistencia de los estimadores que penalizan la norma y/o la escala así como la de una propuesta basada en aproximaciones por subespacios crecientes, bajo condiciones débiles. Mediante un estudio de simulación, se compara la performance de las propuestas clásicas y robustas bajo diferentes tipos de contaminación. Se complementa el estudio de los estimadores de proyección de las direcciones principales, obteniendo una expresión para la función de influencia del funcional asociado a la dirección principal y su tamaño. Las propuestas anteriores de estimación se extendieron al caso de k poblaciones que cumplen un modelo de componentes principales comunes funcional. Bajo dicho modelo, las diversas poblaciones presentan una estructura común en cuanto a su operador de dispersión compartiendo sus autofunciones y el orden de las mismas. Para ser más precisos, se definen estimadores robustos de projection–pursuit de las direcciones principales bajo un modelo de componentes principales comunes. Para las distintas propuestas, algunas de las cuales incluyen como antes diversos tipos de penalización, se prueba su consistencia, bajo condiciones débiles. Por otra parte, mediante un estudio de Monte Carlo, se estudia el comportamiento de los estimadores introducidos para muestras finitas, bajo diferentes modelos y tipos de contaminación. Finalmente, se proponen algoritmos que permiten calcular aproximaciones de cada una de las propuestas dadas. Se prueba la consistencia del estimador obtenido a través de dicho algoritmo. Mediante un estudio Monte Carlo, se analiza la velocidad de convergencia de dicha propuesta en el caso de procesos con trayectorias suaves e irregulares. Para estas últimas, se propone un método alternativo de cálculo. In many practical situations, data are recorded over a period of time or may correspond to images. In these situations, it is preferable to consider them as samples of an stochastic process instead of discretizing and studying them as multivariate data samples. A technique widely used to describe the observations principal modes of variations is the functional principal components analysis. The classical procedures based on the standard deviation or the sample covariance are very sensitive to atypical data. To overcome this problem, in this thesis, we introduce robust estimators for the principal components using a projection–pursuit approach. In the multivariate setting, projection–pursuit estimators were initially proposed in Huber(1981) as a way to obtain robust estimators of the covariance matrix. They were then considered by Li and Chen (1985) to perform a robust principal component analysis without passing by a robust estimate of the covariance matrix (see also, Huber, 1985). In this thesis, we extend that proposal to the functional case. On the other hand, we consider other alternatives which allow us to obtain smooth estimators of the principal directions using either a penalization on the scale or the norm or through a sieve approach which consists in considering an increasing sequence of finite–dimensional spaces spanned by a basis with smooth elements. Under mild regularity conditions, we derive the continuity of the associated functional which entails the consistency of the non–smoothed estimators. On the other hand, we show that the estimators defined penalizing the norm and/or the scale and those based on the sieve approach are consistent. Through a simulation study, we compare the performance of the classical and robust proposals under different contamination models. We complete the study of the projection–based estimators of principal directions, obtaining an expression for the influence function of the functional related to the principal direction and its size. The previous proposals are extended to k populations satisfying a functional common principal component model. Under this model, the populations have a common dispersion structure, since the dispersion operators share the same eigenfunctions and their order. More precisely, we introduce robust projection– pursuit estimators of the principal directions under functional common principal components model. We derive the consistency of the the different proposals, some of which include penalization terms. On the other hand, through a Monte Carlo study, we the performance of the robust estimators is compared to that of the classical one, under different models and contaminations. Finally, we propose algorithms that allow to compute approximations for each of the robust proposals given. The estimators obtained through that algorithm turn out to be consistent. Using a Monte Carlo study, we analyse the convergence rate of the proposals when the observations have smooth or rugged trajectories. For the latter, we propose an alternative method of computation. Fil: Bali, Juan Lucas. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2012 info:eu-repo/semantics/doctoralThesis info:ar-repo/semantics/tesis doctoral info:eu-repo/semantics/publishedVersion application/pdf spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/tesis_n5153_Bali