Métodos robustos en correlación canónica funcional

En diversas aplicaciones, resulta de interés poder medir la asociación entre dos características que se observan sobre los individuos de una población. Por otra parte, muchas vecesestas características se registran sobre un período de tiempo o corresponden a imágenes. Poresta razón, conviene conside...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Alvarez, Agustín
Otros Autores: Boente Boente, Graciela Lina
Formato: Tesis doctoral publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2017
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n6188_Alvarez
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n6188_Alvarez_oai
Aporte de:
id I28-R145-tesis_n6188_Alvarez_oai
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-145
collection Repositorio Digital de la Universidad de Buenos Aires (UBA)
language Español
orig_language_str_mv spa
topic CORRELACION CANONICA
DATOS FUNCIONALES
ESPACIOS APROXIMANTES
ROBUSTEZ
CANONICAL CORRELATION
FUNCTIONAL DATA
ROBUSTNESS
SIEVES
spellingShingle CORRELACION CANONICA
DATOS FUNCIONALES
ESPACIOS APROXIMANTES
ROBUSTEZ
CANONICAL CORRELATION
FUNCTIONAL DATA
ROBUSTNESS
SIEVES
Alvarez, Agustín
Métodos robustos en correlación canónica funcional
topic_facet CORRELACION CANONICA
DATOS FUNCIONALES
ESPACIOS APROXIMANTES
ROBUSTEZ
CANONICAL CORRELATION
FUNCTIONAL DATA
ROBUSTNESS
SIEVES
description En diversas aplicaciones, resulta de interés poder medir la asociación entre dos características que se observan sobre los individuos de una población. Por otra parte, muchas vecesestas características se registran sobre un período de tiempo o corresponden a imágenes. Poresta razón, conviene considerarlos como realizaciones de un proceso estocástico en lugar dediscretizarlos y estudiarlos como realizaciones de datos multivariados. Un método ampliamenteutilizado para lograr este objetivo es el análisis de correlación canónica funcional. Leurgans et al. (1993) prueban que la extensión natural de los estimadores utilizados en elcaso multivariado al funcional no resulta consistente para la primera correlación canónica. Poresta razón, dichos autores proponen estimadores que penalizan la rugosidad de las direccionesy prueban que resultan consistentes. Por otro lado, He et al. (2003) dan condiciones quegarantizan la buena definición de las correlaciones y direcciones canónicas para elementosaleatorios (X; Y )^t a valores en el espacio de Hilbert L²(0, 1) x L² (0, 1). Los trabajos mencionados consideran como medida de asociación la correlación de Pearson. Sin embargo, es bien sabido, que esta medida es muy sensible a la presencia de datosatípicos. Con el fin de lidiar con este problema, en el caso multivariado, Branco et al. (2005)y Alfons et al. (2016) proponen estimadores utilizando un enfoque de projection-pursuit, esdecir, maximizando funcionales de asociación robustos de proyecciones de los datos. En esta tesis, consideramos espacios de Hilbert separables H1 y H2 y elementos aleatorios (X, Y )^t Є H = H1 x H2 y medidas de asociación bivariadas robustas. Para mostrarque la extensión natural del caso multivariado al caso funcional falla cuando se utiliza laextensión de los estimadores de projection-pursuit de Branco et al. (2005) al caso funcional,extendemos el resultado de Leurgans et al. (1993) al caso de medidas de asociación generales. Por otra parte, para proponer estimadores robustos y consistentes consideramos un enfoqueque combina projection-pursuit con el método de Sieves que aproxima el espacio infinito-dimensional H por subespacios de dimensión finita que crecen con el tamaño de muestra. Bajo condiciones de regularidad, obtenemos que los estimadores de las primeras direccionesy de la primera correlación canónica son consistentes al funcional asociado. Para identificarque representa dicho funcional, se muestra la consistencia Fisher de éstos cuando se utilizanmedidas de asociación que cumplan ciertas condiciones. En particular, las medidas de correlación robustas de uso habitual permiten obtener estimadores consistentes a la cantidadde interés en el caso de procesos Gaussianos o de procesos elípticos. Mediante un estudio desimulación, se compara el comportamiento de los estimadores robustos con los estimadoresbasados en la correlación de Pearson, para muestras finitas Gaussianas y contaminadas. Seproponen asimismo un procedimiento de convalidación cruzada robusta para elegir las dimensionesde los subespacios aproximantes y métodos para la detección de datos atípicos. Finalmente, se ilustra en un conjunto de datos reales las ventajas de los estimadores robustosya que permiten identificar los datos atípicos y proveen estimaciones confiables.
author2 Boente Boente, Graciela Lina
author_facet Boente Boente, Graciela Lina
Alvarez, Agustín
format Tesis doctoral
Tesis doctoral
publishedVersion
author Alvarez, Agustín
author_sort Alvarez, Agustín
title Métodos robustos en correlación canónica funcional
title_short Métodos robustos en correlación canónica funcional
title_full Métodos robustos en correlación canónica funcional
title_fullStr Métodos robustos en correlación canónica funcional
title_full_unstemmed Métodos robustos en correlación canónica funcional
title_sort métodos robustos en correlación canónica funcional
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2017
url https://hdl.handle.net/20.500.12110/tesis_n6188_Alvarez
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n6188_Alvarez_oai
work_keys_str_mv AT alvarezagustin metodosrobustosencorrelacioncanonicafuncional
AT alvarezagustin robustinferenceinfunctionalcanonicalcorrelation
_version_ 1766015924269219840
spelling I28-R145-tesis_n6188_Alvarez_oai2023-04-26 Boente Boente, Graciela Lina Alvarez, Agustín 2017-03-22 En diversas aplicaciones, resulta de interés poder medir la asociación entre dos características que se observan sobre los individuos de una población. Por otra parte, muchas vecesestas características se registran sobre un período de tiempo o corresponden a imágenes. Poresta razón, conviene considerarlos como realizaciones de un proceso estocástico en lugar dediscretizarlos y estudiarlos como realizaciones de datos multivariados. Un método ampliamenteutilizado para lograr este objetivo es el análisis de correlación canónica funcional. Leurgans et al. (1993) prueban que la extensión natural de los estimadores utilizados en elcaso multivariado al funcional no resulta consistente para la primera correlación canónica. Poresta razón, dichos autores proponen estimadores que penalizan la rugosidad de las direccionesy prueban que resultan consistentes. Por otro lado, He et al. (2003) dan condiciones quegarantizan la buena definición de las correlaciones y direcciones canónicas para elementosaleatorios (X; Y )^t a valores en el espacio de Hilbert L²(0, 1) x L² (0, 1). Los trabajos mencionados consideran como medida de asociación la correlación de Pearson. Sin embargo, es bien sabido, que esta medida es muy sensible a la presencia de datosatípicos. Con el fin de lidiar con este problema, en el caso multivariado, Branco et al. (2005)y Alfons et al. (2016) proponen estimadores utilizando un enfoque de projection-pursuit, esdecir, maximizando funcionales de asociación robustos de proyecciones de los datos. En esta tesis, consideramos espacios de Hilbert separables H1 y H2 y elementos aleatorios (X, Y )^t Є H = H1 x H2 y medidas de asociación bivariadas robustas. Para mostrarque la extensión natural del caso multivariado al caso funcional falla cuando se utiliza laextensión de los estimadores de projection-pursuit de Branco et al. (2005) al caso funcional,extendemos el resultado de Leurgans et al. (1993) al caso de medidas de asociación generales. Por otra parte, para proponer estimadores robustos y consistentes consideramos un enfoqueque combina projection-pursuit con el método de Sieves que aproxima el espacio infinito-dimensional H por subespacios de dimensión finita que crecen con el tamaño de muestra. Bajo condiciones de regularidad, obtenemos que los estimadores de las primeras direccionesy de la primera correlación canónica son consistentes al funcional asociado. Para identificarque representa dicho funcional, se muestra la consistencia Fisher de éstos cuando se utilizanmedidas de asociación que cumplan ciertas condiciones. En particular, las medidas de correlación robustas de uso habitual permiten obtener estimadores consistentes a la cantidadde interés en el caso de procesos Gaussianos o de procesos elípticos. Mediante un estudio desimulación, se compara el comportamiento de los estimadores robustos con los estimadoresbasados en la correlación de Pearson, para muestras finitas Gaussianas y contaminadas. Seproponen asimismo un procedimiento de convalidación cruzada robusta para elegir las dimensionesde los subespacios aproximantes y métodos para la detección de datos atípicos. Finalmente, se ilustra en un conjunto de datos reales las ventajas de los estimadores robustosya que permiten identificar los datos atípicos y proveen estimaciones confiables. In many applications, measuring the association between two individual features is animportant issue. Besides, in many practical situations data are recorded over a period of timeor may correspond to images. In these situations, it is preferable to consider them as samplesof an stochastic process instead of working with the discretized trajectories as multivariatedata samples. A technique widely used to study the dependence between the two functionsrecorded for a sample of subjects is the functional canonical correlation analysis. Leurgans etal. (1993) demonstrated the need for regularization in functional canonical correlation analysis,since the natural extension of the multivariate estimators are not consistent. Leurgans etal. (1993) also derived the consistency of the estimators obtained penalizing the roughness. These results are complemented with those obtained in He et al. (2003) who provide conditionsensuring the existence and proper definition of the canonical directions and correlationswhen the random element belongs to L² (0, 1) x L² (0; 1). The aforementioned papers consider as association measure the Pearson correlation. However,it is well known that the Pearson correlation is not robust, being sensitive to outliersand this sensitivity is inherited by the canonical directions and correlations. In the multivariatecase, a robust approach was given by Branco et al. (2005) and Alfons et al. (2016)who proposed estimators using projection-pursuit, that is, maximizing a robust bivariateassociation measure over the projected data. In this thesis, we consider separable Hilbert spaces H1 and H2 and random elements (X, Y ) Є H = H1 x H2 as well as robust bivariate measures of association. To show thatthe natural extension from the multivariate case to the functional case fails when using theprojection-pursuit estimators of Branco et al. (2005), we generalize the result of Leurgans etal. (1993) to the case of general measures of association. On the other hand, to obtain robustand consistent estimators in a functional framework, we consider an approach that com6bines projection-pursuit with Sieves which approximate the infinite-dimensional space Hby means of finite-dimensional linear spaces growing with the sample size. Under regularityconditions, consistency results for the first canonical correlation and directions are derived. An important point to highlight is what the functional related to the proposed estimatorsrepresent, at least in some situations. For that purpose, Fisher consistency is obtained whenthe bivariate measure of association may be transformed to a Fisher-consistent bivariateassociation functional. In particular, the usual robust correlations allow to obtain consistentestimators of the quantities of interest when (X, Y )^t is a Gaussian or an elliptical process. Through a simulation study, we compare the performance of the robust proposals with theestimators based on the Pearson correlation, for clean and contaminated data. Furthermore,a robust cross-validation procedure is also proposed to select the dimension of the approximatinglinear spaces and outlier detection rules are studied. Finally, we illustrate on a realdata set the advantages of the robust estimators which allow identify outliers and providereliable estimates. Fil: Alvarez, Agustín. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/tesis_n6188_Alvarez spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar CORRELACION CANONICA DATOS FUNCIONALES ESPACIOS APROXIMANTES ROBUSTEZ CANONICAL CORRELATION FUNCTIONAL DATA ROBUSTNESS SIEVES Métodos robustos en correlación canónica funcional Robust inference in functional canonical correlation info:eu-repo/semantics/doctoralThesis info:ar-repo/semantics/tesis doctoral info:eu-repo/semantics/publishedVersion http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n6188_Alvarez_oai