Una medida de profundidad local para datos en espacios de Banach

Las profundidades juegan un rol importante cuando analizamos conjuntos de datos complejos, como datos funcionales o datos en dimensión alta. El principal objetivo de una medida de profundidad es dar un orden del centro hacia afuera generalizando el concepto de mediana. Además son útiles para describ...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Fernández Piana, Lucas Raúl
Otros Autores: Svarc, Marcela
Formato: Tesis doctoral publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2018
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n6983_FernandezPiana
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n6983_FernandezPiana_oai
Aporte de:
id I28-R145-tesis_n6983_FernandezPiana_oai
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-145
collection Repositorio Digital de la Universidad de Buenos Aires (UBA)
language Español
orig_language_str_mv spa
topic MEDIDAS DE PROFUNDIDAD
ANALISIS DE CLUSTER
DATOS FUNCIONALES
PROCEDIMIENTOS BASADOS EN PROYECCIONES
DATA DEPTH
CLUSTER ANALYSIS
FUNCTIONAL DATA
PROJECTION PROCEDURES
spellingShingle MEDIDAS DE PROFUNDIDAD
ANALISIS DE CLUSTER
DATOS FUNCIONALES
PROCEDIMIENTOS BASADOS EN PROYECCIONES
DATA DEPTH
CLUSTER ANALYSIS
FUNCTIONAL DATA
PROJECTION PROCEDURES
Fernández Piana, Lucas Raúl
Una medida de profundidad local para datos en espacios de Banach
topic_facet MEDIDAS DE PROFUNDIDAD
ANALISIS DE CLUSTER
DATOS FUNCIONALES
PROCEDIMIENTOS BASADOS EN PROYECCIONES
DATA DEPTH
CLUSTER ANALYSIS
FUNCTIONAL DATA
PROJECTION PROCEDURES
description Las profundidades juegan un rol importante cuando analizamos conjuntos de datos complejos, como datos funcionales o datos en dimensión alta. El principal objetivo de una medida de profundidad es dar un orden del centro hacia afuera generalizando el concepto de mediana. Además son útiles para describir distintas características de la distribución subyacente de los datos. Inclusive son utilizadas como herramientas en distintos problemas de inferencia como tests de posición y simetría, clasificación, detección de datos atípicos, etc. Sin embargo, dado que una de sus principales características es que el valor de la profundidad decrece sobre cada semirrecta con origen en el centro, no pueden capturar información relevante cuando la distribución estudiada es multimodal o no tiene soporte convexo. Con el objetivo de captar estas características locales, en los últimos años, se han introducido distintas definiciones de profundidad local: Agostinelli y Romanazzi (2), Paindaveine y Van Bever (44) y Agostinelli (1). La idea es restringir la profundidad global a un entorno de cada punto del espacio. En este sentido una profundidad local debe comportarse como una profundidad global condicionada al entorno. Nuestro objetivo es dar una definición general de profundidad local para elementos aleatorios en una espacio de Banach extendiendo la definición de profundidad global dada por Cuevas y Fraiman (14), donde proponen la Profundidad Dual Integrada (IDD). Nosotros definiremos la Profundidad Local Dual Integrada (IDLD). Estudiaremos cómo las propiedades clásicas, introducidas por Zuo y Serfling (57), deben ser adaptadas en este nuevo contexto. Probaremos que bajo condiciones de regularidad nuestra propuesta cumple esas propiedades. Además, mostraremos resultados de consistencia fuerte para la versión empírica de la IDLD y para las regiones de profundidad local. La mayor ventaja de nuestra propuesta es su flexibilidad para lidiar con datos en contextos generales y su bajo costo computacional, lo cual la vuelve apta para el análisis de datos en alta dimensión. Como una aplicación natural, propondremos un procedimiento de clusters basado en profundidades locales y mostraremos su muy buen desempeño con datos simulados y datos reales para distintas clases de los mismos: multivariados, funcionales, funcionales multidimensionales y mixtos.
author2 Svarc, Marcela
author_facet Svarc, Marcela
Fernández Piana, Lucas Raúl
format Tesis doctoral
Tesis doctoral
publishedVersion
author Fernández Piana, Lucas Raúl
author_sort Fernández Piana, Lucas Raúl
title Una medida de profundidad local para datos en espacios de Banach
title_short Una medida de profundidad local para datos en espacios de Banach
title_full Una medida de profundidad local para datos en espacios de Banach
title_fullStr Una medida de profundidad local para datos en espacios de Banach
title_full_unstemmed Una medida de profundidad local para datos en espacios de Banach
title_sort una medida de profundidad local para datos en espacios de banach
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2018
url https://hdl.handle.net/20.500.12110/tesis_n6983_FernandezPiana
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n6983_FernandezPiana_oai
work_keys_str_mv AT fernandezpianalucasraul unamedidadeprofundidadlocalparadatosenespaciosdebanach
AT fernandezpianalucasraul alocaldepthmeasurefordatainbanachspaces
_version_ 1766016060041986048
spelling I28-R145-tesis_n6983_FernandezPiana_oai2023-04-26 Svarc, Marcela Fernández Piana, Lucas Raúl 2018-03-12 Las profundidades juegan un rol importante cuando analizamos conjuntos de datos complejos, como datos funcionales o datos en dimensión alta. El principal objetivo de una medida de profundidad es dar un orden del centro hacia afuera generalizando el concepto de mediana. Además son útiles para describir distintas características de la distribución subyacente de los datos. Inclusive son utilizadas como herramientas en distintos problemas de inferencia como tests de posición y simetría, clasificación, detección de datos atípicos, etc. Sin embargo, dado que una de sus principales características es que el valor de la profundidad decrece sobre cada semirrecta con origen en el centro, no pueden capturar información relevante cuando la distribución estudiada es multimodal o no tiene soporte convexo. Con el objetivo de captar estas características locales, en los últimos años, se han introducido distintas definiciones de profundidad local: Agostinelli y Romanazzi (2), Paindaveine y Van Bever (44) y Agostinelli (1). La idea es restringir la profundidad global a un entorno de cada punto del espacio. En este sentido una profundidad local debe comportarse como una profundidad global condicionada al entorno. Nuestro objetivo es dar una definición general de profundidad local para elementos aleatorios en una espacio de Banach extendiendo la definición de profundidad global dada por Cuevas y Fraiman (14), donde proponen la Profundidad Dual Integrada (IDD). Nosotros definiremos la Profundidad Local Dual Integrada (IDLD). Estudiaremos cómo las propiedades clásicas, introducidas por Zuo y Serfling (57), deben ser adaptadas en este nuevo contexto. Probaremos que bajo condiciones de regularidad nuestra propuesta cumple esas propiedades. Además, mostraremos resultados de consistencia fuerte para la versión empírica de la IDLD y para las regiones de profundidad local. La mayor ventaja de nuestra propuesta es su flexibilidad para lidiar con datos en contextos generales y su bajo costo computacional, lo cual la vuelve apta para el análisis de datos en alta dimensión. Como una aplicación natural, propondremos un procedimiento de clusters basado en profundidades locales y mostraremos su muy buen desempeño con datos simulados y datos reales para distintas clases de los mismos: multivariados, funcionales, funcionales multidimensionales y mixtos. Data depth measures play an important role when analyzing complex data, such as functional or high dimensional data. The main goal of depth measures is to a give center-outer order of the data, generalizing the concept of median to general settings. Depth measures are also useful to describe different features of the underlying distribution of the data. Moreover, they are powerful tools to deal with several inference problems such as location and symmetry tests, classification, outlier detection, etc. Nonetheless, since one of their major characteristics is that the depth values decrease along any half-line ray from the center, they are not suitable to capture distribution characteristics when data are multimodal or have non-convex support. Hence, with the aim of revealing local features of the underlying distribution in the last few years several definitions of local depths have been introduced: Agostinelli and Romanazzi (2), Paindaveine and Van Bever (44) and Agostinelli (1). The basic idea is to restrict a global depth measure to a neighborhood of every point of the space. In that way, a local depth measure should behave as a global depth measure conditional to neighborhoods of the different points. Our goal is to give a general definition of local depth for random elements in a Banach space, extending the definition of global depth given by Cuevas and Fraiman (14), where they introduce the Integrated Dual Depth (IDD). We define the Integrated Dual Local Depth (IDLD). We study how the classical properties, introduced by Zou and Serfling (57), should be analyzed within the framework of local depth. We prove, under mild regularity conditions, that our proposal enjoys those properties. Moreover, uniform strong consistency results are exhibited for the definition of the empirical local depth of to the population counterpart, and also for the local depth regions. The main advantages of our proposals are its flexibility in dealing with general data and also its low computational cost, which enables it to work with high-dimensional data. As a natural application, we propose a clustering procedure based on local depths, and illustrate its promising performance with synthetic and real data, for different kind of data: multivariate, functional, functional multidimensional and mixed. Fil: Fernández Piana, Lucas Raúl. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/tesis_n6983_FernandezPiana spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar MEDIDAS DE PROFUNDIDAD ANALISIS DE CLUSTER DATOS FUNCIONALES PROCEDIMIENTOS BASADOS EN PROYECCIONES DATA DEPTH CLUSTER ANALYSIS FUNCTIONAL DATA PROJECTION PROCEDURES Una medida de profundidad local para datos en espacios de Banach A local depth measure for data in Banach spaces info:eu-repo/semantics/doctoralThesis info:ar-repo/semantics/tesis doctoral info:eu-repo/semantics/publishedVersion http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n6983_FernandezPiana_oai