Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales
Los algoritmos de agrupamiento permiten agrupar un conjunto de datos en un conjunto de subclases, denominados clusters. El objetivo principal de los mismos es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia de datos suele ser representada en un espacio de carac...
Guardado en:
Autor principal: | |
---|---|
Formato: | Artículo revista |
Lenguaje: | Español |
Publicado: |
Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas
2017
|
Materias: | |
Acceso en línea: | http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1564 |
Aporte de: |
id |
I21-R190-123456789-1564 |
---|---|
record_format |
ojs |
institution |
Universidad Nacional del Centro |
institution_str |
I-21 |
repository_str |
R-190 |
container_title_str |
Repositorio Institucional de Acceso Abierto (RIDAA) |
language |
Español |
format |
Artículo revista |
topic |
Ingeniería de sistemas Métrica de distancia euclidiana Algoritmos de agrupamiento Clusters |
spellingShingle |
Ingeniería de sistemas Métrica de distancia euclidiana Algoritmos de agrupamiento Clusters Román y Zubeldia, Alfonso Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
topic_facet |
Ingeniería de sistemas Métrica de distancia euclidiana Algoritmos de agrupamiento Clusters |
author |
Román y Zubeldia, Alfonso |
author_facet |
Román y Zubeldia, Alfonso |
author_sort |
Román y Zubeldia, Alfonso |
title |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title_short |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title_full |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title_fullStr |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title_full_unstemmed |
Implementación de pruebas para una hipótesis sobre la aplicación de distancia Euclidiana para realizar agrupamientos en espacios multidimensionales |
title_sort |
implementación de pruebas para una hipótesis sobre la aplicación de distancia euclidiana para realizar agrupamientos en espacios multidimensionales |
description |
Los algoritmos de agrupamiento permiten agrupar un conjunto de datos en un
conjunto de subclases, denominados clusters. El objetivo principal de los mismos
es agrupar, en dichos clusters, instancias de datos similares entre sí. Cada instancia
de datos suele ser representada en un espacio de características en donde cada
característica queda presentada como una dimensión de dicho espacio. Es común,
entonces, el uso de espacios de muchas dimensiones en esta representación. Una de
las medidas de similitud más usadas para realizar el agrupamiento es la distancia
euclidiana.
La motivación principal de éste trabajo es brindar asistencia en la implementación y prueba de una hipótesis sobre el uso de la métrica de distancia euclidiana
como medida de similitud en los algoritmos de agrupamiento. En la hipótesis se
plantea la posibilidad de que, en espacios multidimensionales, la distancia euclidiana
puede conducir a un agrupamiento erróneo en ciertas ocasiones. Es decir, puede
ocurrir que se agrupen instancias en una clase cuando en realidad pertenecen a otra.
Numerosos estudios han determinado que las métricas de distancia suelen tener
comportamientos erráticos en altas dimensiones. Sin embargo no existen muchos
trabajos que profundicen demasiado en ésta temática debido a que el problema es
naturalmente complejo. Los espacios n-dimensionales grandes (con n > 3) no pueden
ser gra cados en su totalidad, y nuestra intuición falla en ellos.
Se ha mostrado que, en algoritmos de agrupamiento particionales como K-
Means, el uso de diferentes métricas de distancia puede impactar fuertemente en
los resultados. Por lo tanto, la elección de la métrica debe hacerse con cuidado. |
publisher |
Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas |
publishDate |
2017 |
url |
http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1564 |
work_keys_str_mv |
AT romanyzubeldiaalfonso implementaciondepruebasparaunahipotesissobrelaaplicaciondedistanciaeuclidianapararealizaragrupamientosenespaciosmultidimensionales |
first_indexed |
2022-07-04T14:39:17Z |
last_indexed |
2022-07-04T14:39:17Z |
bdutipo_str |
Revistas |
_version_ |
1764819786874748928 |