Recuperación de imágenes basada en texto y contenido visual mediante redes neuronales

Durante los últimos años, la cantidad de información visual que se produce a diario viene experimentando un fuerte crecimiento. Desde imágenes generadas por satélites, cámaras de vigilancia y hasta fotos obtenidas por cámaras digitales contribuyen a formar una masa de información que de a poco se vu...

Descripción completa

Detalles Bibliográficos
Autor principal: Castro, Diego Adrián
Otros Autores: Seijas, Leticia María
Formato: Tesis de grado publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2009
Acceso en línea:https://hdl.handle.net/20.500.12110/seminario_nCOM000334_Castro
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nCOM000334_Castro_oai
Aporte de:
id I28-R145-seminario_nCOM000334_Castro_oai
record_format dspace
spelling I28-R145-seminario_nCOM000334_Castro_oai2022-09-29 Seijas, Leticia María Castro, Diego Adrián 2009-10 Durante los últimos años, la cantidad de información visual que se produce a diario viene experimentando un fuerte crecimiento. Desde imágenes generadas por satélites, cámaras de vigilancia y hasta fotos obtenidas por cámaras digitales contribuyen a formar una masa de información que de a poco se vuelve inmanejable. A lo largo del tiempo, se han descripto las imágenes a través de texto (TBIR) y de sus características visuales (CBIR), pero estos enfoques aún presentan desventajas. En los últimos años se ha comenzado a estudiar sistemas híbridos que combinan ambas variantes buscando potenciar las virtudes de cada una. A diferencia de TBIR, CBIR es un área mucho menos madura y presenta numerosos desafíos, entre ellos la definición de descriptores e índices adecuados. En este trabajo utilizamos histogramas de color para describir a las imágenes y analizamos el uso de mapas auto-organizados (SOM) como índice, ya que permiten trabajar con descriptores de alta dimensionalidad (caso típico en CBIR). Proponemos una función de scoring para imágenes con la idea de descartar imágenes irrelevantes en los resultados y también una variante para los SOM que mejora los tiempos de entrenamiento y recuperación (ParBSOM). Además, aplicamos dichas técnicas en el contexto de un sistema híbrido y proveemos resultados empíricos para evaluar su desempeño. Por último, presentamos un software propio denominado Envision que aplica los métodos estudiados. In the last few years there has been a dramatic increase in the visual information available. Images generated from satellites, surveillance cameras and even digital cameras produce a huge amount of information that gradually becomes more difficult to handle. Typically, images are described by their textual content (TBIR) or by their visual features (CBIR). However, these approaches still show many problems. Recently, it was introduced the hybrid approach which combines both characteristics to improve the benefits of using text and visual content separately. CBIR nowadays is still far from being as well-matured as TBIR and presents many challenges such as defining suitable descriptors and index structures. In this work we use color histograms to describe images and study how Self-Organizing Maps (SOM) can be used as an index in CBIR. SOM are an interesting alternative as they allow us to work with high-dimensional descriptors (typical case in CBIR). We propose a scoring function for images which eliminates irrelevant images from the results list and we also introduce a new SOM model that improves training and retrieval times (ParBSOM). In addition, we study how these techniques can be applied to the hybrid approach and provide computational results to assess their performance. Finally, we develop a system known as Envision, which implements all the studied methods. Fil:Castro, Diego Adrián. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/seminario_nCOM000334_Castro spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar Recuperación de imágenes basada en texto y contenido visual mediante redes neuronales info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nCOM000334_Castro_oai
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-145
collection Repositorio Digital de la Universidad de Buenos Aires (UBA)
language Español
orig_language_str_mv spa
description Durante los últimos años, la cantidad de información visual que se produce a diario viene experimentando un fuerte crecimiento. Desde imágenes generadas por satélites, cámaras de vigilancia y hasta fotos obtenidas por cámaras digitales contribuyen a formar una masa de información que de a poco se vuelve inmanejable. A lo largo del tiempo, se han descripto las imágenes a través de texto (TBIR) y de sus características visuales (CBIR), pero estos enfoques aún presentan desventajas. En los últimos años se ha comenzado a estudiar sistemas híbridos que combinan ambas variantes buscando potenciar las virtudes de cada una. A diferencia de TBIR, CBIR es un área mucho menos madura y presenta numerosos desafíos, entre ellos la definición de descriptores e índices adecuados. En este trabajo utilizamos histogramas de color para describir a las imágenes y analizamos el uso de mapas auto-organizados (SOM) como índice, ya que permiten trabajar con descriptores de alta dimensionalidad (caso típico en CBIR). Proponemos una función de scoring para imágenes con la idea de descartar imágenes irrelevantes en los resultados y también una variante para los SOM que mejora los tiempos de entrenamiento y recuperación (ParBSOM). Además, aplicamos dichas técnicas en el contexto de un sistema híbrido y proveemos resultados empíricos para evaluar su desempeño. Por último, presentamos un software propio denominado Envision que aplica los métodos estudiados.
author2 Seijas, Leticia María
author_facet Seijas, Leticia María
Castro, Diego Adrián
format Tesis de grado
Tesis de grado
publishedVersion
author Castro, Diego Adrián
spellingShingle Castro, Diego Adrián
Recuperación de imágenes basada en texto y contenido visual mediante redes neuronales
author_sort Castro, Diego Adrián
title Recuperación de imágenes basada en texto y contenido visual mediante redes neuronales
title_short Recuperación de imágenes basada en texto y contenido visual mediante redes neuronales
title_full Recuperación de imágenes basada en texto y contenido visual mediante redes neuronales
title_fullStr Recuperación de imágenes basada en texto y contenido visual mediante redes neuronales
title_full_unstemmed Recuperación de imágenes basada en texto y contenido visual mediante redes neuronales
title_sort recuperación de imágenes basada en texto y contenido visual mediante redes neuronales
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2009
url https://hdl.handle.net/20.500.12110/seminario_nCOM000334_Castro
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nCOM000334_Castro_oai
work_keys_str_mv AT castrodiegoadrian recuperaciondeimagenesbasadaentextoycontenidovisualmedianteredesneuronales
_version_ 1766026831919579136