Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios
Este trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públic...
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | Tesis Tesis de grado |
Lenguaje: | Español |
Publicado: |
2024
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/167230 |
Aporte de: |
id |
I19-R120-10915-167230 |
---|---|
record_format |
dspace |
spelling |
I19-R120-10915-1672302024-06-14T04:08:48Z http://sedici.unlp.edu.ar/handle/10915/167230 Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios Dioguardi, Felipe 2024-06-11 2024 2024-06-13T16:32:26Z Torres, Diego Antonelli, Rubén Leandro es Informática Detección de duplicados grafo de conocimiento avisos inmobiliarios clasificador bayesiano web scraping Este trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio. Director profesional: Juan Pablo del Río Programa de Apoyo al Egreso para Alumnos con Práctica Profesional Supervisada Licenciado en Informática Universidad Nacional de La Plata Facultad de Informática Tesis Tesis de grado http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Informática Detección de duplicados grafo de conocimiento avisos inmobiliarios clasificador bayesiano web scraping |
spellingShingle |
Informática Detección de duplicados grafo de conocimiento avisos inmobiliarios clasificador bayesiano web scraping Dioguardi, Felipe Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
topic_facet |
Informática Detección de duplicados grafo de conocimiento avisos inmobiliarios clasificador bayesiano web scraping |
description |
Este trabajo es una contribución al proyecto "Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano", cuyo objetivo es tener una herramienta que sirva para analizar el mercado inmobiliario en la provincia de Buenos Aires y así desarrollar políticas públicas de urbanización más efectivas. Esta investigación se enfoca en identificar entidades duplicadas en un grafo de conocimiento sobre el sector inmobiliario que servirá como base de datos principal de la herramienta. El grafo está estructurado mediante una ontología del dominio inmobiliario, y poblado mediante el uso de web scraping sobre distintas páginas de avisos inmobiliarios. La construcción del grafo se describe en este trabajo para contextualizar sobre el origen de la existencia de los duplicados. Dado que la existencia de entidades duplicadas puede obstaculizar el análisis estadístico de la información debido a las inconsistencias que generan, este trabajo propone una solución basada en un enfoque bayesiano y evaluada sobre un conjunto de los datos reales curado a mano por los expertos en el dominio. |
author2 |
Torres, Diego |
author_facet |
Torres, Diego Dioguardi, Felipe |
format |
Tesis Tesis de grado |
author |
Dioguardi, Felipe |
author_sort |
Dioguardi, Felipe |
title |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title_short |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title_full |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title_fullStr |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title_full_unstemmed |
Detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
title_sort |
detección de duplicados sobre grafos de conocimiento de avisos inmobiliarios |
publishDate |
2024 |
url |
http://sedici.unlp.edu.ar/handle/10915/167230 |
work_keys_str_mv |
AT dioguardifelipe detecciondeduplicadossobregrafosdeconocimientodeavisosinmobiliarios |
_version_ |
1807223447216979968 |