Categorización automática de documentos

La clasificación de documentos de texto es una aplicación de la minería de textos que pretende extraer información de texto no estructurado. Su interés se justifica porque se estima que entre el 80% y el 90% de los datos de las organizaciones son no estructurados. Por otro lado, la búsqueda semántic...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Pérez Abelleira, M. Alicia, Cardoso, Alejandra Carolina
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2011
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/125233
Aporte de:
id I19-R120-10915-125233
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
categorización de documentos
buscador semántico
aprendizaje semisupervisado
minería de texto
UIMA
spellingShingle Ciencias Informáticas
categorización de documentos
buscador semántico
aprendizaje semisupervisado
minería de texto
UIMA
Pérez Abelleira, M. Alicia
Cardoso, Alejandra Carolina
Categorización automática de documentos
topic_facet Ciencias Informáticas
categorización de documentos
buscador semántico
aprendizaje semisupervisado
minería de texto
UIMA
description La clasificación de documentos de texto es una aplicación de la minería de textos que pretende extraer información de texto no estructurado. Su interés se justifica porque se estima que entre el 80% y el 90% de los datos de las organizaciones son no estructurados. Por otro lado, la búsqueda semántica permite al usuario especificar en una consulta no solamente términos que deben aparecer en el documento, sino conceptos y relaciones, que pueden detectarse mediante el análisis de texto. El objetivo de este trabajo es implementar un buscador semántico que aproveche el resultado de algoritmos de aprendizaje automático supervisado y semi-supervisado para la categorización o clasificación de documentos. El dominio de aplicación es un corpus de más de 8000 documentos que contienen nueve años de resoluciones rectorales de la Universidad Católica de Salta en distintos formatos.
format Objeto de conferencia
Objeto de conferencia
author Pérez Abelleira, M. Alicia
Cardoso, Alejandra Carolina
author_facet Pérez Abelleira, M. Alicia
Cardoso, Alejandra Carolina
author_sort Pérez Abelleira, M. Alicia
title Categorización automática de documentos
title_short Categorización automática de documentos
title_full Categorización automática de documentos
title_fullStr Categorización automática de documentos
title_full_unstemmed Categorización automática de documentos
title_sort categorización automática de documentos
publishDate 2011
url http://sedici.unlp.edu.ar/handle/10915/125233
work_keys_str_mv AT perezabelleiramalicia categorizacionautomaticadedocumentos
AT cardosoalejandracarolina categorizacionautomaticadedocumentos
bdutipo_str Repositorios
_version_ 1764820451422371842