Comparación de sistemas para la detección de límites de oraciones

Se plantea la obtención de límites de oraciones (LO) mediante tres sistemas: -Mx terminator: modela las decisiones que se toman al recorrer un texto y clasificar los elementos de S{., ?, !} en LO o no (sistema estadístico). -SMORPH/MPS: distingue la separación de párrafos y de oraciones y la separ...

Descripción completa

Detalles Bibliográficos
Autor principal: Beltrán, Celina
Formato: article artículo publishedVersion
Lenguaje:Español
Publicado: Grupo Infosur 2019
Materias:
Acceso en línea:http://hdl.handle.net/2133/14277
http://hdl.handle.net/2133/14277
Aporte de:
id I15-R121-2133-14277
record_format dspace
institution Universidad Nacional de Rosario
institution_str I-15
repository_str R-121
collection Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR)
language Español
orig_language_str_mv spa
topic oraciones
limites
estadístico
spellingShingle oraciones
limites
estadístico
Beltrán, Celina
Comparación de sistemas para la detección de límites de oraciones
topic_facet oraciones
limites
estadístico
description Se plantea la obtención de límites de oraciones (LO) mediante tres sistemas: -Mx terminator: modela las decisiones que se toman al recorrer un texto y clasificar los elementos de S{., ?, !} en LO o no (sistema estadístico). -SMORPH/MPS: distingue la separación de párrafos y de oraciones y la separación entre párrafos de la separación dada por nueva línea cuando no hay LO. -XFST/Tokenize: agrega la detección de títulos a las funcionalidades del anterior. Para evaluar los tres sistemas se utilizó un corpus de 277 oraciones. Con el primero se obtiene 100% de cobertura y 96.9% de precisión en límite de oración (no discrimina final de párrafo y final de oración no final de párrafo). Con el segundo se obtiene 100% y 98,8% para precisión y cobertura de límites de párrafo, y 100% para precisión y cobertura de límites de oración que no finalizan párrafo. Con el tercero se detecta final de párrafo, final de oración no final de párrafo y títulos. Los valores de cobertura y precisión son 100% y 100% respectivamente para títulos, 100% y 100% para finales de párrafos y 100% y 99.5% para finales de oración no finales de párrafos.
format article
artículo
publishedVersion
author Beltrán, Celina
author_facet Beltrán, Celina
author_sort Beltrán, Celina
title Comparación de sistemas para la detección de límites de oraciones
title_short Comparación de sistemas para la detección de límites de oraciones
title_full Comparación de sistemas para la detección de límites de oraciones
title_fullStr Comparación de sistemas para la detección de límites de oraciones
title_full_unstemmed Comparación de sistemas para la detección de límites de oraciones
title_sort comparación de sistemas para la detección de límites de oraciones
publisher Grupo Infosur
publishDate 2019
url http://hdl.handle.net/2133/14277
http://hdl.handle.net/2133/14277
work_keys_str_mv AT beltrancelina comparaciondesistemasparaladetecciondelimitesdeoraciones
bdutipo_str Repositorios
_version_ 1764820408342675457