Lematizador morfosintáctico y semántico robusto con flexionador y estimador idiomático, usando algoritmos eficientes y compactos para idiomas muy ricos en formas como el español

Se presenta un sistema de reconocimiento y flexión de palabras en lenguaje natural orientado a interfase hombre-máquina. Presentamos algoritmos robustos, eficientes y con poca impronta de memoria, capaces de realizar identificación idiomática, etiquetado lingüístico, extracción semántica, estimación...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Hohendahl, Andres T., Zelasco, José F.
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2006
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/22789
Aporte de:
id I19-R120-10915-22789
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Procesamiento de Lenguaje Natural
Natural Language Processing
Semantics
Morphological
Algorithms
spellingShingle Ciencias Informáticas
Procesamiento de Lenguaje Natural
Natural Language Processing
Semantics
Morphological
Algorithms
Hohendahl, Andres T.
Zelasco, José F.
Lematizador morfosintáctico y semántico robusto con flexionador y estimador idiomático, usando algoritmos eficientes y compactos para idiomas muy ricos en formas como el español
topic_facet Ciencias Informáticas
Procesamiento de Lenguaje Natural
Natural Language Processing
Semantics
Morphological
Algorithms
description Se presenta un sistema de reconocimiento y flexión de palabras en lenguaje natural orientado a interfase hombre-máquina. Presentamos algoritmos robustos, eficientes y con poca impronta de memoria, capaces de realizar identificación idiomática, etiquetado lingüístico, extracción semántica, estimación morfológica y acústica (por similitud). Usa reglas simples capaces de expresar sofisticados cambios morfológicos reversibles. Tolera, detecta y corrige errores, estando principalmente orientado a textos provenientes de reconocimiento automático de voz y texto escrito, mensajes de teclados restringidos como terminales móviles “sms/mms/wap”, PDA’s etc.., “chat” y/o e-mail. Es apropiado para asistencia y corrección interactiva en procesamiento de texto, tiene baja impronta de memoria y alta velocidad de proceso, siendo adecuado para ordenadores personales, portátiles, móviles y productos embebidos. Para el español, requiere 200Kb para 50k lemas y 4500 reglas, equivalentes a 1.2M palabras exactas y >300M estimables. Puede inferir por similitud morfológica y tónica, en forma similar a la de un hablante natural. Como flexionador posee además capacidad de expresión semántica.
format Objeto de conferencia
Objeto de conferencia
author Hohendahl, Andres T.
Zelasco, José F.
author_facet Hohendahl, Andres T.
Zelasco, José F.
author_sort Hohendahl, Andres T.
title Lematizador morfosintáctico y semántico robusto con flexionador y estimador idiomático, usando algoritmos eficientes y compactos para idiomas muy ricos en formas como el español
title_short Lematizador morfosintáctico y semántico robusto con flexionador y estimador idiomático, usando algoritmos eficientes y compactos para idiomas muy ricos en formas como el español
title_full Lematizador morfosintáctico y semántico robusto con flexionador y estimador idiomático, usando algoritmos eficientes y compactos para idiomas muy ricos en formas como el español
title_fullStr Lematizador morfosintáctico y semántico robusto con flexionador y estimador idiomático, usando algoritmos eficientes y compactos para idiomas muy ricos en formas como el español
title_full_unstemmed Lematizador morfosintáctico y semántico robusto con flexionador y estimador idiomático, usando algoritmos eficientes y compactos para idiomas muy ricos en formas como el español
title_sort lematizador morfosintáctico y semántico robusto con flexionador y estimador idiomático, usando algoritmos eficientes y compactos para idiomas muy ricos en formas como el español
publishDate 2006
url http://sedici.unlp.edu.ar/handle/10915/22789
work_keys_str_mv AT hohendahlandrest lematizadormorfosintacticoysemanticorobustoconflexionadoryestimadoridiomaticousandoalgoritmoseficientesycompactosparaidiomasmuyricosenformascomoelespanol
AT zelascojosef lematizadormorfosintacticoysemanticorobustoconflexionadoryestimadoridiomaticousandoalgoritmoseficientesycompactosparaidiomasmuyricosenformascomoelespanol
bdutipo_str Repositorios
_version_ 1764820467706757123