Método de corrección ortográfica basado en trigramas y distancia de edición
En este trabajo se exponen los primeros resultados obtenidos de evaluación de un método de corrección ortográfica. Éste permite identificar errores y generar una lista de posibles reemplazos ordenada de acuerdo a la distancia que las sugerencias mantienen con la palabra incorrecta. El método opera e...
Guardado en:
Autores principales: | , , , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2005
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/21174 |
Aporte de: |
id |
I19-R120-10915-21174 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas corrección ortográfica edición Optical character recognition (OCR) trigramas Edge and feature detection distancia de edición |
spellingShingle |
Ciencias Informáticas corrección ortográfica edición Optical character recognition (OCR) trigramas Edge and feature detection distancia de edición Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán Peri, Jorge Alberto Barrientos, Diego Método de corrección ortográfica basado en trigramas y distancia de edición |
topic_facet |
Ciencias Informáticas corrección ortográfica edición Optical character recognition (OCR) trigramas Edge and feature detection distancia de edición |
description |
En este trabajo se exponen los primeros resultados obtenidos de evaluación de un método de corrección ortográfica. Éste permite identificar errores y generar una lista de posibles reemplazos ordenada de acuerdo a la distancia que las sugerencias mantienen con la palabra incorrecta. El método opera en dos etapas de procesamiento. Primero, mediante la utilización de un filtro basado en trigramas se construye una lista de términos candidatos; luego, se ordena la lista utilizando la métrica distancia de edición. Los primeros resultados muestran el método basado en trigramas es una alternativa válida para la corrección de errores de ortografía, alcanzando un rendimiento cercano al 81%. Especialmente, se debe considerar que se trata de un corrector de ortografía de propósito general basado en palabras aisladas y sin ningún tipo de información del contexto. |
format |
Objeto de conferencia Objeto de conferencia |
author |
Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán Peri, Jorge Alberto Barrientos, Diego |
author_facet |
Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán Peri, Jorge Alberto Barrientos, Diego |
author_sort |
Bordignon, Fernando Raúl Alfredo |
title |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title_short |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title_full |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title_fullStr |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title_full_unstemmed |
Método de corrección ortográfica basado en trigramas y distancia de edición |
title_sort |
método de corrección ortográfica basado en trigramas y distancia de edición |
publishDate |
2005 |
url |
http://sedici.unlp.edu.ar/handle/10915/21174 |
work_keys_str_mv |
AT bordignonfernandoraulalfredo metododecorreccionortograficabasadoentrigramasydistanciadeedicion AT tolosagabrielhernan metododecorreccionortograficabasadoentrigramasydistanciadeedicion AT perijorgealberto metododecorreccionortograficabasadoentrigramasydistanciadeedicion AT barrientosdiego metododecorreccionortograficabasadoentrigramasydistanciadeedicion |
bdutipo_str |
Repositorios |
_version_ |
1764820465528864770 |