Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia

El presente trabajo se enmarca en el proyecto de investigación de la Dra. Carolina Gattei y la Mag. Analí Taboh, radicado en la Universidad Torcuato Di Tella, en el cual se realizan pruebas que ayudan a diagnosticar a personas con distintas patologías del habla y la audición. Los datos recolectados...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: González, Joaquín
Otros Autores: Gattei, Carolina A.
Formato: Artículo acceptedVersion
Lenguaje:Español
Publicado: Universidad Torcuato Di Tella 2023
Materias:
Acceso en línea:https://repositorio.utdt.edu/handle/20.500.13098/12031
Aporte de:
id I57-R163-20.500.13098-12031
record_format dspace
spelling I57-R163-20.500.13098-120312023-09-20T07:36:59Z Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia González, Joaquín Gattei, Carolina A. Gravano, Agustín Tecnología médica Innovación científica Scientific innovation Recepción auditiva Hearing Health Reconocimiento automático del habla Automatic speech recognition Hipoacusia Hearing loss El presente trabajo se enmarca en el proyecto de investigación de la Dra. Carolina Gattei y la Mag. Analí Taboh, radicado en la Universidad Torcuato Di Tella, en el cual se realizan pruebas que ayudan a diagnosticar a personas con distintas patologías del habla y la audición. Los datos recolectados por el equipo son entrevistas a niños/as con hipoacusia y equipados con audífono(s) y/o implante coclear. La transcripción y análisis de estas pruebas es un proceso manual y costoso en términos de tiempo y recursos. Actualmente, el estado del arte de los principales modelos de reconocimiento automático del habla (ASR por sus siglas en inglés) son entrenados para trabajar en lenguas de amplio alcance (como el español o el inglés) y para personas sin dificultades en el habla. Sin embargo, cuando se trata de hablantes con patologías del habla y la audición, como parte de los resultados de este trabajo se ha corroborado que estos modelos tienen una baja tasa de aciertos dada la escasa, o nula, representación ´on que tiene esta población en los datos de entrenamiento. En el presente trabajo se argumenta que, haciendo uso de técnicas de aprendizaje automático y transferencia de conocimiento, puede sacarse provecho de modelos de ASR pre entrenados para lograr adaptarlos a una población con modelos acústicos poco representados actualmente. El objetivo general de esta tesis es explorar la factibilidad de implementar una metodología que permita la construcción y evaluación de sistemas de procesamiento automático del habla que generen transcripciones enriquecidas sobre los audios producidos por los/as niños/as con dificultades del habla y la audición. Esto requiere de ensamblar distintos modelos especializados en tareas de reconocimiento de voz y elaborar un mecanismo que permita evaluar y comparar estos sistemas. 2023-09-19T22:29:50Z 2023-09-19T22:29:50Z 2023 info:eu-repo/semantics/article info:eu-repo/semantics/acceptedVersion https://repositorio.utdt.edu/handle/20.500.13098/12031 spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-sa/2.5/ar/ 74 p. application/pdf application/pdf Universidad Torcuato Di Tella
institution Universidad Torcuato Di Tella
institution_str I-57
repository_str R-163
collection Repositorio Digital Universidad Torcuato Di Tella
language Español
orig_language_str_mv spa
topic Tecnología médica
Innovación científica
Scientific innovation
Recepción auditiva
Hearing
Health
Reconocimiento automático del habla
Automatic speech recognition
Hipoacusia
Hearing loss
spellingShingle Tecnología médica
Innovación científica
Scientific innovation
Recepción auditiva
Hearing
Health
Reconocimiento automático del habla
Automatic speech recognition
Hipoacusia
Hearing loss
González, Joaquín
Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
topic_facet Tecnología médica
Innovación científica
Scientific innovation
Recepción auditiva
Hearing
Health
Reconocimiento automático del habla
Automatic speech recognition
Hipoacusia
Hearing loss
description El presente trabajo se enmarca en el proyecto de investigación de la Dra. Carolina Gattei y la Mag. Analí Taboh, radicado en la Universidad Torcuato Di Tella, en el cual se realizan pruebas que ayudan a diagnosticar a personas con distintas patologías del habla y la audición. Los datos recolectados por el equipo son entrevistas a niños/as con hipoacusia y equipados con audífono(s) y/o implante coclear. La transcripción y análisis de estas pruebas es un proceso manual y costoso en términos de tiempo y recursos. Actualmente, el estado del arte de los principales modelos de reconocimiento automático del habla (ASR por sus siglas en inglés) son entrenados para trabajar en lenguas de amplio alcance (como el español o el inglés) y para personas sin dificultades en el habla. Sin embargo, cuando se trata de hablantes con patologías del habla y la audición, como parte de los resultados de este trabajo se ha corroborado que estos modelos tienen una baja tasa de aciertos dada la escasa, o nula, representación ´on que tiene esta población en los datos de entrenamiento. En el presente trabajo se argumenta que, haciendo uso de técnicas de aprendizaje automático y transferencia de conocimiento, puede sacarse provecho de modelos de ASR pre entrenados para lograr adaptarlos a una población con modelos acústicos poco representados actualmente. El objetivo general de esta tesis es explorar la factibilidad de implementar una metodología que permita la construcción y evaluación de sistemas de procesamiento automático del habla que generen transcripciones enriquecidas sobre los audios producidos por los/as niños/as con dificultades del habla y la audición. Esto requiere de ensamblar distintos modelos especializados en tareas de reconocimiento de voz y elaborar un mecanismo que permita evaluar y comparar estos sistemas.
author2 Gattei, Carolina A.
author_facet Gattei, Carolina A.
González, Joaquín
format Artículo
acceptedVersion
author González, Joaquín
author_sort González, Joaquín
title Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_short Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_full Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_fullStr Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_full_unstemmed Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_sort diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
publisher Universidad Torcuato Di Tella
publishDate 2023
url https://repositorio.utdt.edu/handle/20.500.13098/12031
work_keys_str_mv AT gonzalezjoaquin disenoimplementacionyevaluaciondemetodologiasparaelprocesamientoautomaticodelhablaenpersonasconhipoacusia
_version_ 1808040606822301696