Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia

El presente trabajo se enmarca en el proyecto de investigación de la Dra. Carolina Gattei y la Mag. Analí Taboh, radicado en la Universidad Torcuato Di Tella, en el cual se realizan pruebas que ayudan a diagnosticar a personas con distintas patologías del habla y la audición. Los datos recolectados...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autor principal:	González, Joaquín
Otros Autores:	Gattei, Carolina A.
Formato:	Artículo acceptedVersion
Lenguaje:	Español
Publicado:	Universidad Torcuato Di Tella 2023
Materias:	Tecnología médica Innovación científica Scientific innovation Recepción auditiva Hearing Health Reconocimiento automático del habla Automatic speech recognition Hipoacusia Hearing loss
Acceso en línea:	https://repositorio.utdt.edu/handle/20.500.13098/12031
Aporte de:	Repositorio Digital Universidad Torcuato Di Tella de Universidad Torcuato Di Tella

id	I57-R163-20.500.13098-12031
record_format	dspace
spelling	I57-R163-20.500.13098-120312023-09-20T07:36:59Z Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia González, Joaquín Gattei, Carolina A. Gravano, Agustín Tecnología médica Innovación científica Scientific innovation Recepción auditiva Hearing Health Reconocimiento automático del habla Automatic speech recognition Hipoacusia Hearing loss El presente trabajo se enmarca en el proyecto de investigación de la Dra. Carolina Gattei y la Mag. Analí Taboh, radicado en la Universidad Torcuato Di Tella, en el cual se realizan pruebas que ayudan a diagnosticar a personas con distintas patologías del habla y la audición. Los datos recolectados por el equipo son entrevistas a niños/as con hipoacusia y equipados con audífono(s) y/o implante coclear. La transcripción y análisis de estas pruebas es un proceso manual y costoso en términos de tiempo y recursos. Actualmente, el estado del arte de los principales modelos de reconocimiento automático del habla (ASR por sus siglas en inglés) son entrenados para trabajar en lenguas de amplio alcance (como el español o el inglés) y para personas sin dificultades en el habla. Sin embargo, cuando se trata de hablantes con patologías del habla y la audición, como parte de los resultados de este trabajo se ha corroborado que estos modelos tienen una baja tasa de aciertos dada la escasa, o nula, representación ´on que tiene esta población en los datos de entrenamiento. En el presente trabajo se argumenta que, haciendo uso de técnicas de aprendizaje automático y transferencia de conocimiento, puede sacarse provecho de modelos de ASR pre entrenados para lograr adaptarlos a una población con modelos acústicos poco representados actualmente. El objetivo general de esta tesis es explorar la factibilidad de implementar una metodología que permita la construcción y evaluación de sistemas de procesamiento automático del habla que generen transcripciones enriquecidas sobre los audios producidos por los/as niños/as con dificultades del habla y la audición. Esto requiere de ensamblar distintos modelos especializados en tareas de reconocimiento de voz y elaborar un mecanismo que permita evaluar y comparar estos sistemas. 2023-09-19T22:29:50Z 2023-09-19T22:29:50Z 2023 info:eu-repo/semantics/article info:eu-repo/semantics/acceptedVersion https://repositorio.utdt.edu/handle/20.500.13098/12031 spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-sa/2.5/ar/ 74 p. application/pdf application/pdf Universidad Torcuato Di Tella
institution	Universidad Torcuato Di Tella
institution_str	I-57
repository_str	R-163
collection	Repositorio Digital Universidad Torcuato Di Tella
language	Español
orig_language_str_mv	spa
topic	Tecnología médica Innovación científica Scientific innovation Recepción auditiva Hearing Health Reconocimiento automático del habla Automatic speech recognition Hipoacusia Hearing loss
spellingShingle	Tecnología médica Innovación científica Scientific innovation Recepción auditiva Hearing Health Reconocimiento automático del habla Automatic speech recognition Hipoacusia Hearing loss González, Joaquín Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
topic_facet	Tecnología médica Innovación científica Scientific innovation Recepción auditiva Hearing Health Reconocimiento automático del habla Automatic speech recognition Hipoacusia Hearing loss
description	El presente trabajo se enmarca en el proyecto de investigación de la Dra. Carolina Gattei y la Mag. Analí Taboh, radicado en la Universidad Torcuato Di Tella, en el cual se realizan pruebas que ayudan a diagnosticar a personas con distintas patologías del habla y la audición. Los datos recolectados por el equipo son entrevistas a niños/as con hipoacusia y equipados con audífono(s) y/o implante coclear. La transcripción y análisis de estas pruebas es un proceso manual y costoso en términos de tiempo y recursos. Actualmente, el estado del arte de los principales modelos de reconocimiento automático del habla (ASR por sus siglas en inglés) son entrenados para trabajar en lenguas de amplio alcance (como el español o el inglés) y para personas sin dificultades en el habla. Sin embargo, cuando se trata de hablantes con patologías del habla y la audición, como parte de los resultados de este trabajo se ha corroborado que estos modelos tienen una baja tasa de aciertos dada la escasa, o nula, representación ´on que tiene esta población en los datos de entrenamiento. En el presente trabajo se argumenta que, haciendo uso de técnicas de aprendizaje automático y transferencia de conocimiento, puede sacarse provecho de modelos de ASR pre entrenados para lograr adaptarlos a una población con modelos acústicos poco representados actualmente. El objetivo general de esta tesis es explorar la factibilidad de implementar una metodología que permita la construcción y evaluación de sistemas de procesamiento automático del habla que generen transcripciones enriquecidas sobre los audios producidos por los/as niños/as con dificultades del habla y la audición. Esto requiere de ensamblar distintos modelos especializados en tareas de reconocimiento de voz y elaborar un mecanismo que permita evaluar y comparar estos sistemas.
author2	Gattei, Carolina A.
author_facet	Gattei, Carolina A. González, Joaquín
format	Artículo acceptedVersion
author	González, Joaquín
author_sort	González, Joaquín
title	Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_short	Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_full	Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_fullStr	Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_full_unstemmed	Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
title_sort	diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia
publisher	Universidad Torcuato Di Tella
publishDate	2023
url	https://repositorio.utdt.edu/handle/20.500.13098/12031
work_keys_str_mv	AT gonzalezjoaquin disenoimplementacionyevaluaciondemetodologiasparaelprocesamientoautomaticodelhablaenpersonasconhipoacusia
_version_	1808040606822301696

Diseño, implementación y evaluación de metodologías para el procesamiento automático del habla en personas con hipoacusia

Ejemplares similares