Producción de la voz, control neuronal y biometría

Este trabajo puede separarse en dos partes. La primera está dedicada al problema biométrico de la voz, es decir, al uso de la voz como caracterización unívoca del hablante. La segunda está dedicada al control neuronal vocal. En la historia de la biométrica, los intentos de descifrar la forma en que...

Descripción completa

Detalles Bibliográficos
Autor principal: Trevisan, Marcos Alberto
Formato: Tesis Doctoral
Lenguaje:Español
Publicado: 2006
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n4470_Trevisan
Aporte de:
id todo:tesis_n4470_Trevisan
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Español
orig_language_str_mv Español
topic FISICA DE LA VOZ
BIOMETRIA
TOPOLOGIA
CONTROL NEURONAL VOCAL
VOICE PHYSICS
BIOMETRICS
TOPOLOGY
NEURAL MOTOR CONTROL
spellingShingle FISICA DE LA VOZ
BIOMETRIA
TOPOLOGIA
CONTROL NEURONAL VOCAL
VOICE PHYSICS
BIOMETRICS
TOPOLOGY
NEURAL MOTOR CONTROL
Trevisan, Marcos Alberto
Producción de la voz, control neuronal y biometría
topic_facet FISICA DE LA VOZ
BIOMETRIA
TOPOLOGIA
CONTROL NEURONAL VOCAL
VOICE PHYSICS
BIOMETRICS
TOPOLOGY
NEURAL MOTOR CONTROL
description Este trabajo puede separarse en dos partes. La primera está dedicada al problema biométrico de la voz, es decir, al uso de la voz como caracterización unívoca del hablante. La segunda está dedicada al control neuronal vocal. En la historia de la biométrica, los intentos de descifrar la forma en que está codificada la identidad de una persona en su voz están basados en tratamientos estadísticos de sus propiedades espectrales. El éxito relativo de estas técnicas se debe a la dificultad de establecer distancias entre estas propiedades. Todos los sistemas de identificación necesitan umbrales de decisión para aceptar o rechazar usuarios. En la primera parte exploramos dos alternativas a este punto de vista. En primer lugar, se construyó un modelo de producción de voz de baja dimensión con el objeto de reproducir la diversidad de los procesos vocales y poder describirlos en términos de un mínimo conjunto de parámetros anatómicos relevantes. Una vez construido el modelo, una pregunta surge inmediatamente: ¿Podrán ajustarse sus parámetros para identificar la voz de cada persona? Los intentos por responder esta pregunta inauguran la segunda alternativa, que consiste en la definición de huellas vocales tipológicas basadas en herramientas creadas para caracterizar la estructura de las órbitas de los sistemas dinámicos, y que nos permitieron traducir cualidades espectrales de la voz en índices topológicos robustos. Los resultados sugieren una nueva dirección en la identificación de las personas por la voz a través de arreglos de números enteros, independientes de umbrales de decisión. La segunda parte de este trabajo está dedicada a la interacción del sistema vocal de un modelo animal sencillo (aves) con el sustrato neuronal que lo controla. En las últimas décadas, el estudio del canto de las aves se desarrolló hasta convertirse en un campo de investigación privilegiado, permitiendo la experimentación con organismos que desarrollaron habilidades de aprendizaje vocal con fuertes paralelos con la adquisición del habla. Este campo se está transformando también en un área de modelado neuronal. La investigación en este campo busca entender la emergencia de patrones acústicos complejos y la estructura del aprendizaje vocal, independiente de factores culturales y sociales. Basándonos en el modelo vocal desarrollado para el habla, la segunda parte del trabajo está dedicada a construir modelos neuronales para aproximarse a estos dos problemas.
format Tesis Doctoral
author Trevisan, Marcos Alberto
author_facet Trevisan, Marcos Alberto
author_sort Trevisan, Marcos Alberto
title Producción de la voz, control neuronal y biometría
title_short Producción de la voz, control neuronal y biometría
title_full Producción de la voz, control neuronal y biometría
title_fullStr Producción de la voz, control neuronal y biometría
title_full_unstemmed Producción de la voz, control neuronal y biometría
title_sort producción de la voz, control neuronal y biometría
publishDate 2006
url https://hdl.handle.net/20.500.12110/tesis_n4470_Trevisan
work_keys_str_mv AT trevisanmarcosalberto producciondelavozcontrolneuronalybiometria
_version_ 1807314565535367168
spelling todo:tesis_n4470_Trevisan2023-10-03T12:48:08Z Producción de la voz, control neuronal y biometría Trevisan, Marcos Alberto FISICA DE LA VOZ BIOMETRIA TOPOLOGIA CONTROL NEURONAL VOCAL VOICE PHYSICS BIOMETRICS TOPOLOGY NEURAL MOTOR CONTROL Este trabajo puede separarse en dos partes. La primera está dedicada al problema biométrico de la voz, es decir, al uso de la voz como caracterización unívoca del hablante. La segunda está dedicada al control neuronal vocal. En la historia de la biométrica, los intentos de descifrar la forma en que está codificada la identidad de una persona en su voz están basados en tratamientos estadísticos de sus propiedades espectrales. El éxito relativo de estas técnicas se debe a la dificultad de establecer distancias entre estas propiedades. Todos los sistemas de identificación necesitan umbrales de decisión para aceptar o rechazar usuarios. En la primera parte exploramos dos alternativas a este punto de vista. En primer lugar, se construyó un modelo de producción de voz de baja dimensión con el objeto de reproducir la diversidad de los procesos vocales y poder describirlos en términos de un mínimo conjunto de parámetros anatómicos relevantes. Una vez construido el modelo, una pregunta surge inmediatamente: ¿Podrán ajustarse sus parámetros para identificar la voz de cada persona? Los intentos por responder esta pregunta inauguran la segunda alternativa, que consiste en la definición de huellas vocales tipológicas basadas en herramientas creadas para caracterizar la estructura de las órbitas de los sistemas dinámicos, y que nos permitieron traducir cualidades espectrales de la voz en índices topológicos robustos. Los resultados sugieren una nueva dirección en la identificación de las personas por la voz a través de arreglos de números enteros, independientes de umbrales de decisión. La segunda parte de este trabajo está dedicada a la interacción del sistema vocal de un modelo animal sencillo (aves) con el sustrato neuronal que lo controla. En las últimas décadas, el estudio del canto de las aves se desarrolló hasta convertirse en un campo de investigación privilegiado, permitiendo la experimentación con organismos que desarrollaron habilidades de aprendizaje vocal con fuertes paralelos con la adquisición del habla. Este campo se está transformando también en un área de modelado neuronal. La investigación en este campo busca entender la emergencia de patrones acústicos complejos y la estructura del aprendizaje vocal, independiente de factores culturales y sociales. Basándonos en el modelo vocal desarrollado para el habla, la segunda parte del trabajo está dedicada a construir modelos neuronales para aproximarse a estos dos problemas. This work is twofolded. The rst part is devoted to voice biometrics, i.e. the problem of a one to one characterization between voice and speaker. The second part is dedicated to the neural vocal control. In the history of voice biometrics, efforts to unveil the speaker's identity were based on spectral descriptions of voiced sounds. The relative success of these techniques is due to the difficulty of establishing how close is close enough when comparing spectral features. Every system needs a threshold to be defined in order to accept or reject users. In the rst part of this work we explore alternatives to this point of view. In the rst place, we built a low dimensional dynamical system which allowed us reproducing the diversity of the vocal processes in terms of a minimal set of anatomically relevant parameters. Once the model was constructed, a question naturally arised: Could its parameters reproduce a particular speaker's voice? Our results leaded to a second perspective which introduces the concept topological voiceprints based on a set of tools created in order to characterize the orbits structure of dynamical systems. That tools allowed us to translate spectral features into sets of robust integers. Our results suggest a new direction in the identification of subjects by voice: one in which arrangements of integers dene voiceprints that stand on their own, despite any acceptance/rejection thresholds. The second part of this work is devoted to the interaction of the vocal system in a simple animal model (birds) and the neural substrate controlling its dynamics. During the last few decades, birdsong developed into a privileged research eld that allowed neuroscientists to experiment with biological organisms that developed vocal learning skills presenting strong analogies with language acquisition. In the present, birdsong is becoming a denite eld of neural modeling. Research in this eld is devoted to understand the emergengy of complex acoustic patterns and to study the neural architecture of vocal learning, independently from social and cultural factors involved in language acquisition. Based on the human vocal model, we developed neural models to address these two specic problems. Fil: Trevisan, Marcos Alberto. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. 2006 Tesis Doctoral PDF Español info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/tesis_n4470_Trevisan