Termodinámica y evolución de proteínas repetitivas

Toda sucesión de aminoácidos forma una cadena lineal, pero sólo una minúscula fracción de esas cadenas puede adquirir ciertas estructuras tridimensionales estables en las condiciones apropiadas. Este proceso, denominado plegado, es característico de los polipéptidos que realizan actividades biológic...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Galpern, Ezequiel Alejandro
Otros Autores: Ferreiro, Diego Ulises
Formato: Tesis doctoral publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2022
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n7101_Galpern
Aporte de:
id tesis:tesis_n7101_Galpern
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Español
orig_language_str_mv spa
topic PROTEINAS REPETITIVAS
PLEGADO
EVOLUCION
ANKIRINAS
REPEAT PROTEIN
FOLDING
EVOLUTION
ANKYRIN
spellingShingle PROTEINAS REPETITIVAS
PLEGADO
EVOLUCION
ANKIRINAS
REPEAT PROTEIN
FOLDING
EVOLUTION
ANKYRIN
Galpern, Ezequiel Alejandro
Termodinámica y evolución de proteínas repetitivas
topic_facet PROTEINAS REPETITIVAS
PLEGADO
EVOLUCION
ANKIRINAS
REPEAT PROTEIN
FOLDING
EVOLUTION
ANKYRIN
description Toda sucesión de aminoácidos forma una cadena lineal, pero sólo una minúscula fracción de esas cadenas puede adquirir ciertas estructuras tridimensionales estables en las condiciones apropiadas. Este proceso, denominado plegado, es característico de los polipéptidos que realizan actividades biológicas específicas en los organismos vivos: las proteínas naturales. La hipótesis central de este trabajo es que es posible comprender las relaciones entre las secuencias, la termodinámica de plegado y función biológicas utilizando las señales que ha dejado la evolución en las secuencias naturales. En particular, nos focalizamos en las proteínas repetitivas que constituyen un sistema privilegiado para enfrentarse al problema del plegado. Comenzamos construyendo, curando y analizando un set de datos de secuencias naturales con 1.2 millones de regiones Ankirinas, la familia repetitiva más numerosa. Encontramos que estas proteínas no están formadas por repeticiones de secuencia ordenadas al azar, sino que existen correlaciones características entre las unidades. En particular, los arreglos de repeticiones más largos están formados por repeticiones más similares entre sí. Utilizamos el set de secuencias naturales para aprender un modelo estadístico que infiera las restricciones evolutivas sobre arreglos repetitivos de distinto largo. Proponemos una familia de modelos que incorporan además de mutaciones puntuales, duplicaciones y eliminaciones de repeticiones completas. Encontramos que para reproducir los patrones de correlación entre repeticiones de arreglos naturales es necesario incorporar un mecanismo de ráfagas de duplicaciones que ponen al sistema fuera del equilibrio. Finalmente, proponemos un esquema para mapear localmente la información evolutiva de una secuencia en un modelo de Ising de grano grueso que describe el plegado de proteínas repetitivas. Logramos caracterizar la termodinámica de plegado de miles de proteínas de la familia Ankirina, utilizando solamente información de secuencia. Generamos curvas de plegado térmico y encontramos dominios e intermediarios de plegado que resultan altamente compatibles con resultados experimentales. Encontramos una gran variedad de mecanismos de plegado y demostramos que la estabilidad y la cooperatividad de un arreglo de repeticiones se pueden estimar directamente de las secuencias con un score energético sencillo.
author2 Ferreiro, Diego Ulises
author_facet Ferreiro, Diego Ulises
Galpern, Ezequiel Alejandro
format Tesis doctoral
Tesis doctoral
publishedVersion
author Galpern, Ezequiel Alejandro
author_sort Galpern, Ezequiel Alejandro
title Termodinámica y evolución de proteínas repetitivas
title_short Termodinámica y evolución de proteínas repetitivas
title_full Termodinámica y evolución de proteínas repetitivas
title_fullStr Termodinámica y evolución de proteínas repetitivas
title_full_unstemmed Termodinámica y evolución de proteínas repetitivas
title_sort termodinámica y evolución de proteínas repetitivas
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2022
url https://hdl.handle.net/20.500.12110/tesis_n7101_Galpern
work_keys_str_mv AT galpernezequielalejandro termodinamicayevoluciondeproteinasrepetitivas
AT galpernezequielalejandro thermodynamicsandevolutionofrepeatproteins
_version_ 1782023231910182912
spelling tesis:tesis_n7101_Galpern2023-10-02T20:25:05Z Termodinámica y evolución de proteínas repetitivas Thermodynamics and evolution of repeat-proteins Galpern, Ezequiel Alejandro Ferreiro, Diego Ulises PROTEINAS REPETITIVAS PLEGADO EVOLUCION ANKIRINAS REPEAT PROTEIN FOLDING EVOLUTION ANKYRIN Toda sucesión de aminoácidos forma una cadena lineal, pero sólo una minúscula fracción de esas cadenas puede adquirir ciertas estructuras tridimensionales estables en las condiciones apropiadas. Este proceso, denominado plegado, es característico de los polipéptidos que realizan actividades biológicas específicas en los organismos vivos: las proteínas naturales. La hipótesis central de este trabajo es que es posible comprender las relaciones entre las secuencias, la termodinámica de plegado y función biológicas utilizando las señales que ha dejado la evolución en las secuencias naturales. En particular, nos focalizamos en las proteínas repetitivas que constituyen un sistema privilegiado para enfrentarse al problema del plegado. Comenzamos construyendo, curando y analizando un set de datos de secuencias naturales con 1.2 millones de regiones Ankirinas, la familia repetitiva más numerosa. Encontramos que estas proteínas no están formadas por repeticiones de secuencia ordenadas al azar, sino que existen correlaciones características entre las unidades. En particular, los arreglos de repeticiones más largos están formados por repeticiones más similares entre sí. Utilizamos el set de secuencias naturales para aprender un modelo estadístico que infiera las restricciones evolutivas sobre arreglos repetitivos de distinto largo. Proponemos una familia de modelos que incorporan además de mutaciones puntuales, duplicaciones y eliminaciones de repeticiones completas. Encontramos que para reproducir los patrones de correlación entre repeticiones de arreglos naturales es necesario incorporar un mecanismo de ráfagas de duplicaciones que ponen al sistema fuera del equilibrio. Finalmente, proponemos un esquema para mapear localmente la información evolutiva de una secuencia en un modelo de Ising de grano grueso que describe el plegado de proteínas repetitivas. Logramos caracterizar la termodinámica de plegado de miles de proteínas de la familia Ankirina, utilizando solamente información de secuencia. Generamos curvas de plegado térmico y encontramos dominios e intermediarios de plegado que resultan altamente compatibles con resultados experimentales. Encontramos una gran variedad de mecanismos de plegado y demostramos que la estabilidad y la cooperatividad de un arreglo de repeticiones se pueden estimar directamente de las secuencias con un score energético sencillo. Every sequence of amino acids forms a linear chain, but only a minute fraction of those chains can acquire certain stable three-dimensional structures under the appropriate conditions. This process, name folding, is characteristic of the polypeptides that perform specific biological activities in living organisms: natural proteins. The central hypothesis of this work is that it is possible to understand the relationship between sequence, folding thermodynamics and biological function using the traces left by natural sequences evolution. Particularly, we focus on repeat-proteins that are a privileged system to face the folding problem. We start by building, curating and analyzing a natural sequence dataset that contain 1.2 million Ankyrin regions, the most abundant repeat-protein family. We found that these proteins are not made of randomly arranged repeat sequences, but there are characteristic correlations between the units. In particular,longer arrays are made up of repeats that are more similar to each other than shorter arrays. We used the natural sequence dataset to learn a statistical model that infers the evolutionay constraints on repeat-arrays of varying length. We propose a family of models that incorporates in addition to point mutations, whole repeat duplications and deletions. We found that to reproduce the correlation patterns between repeats in natural arrays, is necessary to incorporate a duplication burst mechanism that pulls the system out of equilibrium. Finally, we propose a scheme to map evolutionary information at the sequence level locally to a coarse-grained Ising model for repeat-protein folding. We characterized the folding thermodynamics of thousands of Ankyrin proteins using only sequence information. We generated thermal folding curves, we detected apparent domain emergence and occupation of intermediate states that are highly compatible with experimental data. We found a multiplicity of folding mechanisms and we showed that stability and cooperativity of a repeat-array can be estimated from sequences using a simple energy score. Fil: Galpern, Ezequiel Alejandro. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2022-07-13 info:eu-repo/semantics/doctoralThesis info:ar-repo/semantics/tesis doctoral info:eu-repo/semantics/publishedVersion application/pdf spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/tesis_n7101_Galpern