Análisis de variantes génicas en el gen CYP21A2

Con el nombre de Hiperplasia Suprarrenal Congénita (HSC) se conoce a un conjunto de enfermedades autosómicas recesivas, en las que se encuentra afectada la esteroidogénesis adrenal. En el 95% de los casos, la HSC se produce por deficiencia de la enzima 21-hidroxilasa. Esta deficiencia puede manifest...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Bruque, Carlos David
Formato: Tesis Doctoral
Lenguaje:Español
Publicado: 2019
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n6897_Bruque
Aporte de:
id todo:tesis_n6897_Bruque
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Español
orig_language_str_mv Español
topic HIPERPLASIA SUPRARRENAL CONGENITA
21-HIDROXILASA
GEN CYP21A2
MODELO PREDICTIVO
REGIONES REGULATORIAS
CONGENITAL ADRENAL HYPERPLASIA
21-HYDROXYLASE
CYP21A2 GENE
PREDICTIVE MODEL
REGULATORY REGIONS
spellingShingle HIPERPLASIA SUPRARRENAL CONGENITA
21-HIDROXILASA
GEN CYP21A2
MODELO PREDICTIVO
REGIONES REGULATORIAS
CONGENITAL ADRENAL HYPERPLASIA
21-HYDROXYLASE
CYP21A2 GENE
PREDICTIVE MODEL
REGULATORY REGIONS
Bruque, Carlos David
Análisis de variantes génicas en el gen CYP21A2
topic_facet HIPERPLASIA SUPRARRENAL CONGENITA
21-HIDROXILASA
GEN CYP21A2
MODELO PREDICTIVO
REGIONES REGULATORIAS
CONGENITAL ADRENAL HYPERPLASIA
21-HYDROXYLASE
CYP21A2 GENE
PREDICTIVE MODEL
REGULATORY REGIONS
description Con el nombre de Hiperplasia Suprarrenal Congénita (HSC) se conoce a un conjunto de enfermedades autosómicas recesivas, en las que se encuentra afectada la esteroidogénesis adrenal. En el 95% de los casos, la HSC se produce por deficiencia de la enzima 21-hidroxilasa. Esta deficiencia puede manifestarse en forma grave o clásica (FC), con dos presentaciones clínicas, perdedora de sal (PS) y simple virilizante (SV), y una leve o no clásica (NC). La enzima está codificada por el gen CYP21A2, ubicado en 6p21.33. El mismo, se encuentra duplicado y repetido en tándem junto a un pseudogen CYP21A1P con el que comparte 98% de identidad de secuencia. La elevada identidad de secuencia produce que la región sea propensa al alineamiento incorrecto y a la recombinación desigual, como así también a la transferencia de secuencias del pseudogen al gen mediante el mecanismo de conversión génica. La mayor parte de los afectados son compuesto heterocigotas ya que poseen diferentes mutaciones en cada uno de sus alelos. En estos casos, la manifestación clínica de la enfermedad será aquella que se relaciona con el alelo con mayor actividad enzimática. Si bien las variantes más frecuentemente encontradas en los pacientes son aquellas derivadas del pseudogen, hay un número cada vez mayor de variantes que no derivan del mismo. Los avances en la secuenciación han posibilitado una gran cantidad de información genética, sin embargo, en muchos casos esta información no se encuentra claramente estructurada, y las fuentes de información, que generalmente son diferentes bases de datos, no siempre son de fácil acceso. Por otra parte, la correcta interpretación de las implicancias biológicas de las variantes encontradas es de gran interés a la hora de determinar su patogenicidad. Nuestro laboratorio ha trabajado por más de 22 años en el diagnóstico e investigación de la deficiencia en 21-hidroxilasa. En los comienzos, caracterizando la presencia de las variantes génicas más frecuentes en el gen CYP21A2 (aquellas derivadas del pseudogen), en pacientes con deficiencia de 21-hidroxilasa de nuestra población, para luego proseguir con la secuenciación completa del gen, lo que posibilitó la identificación de variantes nunca antes descriptas, tanto en regiones codificantes, como no codificantes y regulatorias. Varias de estas variantes fueron ensayadas in vitro para determinar sus efectos biológicos. Si bien ante la presencia de una variante de secuencia no descripta, los ensayos funcionales son importantes para estimar la actividad residual de la enzima, los mismos son muy costosos, requieren de equipamiento específico y de mucho tiempo para poder ser realizados. En este contexto, y gracias a los avances bioinformáticos, existe una tendencia a utilizar diferentes herramientas computacionales que permitirían la predicción del efecto biológico de una variante de secuencia. La primera parte de esta tesis doctoral consistió en la realización de un modelo predictivo específico de la 21-hidroxilasa basado en la estructura proteica, con el fin de determinar la patogenicidad de las variantes de secuencia en la región traducible del gen CYP21A2. Se obtuvo un modelo de la proteína humana basado en la cristalografía de la proteína bovina y se analizaron 343 mutantes a las cuales se las clasificó de acuerdo a su efecto biológico sobre la proteína entre aquellas asociadas al grupo Hemo, con unión a sustrato, unión a P450 Oxidoreductasa (POR), entre otros. Ciento cuarenta y siete mutantes fueron clasificadas como potencialmente asociadas a la estabilidad de la proteína. Para estas mutantes se analizó la variación de energía libre (ΔΔG) respecto de la proteína salvaje y se la correlacionó con la actividad residual in vitro. Los resultados obtenidos fueron la base para luego estimar, mediante el cálculo de ΔΔG, la actividad residual de mutantes en las cuales no se contaba con ensayos funcionales. Este mismo procedimiento se aplicó luego sobre la estructura de la proteína humana, cuya cristalografía fue publicada en el transcurso de la tesis doctoral. Asimismo, y considerando la gran cantidad de información que se encontraba dispersa en diferentes bases de datos, publicaciones científicas así como los resultados de variantes genética obtenidas en nuestro laboratorio, se compilaron y estandarizaron los datos en una base de datos especializada, no redundante, curada y en la que se pudiera establecer una clara asociación fenotipo-genotipo con el objetivo que la misma pudiera ser útil en la práctica clínica y así facilitar el diagnóstico en la deficiencia en 21-hidroxilasa. Esta base unificada contiene los datos de 899 variantes del gen CYP21A2, de las cuales para 230 fue posible establecer una correlación con diferentes formas de presentación de la patología. La segunda parte de la tesis consistió en la realización de ensayos in vitro de una de las regiones regulatorias de la transcripción del gen, denominada promotor Z (PZ). En trabajos previos de nuestro laboratorio se describió la presencia de una variante de secuencia g.32033649A>G (GRCh38.p7) en esta región que causa una disminución de la tasa transcripcional del gen CYP21A2. Mediante análisis bioinformático se predijo que esta variante podría estar generando una nueva interacción con el receptor de glucocorticoides (GR). Estas predicciones resultaban muy novedosas, ya que no se había descripto hasta el momento que el GR pudiera modular la expresión del CYP21A2. A los efectos de comprobar la posible participación del GR y el mecanismo molecular por el cual la variante hallada reducía la transcripción del gen, se realizaron ensayos de estimulación de la transcripción en presencia de dexametasona y cortisol, en líneas celulares esteroidogénicas que fueron transfectadas con un vector con la versión salvaje o mutada del PZ río arriba del gen luciferasa. Estos ensayos se complementaron con el análisis de la expresión endógena del mensajero en las mismas células (sin los vectores) y con los estímulos mencionados. Los resultados obtenidos, si bien son preliminares, no estarían indicando que la región del PZ se module en presencia de GR. Sin embargo, se observó que la expresión del gen endógeno variaba en presencia de los estímulos, lo que indicaría que no se puede descartar que el GR pudiera modular la expresión del CYP21A2. En conclusión, en esta tesis se generó un modelo predictivo específico basado en la estructura proteica para la 21 hidroxilasa, se desarrolló una base de datos de variantes génicas integral con información de correlación genotipo-fenotipo y se avanzó en la comprensión de los elementos regulatorios implicados en la expresión del gen CYP21A2.
format Tesis Doctoral
author Bruque, Carlos David
author_facet Bruque, Carlos David
author_sort Bruque, Carlos David
title Análisis de variantes génicas en el gen CYP21A2
title_short Análisis de variantes génicas en el gen CYP21A2
title_full Análisis de variantes génicas en el gen CYP21A2
title_fullStr Análisis de variantes génicas en el gen CYP21A2
title_full_unstemmed Análisis de variantes génicas en el gen CYP21A2
title_sort análisis de variantes génicas en el gen cyp21a2
publishDate 2019
url https://hdl.handle.net/20.500.12110/tesis_n6897_Bruque
work_keys_str_mv AT bruquecarlosdavid analisisdevariantesgenicasenelgencyp21a2
AT bruquecarlosdavid analysisofgenevariantsinthecyp21a2gene
_version_ 1782023618272690176
spelling todo:tesis_n6897_Bruque2023-10-03T13:14:02Z Análisis de variantes génicas en el gen CYP21A2 Analysis of gene variants in the CYP21A2 gene Bruque, Carlos David HIPERPLASIA SUPRARRENAL CONGENITA 21-HIDROXILASA GEN CYP21A2 MODELO PREDICTIVO REGIONES REGULATORIAS CONGENITAL ADRENAL HYPERPLASIA 21-HYDROXYLASE CYP21A2 GENE PREDICTIVE MODEL REGULATORY REGIONS Con el nombre de Hiperplasia Suprarrenal Congénita (HSC) se conoce a un conjunto de enfermedades autosómicas recesivas, en las que se encuentra afectada la esteroidogénesis adrenal. En el 95% de los casos, la HSC se produce por deficiencia de la enzima 21-hidroxilasa. Esta deficiencia puede manifestarse en forma grave o clásica (FC), con dos presentaciones clínicas, perdedora de sal (PS) y simple virilizante (SV), y una leve o no clásica (NC). La enzima está codificada por el gen CYP21A2, ubicado en 6p21.33. El mismo, se encuentra duplicado y repetido en tándem junto a un pseudogen CYP21A1P con el que comparte 98% de identidad de secuencia. La elevada identidad de secuencia produce que la región sea propensa al alineamiento incorrecto y a la recombinación desigual, como así también a la transferencia de secuencias del pseudogen al gen mediante el mecanismo de conversión génica. La mayor parte de los afectados son compuesto heterocigotas ya que poseen diferentes mutaciones en cada uno de sus alelos. En estos casos, la manifestación clínica de la enfermedad será aquella que se relaciona con el alelo con mayor actividad enzimática. Si bien las variantes más frecuentemente encontradas en los pacientes son aquellas derivadas del pseudogen, hay un número cada vez mayor de variantes que no derivan del mismo. Los avances en la secuenciación han posibilitado una gran cantidad de información genética, sin embargo, en muchos casos esta información no se encuentra claramente estructurada, y las fuentes de información, que generalmente son diferentes bases de datos, no siempre son de fácil acceso. Por otra parte, la correcta interpretación de las implicancias biológicas de las variantes encontradas es de gran interés a la hora de determinar su patogenicidad. Nuestro laboratorio ha trabajado por más de 22 años en el diagnóstico e investigación de la deficiencia en 21-hidroxilasa. En los comienzos, caracterizando la presencia de las variantes génicas más frecuentes en el gen CYP21A2 (aquellas derivadas del pseudogen), en pacientes con deficiencia de 21-hidroxilasa de nuestra población, para luego proseguir con la secuenciación completa del gen, lo que posibilitó la identificación de variantes nunca antes descriptas, tanto en regiones codificantes, como no codificantes y regulatorias. Varias de estas variantes fueron ensayadas in vitro para determinar sus efectos biológicos. Si bien ante la presencia de una variante de secuencia no descripta, los ensayos funcionales son importantes para estimar la actividad residual de la enzima, los mismos son muy costosos, requieren de equipamiento específico y de mucho tiempo para poder ser realizados. En este contexto, y gracias a los avances bioinformáticos, existe una tendencia a utilizar diferentes herramientas computacionales que permitirían la predicción del efecto biológico de una variante de secuencia. La primera parte de esta tesis doctoral consistió en la realización de un modelo predictivo específico de la 21-hidroxilasa basado en la estructura proteica, con el fin de determinar la patogenicidad de las variantes de secuencia en la región traducible del gen CYP21A2. Se obtuvo un modelo de la proteína humana basado en la cristalografía de la proteína bovina y se analizaron 343 mutantes a las cuales se las clasificó de acuerdo a su efecto biológico sobre la proteína entre aquellas asociadas al grupo Hemo, con unión a sustrato, unión a P450 Oxidoreductasa (POR), entre otros. Ciento cuarenta y siete mutantes fueron clasificadas como potencialmente asociadas a la estabilidad de la proteína. Para estas mutantes se analizó la variación de energía libre (ΔΔG) respecto de la proteína salvaje y se la correlacionó con la actividad residual in vitro. Los resultados obtenidos fueron la base para luego estimar, mediante el cálculo de ΔΔG, la actividad residual de mutantes en las cuales no se contaba con ensayos funcionales. Este mismo procedimiento se aplicó luego sobre la estructura de la proteína humana, cuya cristalografía fue publicada en el transcurso de la tesis doctoral. Asimismo, y considerando la gran cantidad de información que se encontraba dispersa en diferentes bases de datos, publicaciones científicas así como los resultados de variantes genética obtenidas en nuestro laboratorio, se compilaron y estandarizaron los datos en una base de datos especializada, no redundante, curada y en la que se pudiera establecer una clara asociación fenotipo-genotipo con el objetivo que la misma pudiera ser útil en la práctica clínica y así facilitar el diagnóstico en la deficiencia en 21-hidroxilasa. Esta base unificada contiene los datos de 899 variantes del gen CYP21A2, de las cuales para 230 fue posible establecer una correlación con diferentes formas de presentación de la patología. La segunda parte de la tesis consistió en la realización de ensayos in vitro de una de las regiones regulatorias de la transcripción del gen, denominada promotor Z (PZ). En trabajos previos de nuestro laboratorio se describió la presencia de una variante de secuencia g.32033649A>G (GRCh38.p7) en esta región que causa una disminución de la tasa transcripcional del gen CYP21A2. Mediante análisis bioinformático se predijo que esta variante podría estar generando una nueva interacción con el receptor de glucocorticoides (GR). Estas predicciones resultaban muy novedosas, ya que no se había descripto hasta el momento que el GR pudiera modular la expresión del CYP21A2. A los efectos de comprobar la posible participación del GR y el mecanismo molecular por el cual la variante hallada reducía la transcripción del gen, se realizaron ensayos de estimulación de la transcripción en presencia de dexametasona y cortisol, en líneas celulares esteroidogénicas que fueron transfectadas con un vector con la versión salvaje o mutada del PZ río arriba del gen luciferasa. Estos ensayos se complementaron con el análisis de la expresión endógena del mensajero en las mismas células (sin los vectores) y con los estímulos mencionados. Los resultados obtenidos, si bien son preliminares, no estarían indicando que la región del PZ se module en presencia de GR. Sin embargo, se observó que la expresión del gen endógeno variaba en presencia de los estímulos, lo que indicaría que no se puede descartar que el GR pudiera modular la expresión del CYP21A2. En conclusión, en esta tesis se generó un modelo predictivo específico basado en la estructura proteica para la 21 hidroxilasa, se desarrolló una base de datos de variantes génicas integral con información de correlación genotipo-fenotipo y se avanzó en la comprensión de los elementos regulatorios implicados en la expresión del gen CYP21A2. Congenital Adrenal Hyperplasia (CAH) constitutes a series of autosomal recessive disorders in which adrenal steroidogenesis is affected. In 95% of the cases, CAH is caused by 21-hydroxylase deficiency. This deficit can be severe (classical form), with two clinical forms, salt wasting (SW) and simple virilizing (SV), or be mild or non-classical (NC). The enzyme is encoded by the CYP21A2 gene, located in 6p21.33. The gene is adjacent to its pseudogene, CYP21A1P, with which it shares 98% sequence identity. This high sequence identity causes the region to sometimes be misaligned, causing unequal crossing over, as well as the transference of sequences from the pseudogene via gene conversion. Most of the patients with CAH are compound heterozygotes, meaning that they have different mutations in each of their alleles. In these cases, the clinical manifestation will be the one corresponding to the allele with the highest enzymatic activity. While the most frequently variants found are those derived from the pseudogene, an increasing number of variants not derived from it have been described. Advances in gene sequencing have made a huge amount of genetic information available, but this information is often not clearly structured and its sources, generally different databases, are not always easy to access. Moreover, the correct interpretation of the biological implications for these variants is of great interest when determining its pathogenicity. Our laboratory has over 22 years of experience in diagnosis and investigation of 21-hydroxylase deficiency. Firstly, characterizing the presence of the gene’s most frequent genetic variants (those derived from the pseudogene) in patients with 21-hydroxylase deficiency within our population. Then, sequencing of the whole gene was implemented, which made the identification of novel genetic variants possible, not only in coding, but also in noncoding and regulatory regions. Several of these variants were in vitro assayed to determine their biological effects. While in the presence of a non-described sequence variants, functional assays are important to estimate the enzyme’s residual activity, they are very expensive, require specific equipment and are too time-consuming to be carried out. In this context, and thanks to recent advances in bioinformatics, there is a tendency to use computational tools to predict the biological effect of a sequence variant. The first part of the thesis consisted of the creation of a 21-hydroxylase-specific predictive model based on protein structure in order to determine the pathogenicity of sequence variants in the translated region of the CYP21A2 gene. A model of the human protein based on X-ray crystallography was obtained and 343 mutants were analyzed in order to classify them according to their biological effect on the protein, as associated to the Heme group, with substrate binding, P450 oxidoreductase (POR) union, and others. Up to 147 mutants were classified as potentially associated to protein stability. For these mutants folding free energy variation (ΔΔG) in comparison to the wild type protein was analysed and correlated to residual in vitro activity. These results were then used to estimate the residual activity of mutants in which functional assays were not available. This same procedure was then applied to the human protein structure, since its 3D crystallographic structure was published during this thesis. Likewise, and considering the amount of information in different databases, scientific publications and genetic variants found in our laboratory, we compiled and standardized all these data in a specialised, non-redundant, curated database in order to establish a phenotype-genotype relationship which could be useful in the clinical practice and facilitate the diagnosis of 21-hydroxylase deficiency. This unified database has information about 899 CYP21A2 gene variants, from which in 230 a correlation to different forms of the pathology could be established. The second part of the thesis consisted in in vitro assays of one of the gene’s transcription regulatory regions called Z promoter (ZP). In previous studies from our laboratory the presence of the g.32033649A>G (GRCh38.p7) variant was described in this region. This variant causes a reduction of the transcriptional rate for the CYP21A2 gene. It was predicted by bioinformatic analysis that this variant could generate a new interaction site with the glucocorticoid receptor (GR). This prediction turned out to be very useful, since no previous description of GR modulating the expression of CYP21A2 has been reported. So, to test the possible participation of GR and the molecular mechanism by which this variant decreased the transcriptional rate, transcriptional stimulation assays were carried out in the presence of dexamethasone and cortisol, in steroidogenic cell lines transfected with a vector containing the wild type or variant version of the ZP upstream of the luciferase gene. These assays were complemented with an analysis of the endogenous expression of the mRNA in the same cells (without the vectors) and with the above mentioned glucocorticoids. These results, while preliminary, suggest that the PZ region is not modulated in the presence of GR. However, the endogenous gene expression variation was observed in presence of stimuli, which would suggest that aa modulation of CYP21A2 expression could not be rejected. In conclusion, this thesis achieved a specific predictive model based on the structure of the 21-hydroxylase protein, the development of an integral genetic variant database with genotype-phenotype correlation information and a better comprehension of the regulatory elements implicated in CYP21A2’s expression. Fil: Bruque, Carlos David. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. 2019-03-28 Tesis Doctoral PDF Español info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/tesis_n6897_Bruque