Estimación de parámetros en modelos biológicos complejos. Aplicación a modelos de crecimiento tumoral

Las ciencias de la vida comprenden todos los campos de la ciencia que estudian organismos vivos y procesos biológicos. Tradicionalmente, la biología y la medicina han sido los campos centrales de las ciencias de la vida. Los avances tecnológicos en biología molecular y biotecnología trajeron consigo...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Fernández Slezak, Diego
Formato: Tesis Doctoral
Lenguaje:Español
Publicado: 2010
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n4766_FernandezSlezak
Aporte de:
id todo:tesis_n4766_FernandezSlezak
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Español
orig_language_str_mv Español
description Las ciencias de la vida comprenden todos los campos de la ciencia que estudian organismos vivos y procesos biológicos. Tradicionalmente, la biología y la medicina han sido los campos centrales de las ciencias de la vida. Los avances tecnológicos en biología molecular y biotecnología trajeron consigo un crecimiento sin precedentes de campos interdisciplinarios, tales como la bioinformática, biología computacional, biología de sistemas, y neuroinformática por nombrar algunas. En particular, el estudio computacional del cáncer y terapias asociadas se ha transformado en una rama muy importante dentro de la biología computacional. Resultados provenientes de la biología ́de sistemas están siendo utilizados para todo tipo de investigación que comprenden tanto descubrimientos biológicos como avances para el diagnósticoy la medicina clínica. En muchas aplicaciones, los datos provenientes de estudios clínicos, biológicos o moleculares son condensados en modelos matemáticos con cierto poder predictivo. No es infrecuente que estos modelos incluyan gran cantidad de parámetros libres cuyos valores deben ser estimados para obtener un completa determinación del modelo. El proceso de determinación de parámetros presenta un gran desafío en el desarrollo de modelos matemáticos o computacionales de procesos biológicos. En consecuencia, un paso necesario para la utilización efectiva de modelos en la predicción de fenómenos biológicos es la estimación de parámetros libres. El ajuste de parámetros es un área muy estudiada en ciencia, tecnología, economía estadística, y otras disciplinas, por lo cual existen muchos enfoques para resolverlo. En la mayoría de estos enfoques, uno de los desafíos más difíciles de confrontar es la enorme demanda de poder de cómputo requerida tanto en la resolución delmodelo como en el proceso de estimación de parámetros. Dado que la simulación numérica cuenta entre las aplicaciones más fértiles de la Ciencia de la Computación, no debe resultar extraño que un número considerable de estudiosos de la computación científica se hayan volcado al campo de simulación numérica de procesos biológicos. Con el crecimiento exponencial en la potencia computacional de los sistemas modernos, se han ampliado los desarrollos y resolución de sistemas cada vez más grandes y complejos que han permitido atacar el modelado de sistemas biológicos de alta complejidad. En esta tesis nos proponemos estudiar el problema de estimación de parámetros y evaluación de las soluciones encontradas en el modelado de crecimiento tumoral en etapa avascular, utilizando computación de alto rendimiento. Para ello, hemos extendido un modelo de crecimiento de esferoides multicelulares, modelo que abar ca una gran variedad de casos experimentales. Para la evaluación de este modelo de ecuaciones diferenciales en derivadas parciales con condiciones de borde dependientes del tiempo, se desarrollá una solución numérica utilizando el todo de diferencias finitas. Este modelo resultó tener una considerable versatilidad en las soluciones encontradas, mostrando un rango muy amplio de comportamientos que permiten la explicación de una amplia gama de posibles experimentos. A partir de datos experimentales y sintéticos hemos ajustado los parámetros del modelo mediante técnicas de optimización no lineal, utilizando una función decosto de cuadrados mínimos. Mediante el uso de computación de alto rendimiento con miles de procesadores disponibles, exploramos el espacio de parámetros del problema analizado, evaluando dicha función de costo a partir de distintos puntos iniciales y con distintos algoritmos de optimización. De esta forma, se realizó un barrido exhaustivo del espacio de parámetros, lo que nos permitió encontrar una multiplicidad de mínimos locales en el ajuste de parámetros, como así también lo que a todas luces parece ser el mínimo global de la función de costo. El resultado sorprendente de esta búsqueda exhaustiva es que el valor de los parámetros en el tan buscado mínimo global corresponde a valores de parámetros que carecen de sentido desde un punto de vista biológico. Esta tesis muestra un ejemplo en el cual los parámetros del modelo que optimizan el ajuste a los datos experimentales no son necesariamente los mejores en términos biológicos, un fenómeno que es similar al problema de sobreajuste, conocido en el ámbito de aprendizaje estadístico. De esta manera, ponemos de manifiesto la necesidad de una doble verificación de los parámetros encontrados para identificar posibles soluciones fuera del rango realista en términos biológicos dado la complejidad del espacio de par ́metros. Para evitar dicho sobreajuste del modelo a los datos, proponemos la utilización de parámetros sub-óptimos que, no obstante, son explicativos de comportamientos biológicos no tomados en cuenta en el ajuste, pero que podrán ser utilizados para restringir la enorme cantidad de soluciones sub-óptimas encontradas. De esta forma llegamos a una solución de compromiso entre la función de costo óptima y valores biológicamente realistas. Concluimos que la mejor estrategia para el ajuste de un modelo a un experimento dado es el diseño simultáneo del modelo y los experimentos acordes. Algunos experimentos pueden permitir la determinación de parámetros mejor que otros, por lo que una estrategia posible para el ajuste será la generación de experimentos independientes que permitan contrastar y acotar los valores de los distintos parámetros, especialmente de aquellos que la optimización no ha podido ajustar convincentemente. En la ausencia de un modelo basado en primeros principios, la estimación de parámetros no puede simplemente confiar en la optimización de una función de costo. Proponemos que el enfoque presentado en esta tesis deber ser un procedimiento estándar a la hora de ajustar los parámetros de modelos biológicos complejos, y presentamos una formalización del procedimiento como generalización de la estrategia.
format Tesis Doctoral
author Fernández Slezak, Diego
spellingShingle Fernández Slezak, Diego
Estimación de parámetros en modelos biológicos complejos. Aplicación a modelos de crecimiento tumoral
author_facet Fernández Slezak, Diego
author_sort Fernández Slezak, Diego
title Estimación de parámetros en modelos biológicos complejos. Aplicación a modelos de crecimiento tumoral
title_short Estimación de parámetros en modelos biológicos complejos. Aplicación a modelos de crecimiento tumoral
title_full Estimación de parámetros en modelos biológicos complejos. Aplicación a modelos de crecimiento tumoral
title_fullStr Estimación de parámetros en modelos biológicos complejos. Aplicación a modelos de crecimiento tumoral
title_full_unstemmed Estimación de parámetros en modelos biológicos complejos. Aplicación a modelos de crecimiento tumoral
title_sort estimación de parámetros en modelos biológicos complejos. aplicación a modelos de crecimiento tumoral
publishDate 2010
url https://hdl.handle.net/20.500.12110/tesis_n4766_FernandezSlezak
work_keys_str_mv AT fernandezslezakdiego estimaciondeparametrosenmodelosbiologicoscomplejosaplicacionamodelosdecrecimientotumoral
AT fernandezslezakdiego parameterestimationincomplexbiologicalmodelsapplicationtoavasculartumorgrowthmodels
_version_ 1782026282384490496
spelling todo:tesis_n4766_FernandezSlezak2023-10-03T12:50:21Z Estimación de parámetros en modelos biológicos complejos. Aplicación a modelos de crecimiento tumoral Parameter estimation in complex biological models. Application to avascular tumor growth models Fernández Slezak, Diego Las ciencias de la vida comprenden todos los campos de la ciencia que estudian organismos vivos y procesos biológicos. Tradicionalmente, la biología y la medicina han sido los campos centrales de las ciencias de la vida. Los avances tecnológicos en biología molecular y biotecnología trajeron consigo un crecimiento sin precedentes de campos interdisciplinarios, tales como la bioinformática, biología computacional, biología de sistemas, y neuroinformática por nombrar algunas. En particular, el estudio computacional del cáncer y terapias asociadas se ha transformado en una rama muy importante dentro de la biología computacional. Resultados provenientes de la biología ́de sistemas están siendo utilizados para todo tipo de investigación que comprenden tanto descubrimientos biológicos como avances para el diagnósticoy la medicina clínica. En muchas aplicaciones, los datos provenientes de estudios clínicos, biológicos o moleculares son condensados en modelos matemáticos con cierto poder predictivo. No es infrecuente que estos modelos incluyan gran cantidad de parámetros libres cuyos valores deben ser estimados para obtener un completa determinación del modelo. El proceso de determinación de parámetros presenta un gran desafío en el desarrollo de modelos matemáticos o computacionales de procesos biológicos. En consecuencia, un paso necesario para la utilización efectiva de modelos en la predicción de fenómenos biológicos es la estimación de parámetros libres. El ajuste de parámetros es un área muy estudiada en ciencia, tecnología, economía estadística, y otras disciplinas, por lo cual existen muchos enfoques para resolverlo. En la mayoría de estos enfoques, uno de los desafíos más difíciles de confrontar es la enorme demanda de poder de cómputo requerida tanto en la resolución delmodelo como en el proceso de estimación de parámetros. Dado que la simulación numérica cuenta entre las aplicaciones más fértiles de la Ciencia de la Computación, no debe resultar extraño que un número considerable de estudiosos de la computación científica se hayan volcado al campo de simulación numérica de procesos biológicos. Con el crecimiento exponencial en la potencia computacional de los sistemas modernos, se han ampliado los desarrollos y resolución de sistemas cada vez más grandes y complejos que han permitido atacar el modelado de sistemas biológicos de alta complejidad. En esta tesis nos proponemos estudiar el problema de estimación de parámetros y evaluación de las soluciones encontradas en el modelado de crecimiento tumoral en etapa avascular, utilizando computación de alto rendimiento. Para ello, hemos extendido un modelo de crecimiento de esferoides multicelulares, modelo que abar ca una gran variedad de casos experimentales. Para la evaluación de este modelo de ecuaciones diferenciales en derivadas parciales con condiciones de borde dependientes del tiempo, se desarrollá una solución numérica utilizando el todo de diferencias finitas. Este modelo resultó tener una considerable versatilidad en las soluciones encontradas, mostrando un rango muy amplio de comportamientos que permiten la explicación de una amplia gama de posibles experimentos. A partir de datos experimentales y sintéticos hemos ajustado los parámetros del modelo mediante técnicas de optimización no lineal, utilizando una función decosto de cuadrados mínimos. Mediante el uso de computación de alto rendimiento con miles de procesadores disponibles, exploramos el espacio de parámetros del problema analizado, evaluando dicha función de costo a partir de distintos puntos iniciales y con distintos algoritmos de optimización. De esta forma, se realizó un barrido exhaustivo del espacio de parámetros, lo que nos permitió encontrar una multiplicidad de mínimos locales en el ajuste de parámetros, como así también lo que a todas luces parece ser el mínimo global de la función de costo. El resultado sorprendente de esta búsqueda exhaustiva es que el valor de los parámetros en el tan buscado mínimo global corresponde a valores de parámetros que carecen de sentido desde un punto de vista biológico. Esta tesis muestra un ejemplo en el cual los parámetros del modelo que optimizan el ajuste a los datos experimentales no son necesariamente los mejores en términos biológicos, un fenómeno que es similar al problema de sobreajuste, conocido en el ámbito de aprendizaje estadístico. De esta manera, ponemos de manifiesto la necesidad de una doble verificación de los parámetros encontrados para identificar posibles soluciones fuera del rango realista en términos biológicos dado la complejidad del espacio de par ́metros. Para evitar dicho sobreajuste del modelo a los datos, proponemos la utilización de parámetros sub-óptimos que, no obstante, son explicativos de comportamientos biológicos no tomados en cuenta en el ajuste, pero que podrán ser utilizados para restringir la enorme cantidad de soluciones sub-óptimas encontradas. De esta forma llegamos a una solución de compromiso entre la función de costo óptima y valores biológicamente realistas. Concluimos que la mejor estrategia para el ajuste de un modelo a un experimento dado es el diseño simultáneo del modelo y los experimentos acordes. Algunos experimentos pueden permitir la determinación de parámetros mejor que otros, por lo que una estrategia posible para el ajuste será la generación de experimentos independientes que permitan contrastar y acotar los valores de los distintos parámetros, especialmente de aquellos que la optimización no ha podido ajustar convincentemente. En la ausencia de un modelo basado en primeros principios, la estimación de parámetros no puede simplemente confiar en la optimización de una función de costo. Proponemos que el enfoque presentado en esta tesis deber ser un procedimiento estándar a la hora de ajustar los parámetros de modelos biológicos complejos, y presentamos una formalización del procedimiento como generalización de la estrategia. Computational Life Sciences include all areas of science that study biology processes and living organisms. Computational Life Sciences is helping to provide a fundamental understanding of complex biological systems and offers the potential to significantly impact a wide variety of technologies, including drug discovery, novel therapies for human, animal and plant diseases,metabolic engineering and efficient production of traditional and high-value foodstuffs. In particular, the computational study of cancer and associated therapies has become in a very proliferative and important section of com- putational biology. The vast computational resources that became available during the past decade enabled the development and simulation of increasingly complex math- ematical models of cancer growth. These models typically involve many free parameters whose determination is a substantial obstacle to model develop- ment. Direct measurement of biochemical parameters in vivo is often difficult and sometimes impracticable, while fitting them under data-poor conditions may result in biologically implausible values. In this thesis, we extended a model of avascular tumor growth covering a great amount of experimental cases. We discuss different methodological approaches to estimate parameters in complex biological models. We make use of the high computational power of the Blue Gene technology to perform an extensive study of the parameter space in a model of avascular tumor growth. We explicitly show that the landscape of the cost function used to optimize the model to the data has a very rugged surface in parameter space. This cost function has many local minima with unrealistic solutions, including the global minimum corresponding to the best fit. The case studied in this thesis shows one example in which model parameters that optimally fit the data are not necessarily the best ones from a biological point of view. To avoid force-fitting a model to a dataset, we propose that the best model parameters should be found by choosing, among suboptimal parameters, those that match criteria other than the ones used to fit the model. We also conclude that the model, data and optimization approach form a new complex system, and point to the need of a theory that addresses this problem more generally. Fil: Fernández Slezak, Diego. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. 2010 Tesis Doctoral PDF Español info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/tesis_n4766_FernandezSlezak