Inferencia causal mediante correlación sintáctica

Distinguir correlación de causalidad es uno de los desafíos de inferencia más importantes en la actividad científica. Alrededor de este problema se desarrolla la teoría de modelos o redes causales, la cual provee un lenguaje basado en grafos que permite razonar formalmente sobre relaciones causales...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Goren, Gabriel Mauricio
Otros Autores: Bendersky, Ariel Martín
Formato: Tesis de grado publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2021
Acceso en línea:https://hdl.handle.net/20.500.12110/seminario_nFIS000128_Goren
Aporte de:
id seminario:seminario_nFIS000128_Goren
record_format dspace
spelling seminario:seminario_nFIS000128_Goren2023-09-12T13:14:24Z Inferencia causal mediante correlación sintáctica Goren, Gabriel Mauricio Bendersky, Ariel Martín Figueira, Santiago Distinguir correlación de causalidad es uno de los desafíos de inferencia más importantes en la actividad científica. Alrededor de este problema se desarrolla la teoría de modelos o redes causales, la cual provee un lenguaje basado en grafos que permite razonar formalmente sobre relaciones causales y obtener conclusiones a partir de datos e hipótesis adecuadas. Un punto crucial resulta ser qué constituye una correlación o dependencia entre variables. En este trabajo se presenta un abordaje a la inferencia de modelos causales basado en nociones sintácticas de correlación, en contraposición con la noción de correlación estadística usual. En este contexto, las observaciones son codificadas como cadenas de símbolos, y las dependencias entre ellas son evaluadas en términos de la forma de las mismas, y del grado en que pueden ser descriptas o generadas mediante reglas sucintas similares. El concepto de información algorítmica formaliza estas ideas, y de él se desprende una noción de correlación algorítmica universal. Sin embargo, la información algorítmica no puede ser calculada efectivamente, por lo que los tests de independencia condicional sintáctica utilizables en la práctica deben estar necesariamente basados en medidas de complejidad sintáctica más débiles. Concretamente, se implementó un algoritmo para el descubrimiento del esqueleto de la estructura causal subyacente a un conjunto de datos simbólicos, y se desarrollaron tests de independencia condicional basados en dos medidas de complejidad sintáctica computables: la longitud de compresión mediante el compresor comercial gzip y la I-complejidad de Becher y Heiber. Se construyeron ciertos modelos funcionales como generadores de casos de prueba y se realizaron simulaciones en las que se buscó reconstruir la estructura causal de los modelos utilizando el algoritmo. De esta forma se identificó una clase de modelos cuya estructura causal no dirigida pudo ser inferida empleando tests estadísticos, mas no con tests sintácticos (modelos tipo XOR); una clase de modelos cuya estructura pudo ser reconstruida mediante ambos tipos de test (modelos de concatenación) y otra cuya estructura solo pudo ser reconstruida mediante tests sintácticos (modelos de concatenación con shifts). Fil: Goren, Gabriel Mauricio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2021-05-26 info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion application/pdf spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/seminario_nFIS000128_Goren
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Español
orig_language_str_mv spa
description Distinguir correlación de causalidad es uno de los desafíos de inferencia más importantes en la actividad científica. Alrededor de este problema se desarrolla la teoría de modelos o redes causales, la cual provee un lenguaje basado en grafos que permite razonar formalmente sobre relaciones causales y obtener conclusiones a partir de datos e hipótesis adecuadas. Un punto crucial resulta ser qué constituye una correlación o dependencia entre variables. En este trabajo se presenta un abordaje a la inferencia de modelos causales basado en nociones sintácticas de correlación, en contraposición con la noción de correlación estadística usual. En este contexto, las observaciones son codificadas como cadenas de símbolos, y las dependencias entre ellas son evaluadas en términos de la forma de las mismas, y del grado en que pueden ser descriptas o generadas mediante reglas sucintas similares. El concepto de información algorítmica formaliza estas ideas, y de él se desprende una noción de correlación algorítmica universal. Sin embargo, la información algorítmica no puede ser calculada efectivamente, por lo que los tests de independencia condicional sintáctica utilizables en la práctica deben estar necesariamente basados en medidas de complejidad sintáctica más débiles. Concretamente, se implementó un algoritmo para el descubrimiento del esqueleto de la estructura causal subyacente a un conjunto de datos simbólicos, y se desarrollaron tests de independencia condicional basados en dos medidas de complejidad sintáctica computables: la longitud de compresión mediante el compresor comercial gzip y la I-complejidad de Becher y Heiber. Se construyeron ciertos modelos funcionales como generadores de casos de prueba y se realizaron simulaciones en las que se buscó reconstruir la estructura causal de los modelos utilizando el algoritmo. De esta forma se identificó una clase de modelos cuya estructura causal no dirigida pudo ser inferida empleando tests estadísticos, mas no con tests sintácticos (modelos tipo XOR); una clase de modelos cuya estructura pudo ser reconstruida mediante ambos tipos de test (modelos de concatenación) y otra cuya estructura solo pudo ser reconstruida mediante tests sintácticos (modelos de concatenación con shifts).
author2 Bendersky, Ariel Martín
author_facet Bendersky, Ariel Martín
Goren, Gabriel Mauricio
format Tesis de grado
Tesis de grado
publishedVersion
author Goren, Gabriel Mauricio
spellingShingle Goren, Gabriel Mauricio
Inferencia causal mediante correlación sintáctica
author_sort Goren, Gabriel Mauricio
title Inferencia causal mediante correlación sintáctica
title_short Inferencia causal mediante correlación sintáctica
title_full Inferencia causal mediante correlación sintáctica
title_fullStr Inferencia causal mediante correlación sintáctica
title_full_unstemmed Inferencia causal mediante correlación sintáctica
title_sort inferencia causal mediante correlación sintáctica
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2021
url https://hdl.handle.net/20.500.12110/seminario_nFIS000128_Goren
work_keys_str_mv AT gorengabrielmauricio inferenciacausalmediantecorrelacionsintactica
_version_ 1782031610547273728