Inferencia causal mediante correlación sintáctica
Distinguir correlación de causalidad es uno de los desafíos de inferencia más importantes en la actividad científica. Alrededor de este problema se desarrolla la teoría de modelos o redes causales, la cual provee un lenguaje basado en grafos que permite razonar formalmente sobre relaciones causales...
Guardado en:
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | Tesis de grado publishedVersion |
Lenguaje: | Español |
Publicado: |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
2021
|
Acceso en línea: | https://hdl.handle.net/20.500.12110/seminario_nFIS000128_Goren |
Aporte de: |
id |
seminario:seminario_nFIS000128_Goren |
---|---|
record_format |
dspace |
spelling |
seminario:seminario_nFIS000128_Goren2023-09-12T13:14:24Z Inferencia causal mediante correlación sintáctica Goren, Gabriel Mauricio Bendersky, Ariel Martín Figueira, Santiago Distinguir correlación de causalidad es uno de los desafíos de inferencia más importantes en la actividad científica. Alrededor de este problema se desarrolla la teoría de modelos o redes causales, la cual provee un lenguaje basado en grafos que permite razonar formalmente sobre relaciones causales y obtener conclusiones a partir de datos e hipótesis adecuadas. Un punto crucial resulta ser qué constituye una correlación o dependencia entre variables. En este trabajo se presenta un abordaje a la inferencia de modelos causales basado en nociones sintácticas de correlación, en contraposición con la noción de correlación estadística usual. En este contexto, las observaciones son codificadas como cadenas de símbolos, y las dependencias entre ellas son evaluadas en términos de la forma de las mismas, y del grado en que pueden ser descriptas o generadas mediante reglas sucintas similares. El concepto de información algorítmica formaliza estas ideas, y de él se desprende una noción de correlación algorítmica universal. Sin embargo, la información algorítmica no puede ser calculada efectivamente, por lo que los tests de independencia condicional sintáctica utilizables en la práctica deben estar necesariamente basados en medidas de complejidad sintáctica más débiles. Concretamente, se implementó un algoritmo para el descubrimiento del esqueleto de la estructura causal subyacente a un conjunto de datos simbólicos, y se desarrollaron tests de independencia condicional basados en dos medidas de complejidad sintáctica computables: la longitud de compresión mediante el compresor comercial gzip y la I-complejidad de Becher y Heiber. Se construyeron ciertos modelos funcionales como generadores de casos de prueba y se realizaron simulaciones en las que se buscó reconstruir la estructura causal de los modelos utilizando el algoritmo. De esta forma se identificó una clase de modelos cuya estructura causal no dirigida pudo ser inferida empleando tests estadísticos, mas no con tests sintácticos (modelos tipo XOR); una clase de modelos cuya estructura pudo ser reconstruida mediante ambos tipos de test (modelos de concatenación) y otra cuya estructura solo pudo ser reconstruida mediante tests sintácticos (modelos de concatenación con shifts). Fil: Goren, Gabriel Mauricio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2021-05-26 info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion application/pdf spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/seminario_nFIS000128_Goren |
institution |
Universidad de Buenos Aires |
institution_str |
I-28 |
repository_str |
R-134 |
collection |
Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA) |
language |
Español |
orig_language_str_mv |
spa |
description |
Distinguir correlación de causalidad es uno de los desafíos de inferencia más importantes en la actividad científica. Alrededor de este problema se desarrolla la teoría de modelos o redes causales, la cual provee un lenguaje basado en grafos que permite razonar formalmente sobre relaciones causales y obtener conclusiones a partir de datos e hipótesis adecuadas. Un punto crucial resulta ser qué constituye una correlación o dependencia entre variables. En este trabajo se presenta un abordaje a la inferencia de modelos causales basado en nociones sintácticas de correlación, en contraposición con la noción de correlación estadística usual. En este contexto, las observaciones son codificadas como cadenas de símbolos, y las dependencias entre ellas son evaluadas en términos de la forma de las mismas, y del grado en que pueden ser descriptas o generadas mediante reglas sucintas similares. El concepto de información algorítmica formaliza estas ideas, y de él se desprende una noción de correlación algorítmica universal. Sin embargo, la información algorítmica no puede ser calculada efectivamente, por lo que los tests de independencia condicional sintáctica utilizables en la práctica deben estar necesariamente basados en medidas de complejidad sintáctica más débiles. Concretamente, se implementó un algoritmo para el descubrimiento del esqueleto de la estructura causal subyacente a un conjunto de datos simbólicos, y se desarrollaron tests de independencia condicional basados en dos medidas de complejidad sintáctica computables: la longitud de compresión mediante el compresor comercial gzip y la I-complejidad de Becher y Heiber. Se construyeron ciertos modelos funcionales como generadores de casos de prueba y se realizaron simulaciones en las que se buscó reconstruir la estructura causal de los modelos utilizando el algoritmo. De esta forma se identificó una clase de modelos cuya estructura causal no dirigida pudo ser inferida empleando tests estadísticos, mas no con tests sintácticos (modelos tipo XOR); una clase de modelos cuya estructura pudo ser reconstruida mediante ambos tipos de test (modelos de concatenación) y otra cuya estructura solo pudo ser reconstruida mediante tests sintácticos (modelos de concatenación con shifts). |
author2 |
Bendersky, Ariel Martín |
author_facet |
Bendersky, Ariel Martín Goren, Gabriel Mauricio |
format |
Tesis de grado Tesis de grado publishedVersion |
author |
Goren, Gabriel Mauricio |
spellingShingle |
Goren, Gabriel Mauricio Inferencia causal mediante correlación sintáctica |
author_sort |
Goren, Gabriel Mauricio |
title |
Inferencia causal mediante correlación sintáctica |
title_short |
Inferencia causal mediante correlación sintáctica |
title_full |
Inferencia causal mediante correlación sintáctica |
title_fullStr |
Inferencia causal mediante correlación sintáctica |
title_full_unstemmed |
Inferencia causal mediante correlación sintáctica |
title_sort |
inferencia causal mediante correlación sintáctica |
publisher |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publishDate |
2021 |
url |
https://hdl.handle.net/20.500.12110/seminario_nFIS000128_Goren |
work_keys_str_mv |
AT gorengabrielmauricio inferenciacausalmediantecorrelacionsintactica |
_version_ |
1782031610547273728 |