Inferencia causal mediante correlación sintáctica

Mostrar todas las versiones(2)

Distinguir correlación de causalidad es uno de los desafíos de inferencia más importantes en la actividad científica. Alrededor de este problema se desarrolla la teoría de modelos o redes causales, la cual provee un lenguaje basado en grafos que permite razonar formalmente sobre relaciones causales...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autor principal:	Goren, Gabriel Mauricio
Otros Autores:	Bendersky, Ariel Martín
Formato:	Tesis de grado publishedVersion
Lenguaje:	Español
Publicado:	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2021
Acceso en línea:	https://hdl.handle.net/20.500.12110/seminario_nFIS000128_Goren
Aporte de:	Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA) de Universidad de Buenos Aires

id	seminario:seminario_nFIS000128_Goren
record_format	dspace
spelling	seminario:seminario_nFIS000128_Goren2023-09-12T13:14:24Z Inferencia causal mediante correlación sintáctica Goren, Gabriel Mauricio Bendersky, Ariel Martín Figueira, Santiago Distinguir correlación de causalidad es uno de los desafíos de inferencia más importantes en la actividad científica. Alrededor de este problema se desarrolla la teoría de modelos o redes causales, la cual provee un lenguaje basado en grafos que permite razonar formalmente sobre relaciones causales y obtener conclusiones a partir de datos e hipótesis adecuadas. Un punto crucial resulta ser qué constituye una correlación o dependencia entre variables. En este trabajo se presenta un abordaje a la inferencia de modelos causales basado en nociones sintácticas de correlación, en contraposición con la noción de correlación estadística usual. En este contexto, las observaciones son codificadas como cadenas de símbolos, y las dependencias entre ellas son evaluadas en términos de la forma de las mismas, y del grado en que pueden ser descriptas o generadas mediante reglas sucintas similares. El concepto de información algorítmica formaliza estas ideas, y de él se desprende una noción de correlación algorítmica universal. Sin embargo, la información algorítmica no puede ser calculada efectivamente, por lo que los tests de independencia condicional sintáctica utilizables en la práctica deben estar necesariamente basados en medidas de complejidad sintáctica más débiles. Concretamente, se implementó un algoritmo para el descubrimiento del esqueleto de la estructura causal subyacente a un conjunto de datos simbólicos, y se desarrollaron tests de independencia condicional basados en dos medidas de complejidad sintáctica computables: la longitud de compresión mediante el compresor comercial gzip y la I-complejidad de Becher y Heiber. Se construyeron ciertos modelos funcionales como generadores de casos de prueba y se realizaron simulaciones en las que se buscó reconstruir la estructura causal de los modelos utilizando el algoritmo. De esta forma se identificó una clase de modelos cuya estructura causal no dirigida pudo ser inferida empleando tests estadísticos, mas no con tests sintácticos (modelos tipo XOR); una clase de modelos cuya estructura pudo ser reconstruida mediante ambos tipos de test (modelos de concatenación) y otra cuya estructura solo pudo ser reconstruida mediante tests sintácticos (modelos de concatenación con shifts). Fil: Goren, Gabriel Mauricio. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2021-05-26 info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion application/pdf spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/seminario_nFIS000128_Goren
institution	Universidad de Buenos Aires
institution_str	I-28
repository_str	R-134
collection	Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language	Español
orig_language_str_mv	spa
description	Distinguir correlación de causalidad es uno de los desafíos de inferencia más importantes en la actividad científica. Alrededor de este problema se desarrolla la teoría de modelos o redes causales, la cual provee un lenguaje basado en grafos que permite razonar formalmente sobre relaciones causales y obtener conclusiones a partir de datos e hipótesis adecuadas. Un punto crucial resulta ser qué constituye una correlación o dependencia entre variables. En este trabajo se presenta un abordaje a la inferencia de modelos causales basado en nociones sintácticas de correlación, en contraposición con la noción de correlación estadística usual. En este contexto, las observaciones son codificadas como cadenas de símbolos, y las dependencias entre ellas son evaluadas en términos de la forma de las mismas, y del grado en que pueden ser descriptas o generadas mediante reglas sucintas similares. El concepto de información algorítmica formaliza estas ideas, y de él se desprende una noción de correlación algorítmica universal. Sin embargo, la información algorítmica no puede ser calculada efectivamente, por lo que los tests de independencia condicional sintáctica utilizables en la práctica deben estar necesariamente basados en medidas de complejidad sintáctica más débiles. Concretamente, se implementó un algoritmo para el descubrimiento del esqueleto de la estructura causal subyacente a un conjunto de datos simbólicos, y se desarrollaron tests de independencia condicional basados en dos medidas de complejidad sintáctica computables: la longitud de compresión mediante el compresor comercial gzip y la I-complejidad de Becher y Heiber. Se construyeron ciertos modelos funcionales como generadores de casos de prueba y se realizaron simulaciones en las que se buscó reconstruir la estructura causal de los modelos utilizando el algoritmo. De esta forma se identificó una clase de modelos cuya estructura causal no dirigida pudo ser inferida empleando tests estadísticos, mas no con tests sintácticos (modelos tipo XOR); una clase de modelos cuya estructura pudo ser reconstruida mediante ambos tipos de test (modelos de concatenación) y otra cuya estructura solo pudo ser reconstruida mediante tests sintácticos (modelos de concatenación con shifts).
author2	Bendersky, Ariel Martín
author_facet	Bendersky, Ariel Martín Goren, Gabriel Mauricio
format	Tesis de grado Tesis de grado publishedVersion
author	Goren, Gabriel Mauricio
spellingShingle	Goren, Gabriel Mauricio Inferencia causal mediante correlación sintáctica
author_sort	Goren, Gabriel Mauricio
title	Inferencia causal mediante correlación sintáctica
title_short	Inferencia causal mediante correlación sintáctica
title_full	Inferencia causal mediante correlación sintáctica
title_fullStr	Inferencia causal mediante correlación sintáctica
title_full_unstemmed	Inferencia causal mediante correlación sintáctica
title_sort	inferencia causal mediante correlación sintáctica
publisher	Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate	2021
url	https://hdl.handle.net/20.500.12110/seminario_nFIS000128_Goren
work_keys_str_mv	AT gorengabrielmauricio inferenciacausalmediantecorrelacionsintactica
_version_	1782031610547273728

Inferencia causal mediante correlación sintáctica

Ejemplares similares