Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria

Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.

Detalles Bibliográficos
Autor principal: Feltes, Joaquín Ignacio
Otros Autores: D'Argenio, Pedro Ruben
Formato: bachelorThesis
Lenguaje:Español
Publicado: 2024
Materias:
Acceso en línea:http://hdl.handle.net/11086/552052
Aporte de:
id I10-R141-11086-552052
record_format dspace
spelling I10-R141-11086-5520522024-05-28T06:36:29Z Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria Feltes, Joaquín Ignacio D'Argenio, Pedro Ruben Teoría de la computación Lógica Verificación de modelos Juego estocástico Multiobjetivo Alcanzabilidad Recompensas totales Theory of computation Logic Verification by model checking Reachability Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024. Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso. Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo. En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos. The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached. A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it. In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives. Fil: Feltes, Joaquín Ignacio. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina. 2024-05-27T14:21:12Z 2024-05-27T14:21:12Z 2024-05-10 bachelorThesis http://hdl.handle.net/11086/552052 spa Attribution-NonCommercial 4.0 International http://creativecommons.org/licenses/by-nc/4.0/
institution Universidad Nacional de Córdoba
institution_str I-10
repository_str R-141
collection Repositorio Digital Universitario (UNC)
language Español
topic Teoría de la computación
Lógica
Verificación de modelos
Juego estocástico
Multiobjetivo
Alcanzabilidad
Recompensas totales
Theory of computation
Logic
Verification by model checking
Reachability
spellingShingle Teoría de la computación
Lógica
Verificación de modelos
Juego estocástico
Multiobjetivo
Alcanzabilidad
Recompensas totales
Theory of computation
Logic
Verification by model checking
Reachability
Feltes, Joaquín Ignacio
Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
topic_facet Teoría de la computación
Lógica
Verificación de modelos
Juego estocástico
Multiobjetivo
Alcanzabilidad
Recompensas totales
Theory of computation
Logic
Verification by model checking
Reachability
description Tesis (Lic. en Ciencias de la Computación)--Universidad Nacional de Córdoba, Facultad de Matemática, Astronomía, Física y Computación, 2024.
author2 D'Argenio, Pedro Ruben
author_facet D'Argenio, Pedro Ruben
Feltes, Joaquín Ignacio
format bachelorThesis
author Feltes, Joaquín Ignacio
author_sort Feltes, Joaquín Ignacio
title Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_short Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_full Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_fullStr Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_full_unstemmed Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
title_sort juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
publishDate 2024
url http://hdl.handle.net/11086/552052
work_keys_str_mv AT feltesjoaquinignacio juegosestocasticosconobjetivocompuestorecompensastotalessujetasaalcanzabilidadprioritaria
_version_ 1806948916864745472