Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos

Em ambientes dinâmicos e complexos, a política ótima de coordenação não pode ser derivada analiticamente, mas deve ser aprendida através da interação direta com o ambiente. Geralmente, utiliza-se aprendizado por reforço para prover coordenação em tais ambientes. Atualmente, neuroevolução é um dos mé...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Côrtes, Deise, Alvares, Luis Otávio Campos
Formato:	Objeto de conferencia
Lenguaje:	Portugués
Publicado:	2005
Materias:	Ciencias Informáticas Multiagent systems Algorithms Neural nets
Acceso en línea:	http://sedici.unlp.edu.ar/handle/10915/22934
Aporte de:	SEDICI (UNLP) de Universidad Nacional de La Plata

id	I19-R120-10915-22934
record_format	dspace
institution	Universidad Nacional de La Plata
institution_str	I-19
repository_str	R-120
collection	SEDICI (UNLP)
language	Portugués
topic	Ciencias Informáticas Multiagent systems Algorithms Neural nets
spellingShingle	Ciencias Informáticas Multiagent systems Algorithms Neural nets Côrtes, Deise Alvares, Luis Otávio Campos Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
topic_facet	Ciencias Informáticas Multiagent systems Algorithms Neural nets
description	Em ambientes dinâmicos e complexos, a política ótima de coordenação não pode ser derivada analiticamente, mas deve ser aprendida através da interação direta com o ambiente. Geralmente, utiliza-se aprendizado por reforço para prover coordenação em tais ambientes. Atualmente, neuroevolução é um dos métodos de aprendizado por reforço mais proeminentes. Neste trabalho, é proposto um modelo de coordenação baseado em neuro-evolução. Foi desenvolvida uma extensão do método neuro-evolutivo conhecido como Enforced Subpopulations (ESP). Na extensão desenvolvida, a rede neural que define o comportamento de cada agente é totalmente conectada. Adicionalmente, é permitido que o algoritmo encontre, em tempo de treinamento, a quantidade de neurônios que deve estar presente na camada oculta da rede neural de cada agente. Esta alteração além de oferecer flexibilidade na definição da topologia da rede de cada agente e diminuir o tempo necessário para treinamento, permite também a constituição de grupos de agentes heterogêneos. Os experimentos realizados mostraram que os agentes treinados com o modelo proposto possuem capacidade de se adaptar a alterações no ambiente em tempo de execução. O modelo foi aplicado no domínio das tarefas de perseguição-evasão.
format	Objeto de conferencia Objeto de conferencia
author	Côrtes, Deise Alvares, Luis Otávio Campos
author_facet	Côrtes, Deise Alvares, Luis Otávio Campos
author_sort	Côrtes, Deise
title	Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_short	Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_full	Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_fullStr	Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_full_unstemmed	Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_sort	um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
publishDate	2005
url	http://sedici.unlp.edu.ar/handle/10915/22934
work_keys_str_mv	AT cortesdeise ummodeloneuroevolutivodecoordenacaoadaptativaemambientesdinamicos AT alvaresluisotaviocampos ummodeloneuroevolutivodecoordenacaoadaptativaemambientesdinamicos
bdutipo_str	Repositorios
_version_	1764820467919618049

Um modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos

Ejemplares similares