Publication:
Implementación de un algoritmo de aprendizaje por refuerzo en una arquitectura multiagente cooperativa

Loading...
Thumbnail Image
Identifiers
Publication date
2010
Defense date
2010-11-24
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
La creciente importancia del fenómeno de la interacción entre sistemas informáticos ha modificado la forma tradicional de analizarlos y programarlos. La necesidad de interacción entre los componentes del sistema es cada vez más importante para poder realizar o resolver tareas conjuntas que de forma individual serían muy costosas o incluso imposibles de desarrollar. Los sistemas multiagente ofrecen una plataforma muy interesante y completa para la realización de estas tareas, pero además ofrecen la posibilidad de incluir en cada uno de los agentes un comportamiento dotado de una inteligencia que puede evolucionar gracias a técnicas de aprendizaje automático. Las técnicas de aprendizaje por refuerzo, encuadradas dentro del aprendizaje automático, son muy adecuadas para su uso junto con agentes debido a la integración con el entorno necesaria que implementa el agente, de la que aprenden las técnicas de aprendizaje por refuerzo, y a la ejecución de acciones sobre el entorno obtenidas por las técnicas de aprendizaje por refuerzo y llevadas a cabo por el agente. Sin embargo, el aprendizaje por refuerzo en sistemas multiagente ofrece nuevos retos derivados de la distribución del aprendizaje, como pueden ser la necesidad de la coordinación entre agentes o la distribución del conocimiento, que deben ser analizados y tratados. En el presente proyecto se aborda el problema del aprendizaje por refuerzo en sistemas multiagente siguiendo la metodología Gaia e implementándolo sobre la plataforma de agentes JADE. El problema tratado es el de, dado un estado inicial, aprender una política que conduzca al estado final. Los agentes se situarán en un entorno en el que otros agentes pueden tener el mismo objetivo o un objetivo diferente que les haga enfrentarse. Además usarán estructuras de gestión del conocimiento para su puesta en común. El objetivo de este proyecto es resolver el clásico problema de aprendizaje en el que un agente tiene que aprender a llegar a una meta dentro de un entorno desconocido. Será modificado de forma que serán varios los agentes presentes en el entorno. Cada agente tendrá asociada una meta, pudiendo ser compartida con otros agentes o no. El hecho de que la meta sea compartida permite que los agentes compartan el conocimiento adquirido para ayudarse mutuamente en la obtención de una solución. La meta puede ser incluso opuesta, lo que implica no sólo que los agentes no puedan compartir el conocimiento, sino que pueda existir una cierta competencia entre ellos.
Description
Keywords
Inteligencia artificial, Sistemas multiagente, Aprendizaje automático, Algoritmos de aprendizaje
Bibliographic citation