Implementación de un algoritmo de aprendizaje por refuerzo en una arquitectura multiagente cooperativa

Antón Collado, Adrián

Publication:
Implementación de un algoritmo de aprendizaje por refuerzo en una arquitectura multiagente cooperativa

Identifiers

URI: http://hdl.handle.net/10016/10515

Files

PFC_Adrian_Anton_Collado.pdf (3.71 MB)

Publication date

2010

Defense date

2010-11-24

Authors

Antón Collado, Adrián

Advisors

Carbó Rubiera, Javier Ignacio

Fernández Rebollo, Fernando

Impact

Export

Abstract

La creciente importancia del fenómeno de la interacción entre sistemas informáticos ha modificado la forma tradicional de analizarlos y programarlos. La necesidad de interacción entre los componentes del sistema es cada vez más importante para poder realizar o resolver tareas conjuntas que de forma individual serían muy costosas o incluso imposibles de desarrollar. Los sistemas multiagente ofrecen una plataforma muy interesante y completa para la realización de estas tareas, pero además ofrecen la posibilidad de incluir en cada uno de los agentes un comportamiento dotado de una inteligencia que puede evolucionar gracias a técnicas de aprendizaje automático. Las técnicas de aprendizaje por refuerzo, encuadradas dentro del aprendizaje automático, son muy adecuadas para su uso junto con agentes debido a la integración con el entorno necesaria que implementa el agente, de la que aprenden las técnicas de aprendizaje por refuerzo, y a la ejecución de acciones sobre el entorno obtenidas por las técnicas de aprendizaje por refuerzo y llevadas a cabo por el agente. Sin embargo, el aprendizaje por refuerzo en sistemas multiagente ofrece nuevos retos derivados de la distribución del aprendizaje, como pueden ser la necesidad de la coordinación entre agentes o la distribución del conocimiento, que deben ser analizados y tratados. En el presente proyecto se aborda el problema del aprendizaje por refuerzo en sistemas multiagente siguiendo la metodología Gaia e implementándolo sobre la plataforma de agentes JADE. El problema tratado es el de, dado un estado inicial, aprender una política que conduzca al estado final. Los agentes se situarán en un entorno en el que otros agentes pueden tener el mismo objetivo o un objetivo diferente que les haga enfrentarse. Además usarán estructuras de gestión del conocimiento para su puesta en común. El objetivo de este proyecto es resolver el clásico problema de aprendizaje en el que un agente tiene que aprender a llegar a una meta dentro de un entorno desconocido. Será modificado de forma que serán varios los agentes presentes en el entorno. Cada agente tendrá asociada una meta, pudiendo ser compartida con otros agentes o no. El hecho de que la meta sea compartida permite que los agentes compartan el conocimiento adquirido para ayudarse mutuamente en la obtención de una solución. La meta puede ser incluso opuesta, lo que implica no sólo que los agentes no puedan compartir el conocimiento, sino que pueda existir una cierta competencia entre ellos.

Keywords

Inteligencia artificial, Sistemas multiagente, Aprendizaje automático, Algoritmos de aprendizaje

Collections

Proyectos Fin de Carrera

Full item page

Publication:
Implementación de un algoritmo de aprendizaje por refuerzo en una arquitectura multiagente cooperativa

Identifiers

Files

Publication date

Defense date

Authors

Advisors

Tutors

Journal Title

Journal ISSN

Volume Title

Publisher

Impact

Export

Research Projects

Organizational Units

Journal Issue

Abstract

Description

Keywords

Bibliographic citation

Collections

Publication: Implementación de un algoritmo de aprendizaje por refuerzo en una arquitectura multiagente cooperativa

Identifiers

Files

Publication date

Defense date

Authors

Advisors

Tutors

Journal Title

Journal ISSN

Volume Title

Publisher

Impact

Export

Research Projects

Organizational Units

Journal Issue

Abstract

Description

Keywords

Bibliographic citation

Collections

Publication:
Implementación de un algoritmo de aprendizaje por refuerzo en una arquitectura multiagente cooperativa