Publication:
Q-learning determinista. Análisis de la variable Gamma

Loading...
Thumbnail Image
Identifiers
Publication date
2015-10
Defense date
2015-10-27
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
El objetivo de este PFC es analizar el comportamiento de la variable gamma en una implementación determinista del método de aprendizaje Q-learning. Este método podría traducirse como un valor que indica “la importancia de los futuros estados en la decisión”. El objetivo real de este PFC es analizarlo desde un punto de vista diferente añadiendo el parámetro de dificultad al estudio. Analizaré el comportamiento de la variable modificando su valor en diversas cantidades, también se analizará esta variación en distintos grados de dificultad, básicamente el grado de dificultad cambiará en el número de enemigos a sortear, así como su posición, buscando aumentar la dificultad con determinados esquemas. Este PFC se lleva a cabo para intentar sacar una conclusión. Intentando saber si un valor alto o bajo de la variable gamma en sí mismo es mejor en unos casos de dificultad que en otros. También se podría concluir que no hay variación en función de la dificultad.
Description
Keywords
Inteligencia artificial, Apendizaje, Programación automática, Q-learning
Bibliographic citation