Publication: Q-learning determinista. Análisis de la variable Gamma
Loading...
Identifiers
Publication date
2015-10
Defense date
2015-10-27
Authors
Advisors
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
El objetivo de este PFC es analizar el comportamiento de la variable gamma en
una implementación determinista del método de aprendizaje Q-learning. Este método
podría traducirse como un valor que indica “la importancia de los futuros estados en la
decisión”. El objetivo real de este PFC es analizarlo desde un punto de vista diferente
añadiendo el parámetro de dificultad al estudio.
Analizaré el comportamiento de la variable modificando su valor en diversas
cantidades, también se analizará esta variación en distintos grados de dificultad,
básicamente el grado de dificultad cambiará en el número de enemigos a sortear, así
como su posición, buscando aumentar la dificultad con determinados esquemas. Este
PFC se lleva a cabo para intentar sacar una conclusión. Intentando saber si un valor
alto o bajo de la variable gamma en sí mismo es mejor en unos casos de dificultad que
en otros. También se podría concluir que no hay variación en función de la dificultad.
Description
Keywords
Inteligencia artificial, Apendizaje, Programación automática, Q-learning