Rights:
Atribución-NoComercial-SinDerivadas 3.0 España
Abstract:
El objetivo de este PFC es analizar el comportamiento de la variable gamma en
una implementación determinista del método de aprendizaje Q-learning. Este método
podría traducirse como un valor que indica “la importancia de los futuros estados en la
decisión”El objetivo de este PFC es analizar el comportamiento de la variable gamma en
una implementación determinista del método de aprendizaje Q-learning. Este método
podría traducirse como un valor que indica “la importancia de los futuros estados en la
decisión”. El objetivo real de este PFC es analizarlo desde un punto de vista diferente
añadiendo el parámetro de dificultad al estudio.
Analizaré el comportamiento de la variable modificando su valor en diversas
cantidades, también se analizará esta variación en distintos grados de dificultad,
básicamente el grado de dificultad cambiará en el número de enemigos a sortear, así
como su posición, buscando aumentar la dificultad con determinados esquemas. Este
PFC se lleva a cabo para intentar sacar una conclusión. Intentando saber si un valor
alto o bajo de la variable gamma en sí mismo es mejor en unos casos de dificultad que
en otros. También se podría concluir que no hay variación en función de la dificultad.[+][-]