Publication:
Aplicación de aprendizaje por refuerzo adversario en juegos de Atari

Loading...
Thumbnail Image
Identifiers
Publication date
2019-07
Defense date
2019-07-05
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
Actualmente, la inteligencia artificial y en particular el aprendizaje por refuerzo, se encuentra en todas partes, como la conducción autónoma, la robótica social y sistemas de vigilancia. El problema de tener tantos dominios de aplicación, es que también está expuesto a multitud de ataques que pueden causar grandes problemas. Por ejemplo, en un sistema de conducción autónoma controlado por aprendizaje por refuerzo, un ataque puede causar que el coche se estrelle causando catastróficas consecuencias. Por lo tanto, el estudio de la vulnerabilidad de estos sistemas frente a ataques está recibiendo cada vez más atención dentro de la comunidad científica. Por eso, este trabajo se centra, precisamente, en el estudio de la vulnerabilidad de estos sistemas. En particular, el objetivo principal es disminuir el rendimiento de una red neuronal profunda aplicada a juegos de Atari mediante dos nuevos tipos de ataque. En el primero, se tratará de identificar zonas/regiones de ataque, es decir, aquellas regiones donde atacar induce más rápidamente el fallo del sistema. El segundo se basará en aprendizaje por refuerzo. En este ataque se tratará de aprender una política de ataque identificado, por cada estado en el que se puede encontrar el sistema, si es mejor atacar o no atacar. En ambos casos, se obtendrán conclusiones sobre el momento exacto en el que atacar afecta más a la red, es decir, baja más su rendimiento, y sobre el número de ataques de cada aproximación, puesto que el objetivo es maximizar el daño mientras se minimiza el número de ataques. El primer paso para poder defenderte de un ataque, es conocer cómo se puede atacar y qué tipos de ataque puede haber. Por lo tanto, este documento sienta las bases sobre posibles sistemas de defensa futuros.
Description
Keywords
Aprendizaje automático, Refuerzo, Adversario, Sistemas de defensa, Atari, Deep Q Learning
Bibliographic citation