Publication:
Reconocimiento de objetos en una cocina con una webcam

Research Projects
Organizational Units
Journal Issue
Abstract
Este proyecto fin de carrera tiene como finalidad formar parte de un sistema de reconocimiento de actividades. Así pues, la meta final del sistema del que va a formar parte es reconocer las actividades que una persona realiza en un entorno determinado, en este caso una cocina. Para ello, el sistema a desarrollar en este proyecto pretende explorar el uso de una cámara web con el objetivo de reconocer los objetos que la persona utiliza en el entorno escogido. Dichos objetos podrían servir de ayuda para reconocer las acciones que el usuario está llevando a cabo. El reconocimiento de actividades tiene como objetivo reconocer las diferentes acciones que puede llevar a cabo un ser humano mediante la observación de diferentes factores. Pongamos el caso de una persona que va a beber agua. El propio movimiento de sus brazos, cabeza, boca, etc. nos puede indicar la acción que está realizando pero también puede ayudar significativamente saber que esta persona tiene una botella entre sus manos y que esta se mueve hacia la cabeza. Por tanto, entre los factores más importantes a observar podemos incluir los movimientos de las personas, el reconocimiento y seguimiento de los objetos presentes en el espacio de trabajo y los cambios que se producen en el entorno como por ejemplo: la aparición de humo, la apertura de una puerta, etc. La meta de este proyecto es el reconocimiento y seguimiento de los objetos que se encuentran en el espacio de trabajo que como hemos visto es algo fundamental en el reconocimiento de actividades. La ciencia que se encarga de estas funciones es la visión por computador. La visión por computador o visión artificial es un subcampo de la inteligencia artificial (IA). La visión por computador es la ciencia que desarrolla la base teórica y algorítmica mediante la que se extrae y analiza información sobre el mundo o el entorno a través de una imagen o una secuencia de imágenes. El propósito de la visión artificial es programar un computador para que "entienda" una escena o las características de una imagen, imitando de alguna manera el sistema visual humano. Es decir, responder a dos preguntas fundamentales: ¿qué objetos hay y dónde se encuentran? Para reconocer los objetos que hay en la imagen y saber de qué tipo son, la aplicación que vamos a crear necesita haber sido entrenada con anterioridad. Es decir, cuando una persona ve una mesa, sabe que es una mesa porque la ha visto en ocasiones anteriores y alguien le ha dicho que se trata de ese objeto. De alguna manera con el programa pasa algo similar, hay que mostrarle varias imágenes de los objetos y decirle cuál es su nombre y sus características principales. Por ello se ha creado una base de datos de imágenes y un fichero que indica a la aplicación los datos necesarios para poder entrenar la aplicación. A continuación se detallarán los objetivos principales del proyecto y se hará un breve resumen del contenido de la memoria.
Description
Keywords
Reconocimiento de formas, Visión artificial
Bibliographic citation