Publication: CrossDetect : detección de pasos de peatones usando algoritmos de visión por computador para la mejora del posicionamiento de vehículos
Loading...
Identifiers
Publication date
2014-06
Defense date
2014-06-23
Authors
Advisors
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
El objetivo de este proyecto es utilizar pasos de peatones, de los denominados
pasos de cebra, como puntos de referencia dentro del entorno, de
tal forma que estos sirvan para corregir el error de posicionamiento que cometen
sistemas como la Odometría Visual o el GPS, a la hora de localizar
un vehículo en el plano. El trabajo desarrollado en este proyecto se podría
dividir en dos partes.
La primera de ellas, es el desarrollo de un algoritmo de visión por computador
que permite reconocer los pasos de peatones mediante un sistema de
cámaras estereoscópicas instalado en un coche. Para lograr este objetivo, en
primer lugar, las imágenes obtenidas por una de las cámaras son procesadas
con la combinación de un ltro de percentil 43 aplicado a nivel local más una
umbralización (Sebsadji et al., 2010). Este proceso se realiza con el n de
extraer aquellos píxeles de la imagen original que pertenecen potencialmente
a marcas pintadas en la carretera. Si un píxel de la captura inicial tiene un
nivel de gris mayor que el de su correspondiente de la imagen ltrada más el
umbral seleccionado, ese píxel es considerado perteneciente a una marca vial,
lo que en de nitiva, quiere decir que éste tiene un nivel de gris mucho más
alto que el de aquellos píxeles próximos a él. El resultado de este proceso,
por tanto, es una imagen binaria que representa en blanco todos aquellos
píxeles que pueden pertenecer a una marca vial.
Aparte de las marcas viales, fuera de la calzada hay muchos píxeles que
cumplen esta condición. Para eliminar de la imagen binaria obtenida todos
aquellos que no están sobre la carretera, se utiliza un algoritmo, perteneciente
a otro proyecto de la universidad, que realiza este proceso utilizando el
mapa de disparidad y el u-disparity de la escena. Es posible obtener estas
estructuras gracias al sistema estereoscópico de cámaras.
Tras estos dos procesos se obtiene una imagen binaria que representa únicamente
las marcas viales. Si además la parte inferior de la imagen es muy
oscura, previamente a estas operaciones se le realiza una mejora de contraste,
que realza la zona de la misma correspondiente a la calzada. También serealiza una erosión para eliminar errores de segmentación.
Una vez extraídas las marcas viales de la imagen original, se distinguen
las que son pasos de peatones del resto mediante un análisis de las frecuencias
de la transformada rápida de Fourier (Fast Fourier Transform, FFT).
Para obtener ésta se usa la proyección horizontal, la cual se obtiene como
resultado de la suma de los píxeles de cada columna de la imagen binaria
obtenida. Cuando se detecte un paso de peatones, se calculará su posición
en la imagen y su distancia con respecto al vehículo. Para determinar la
posición, se utiliza la losofía anterior de la proyección horizontal, aplicada
en esta ocasión a las las de la imagen binaria (proyección vertical). Una
vez calculada ésta, se hace uso del per l de la calzada y los parámetros
ópticos del sistema para calcular su distancia. Para aproximar el per l de
la calzada se utilizará el v-disparity y la Transformada de Hough para rectas.
En la segunda parte del trabajo, una vez detectado un paso de peatones
y conocida su posición relativa respecto al vehículo, se pretende usar esta
información para corregir el error de posicionamiento que introducen otros
sistemas de localización. Usando como dato la cartografía de OpenStreetMap
(OSM), si un sistema de localización como el GPS, o la Odometría Visual,
predice que el coche se aproxima a un paso de peatones, el algoritmo de
visión entraría en funcionamiento. Si el paso de peatones fuera detectado
por el algoritmo de visión antes o después de lo previsto por el sistema de
posicionamiento tradicional, el error que éste cómete podría ser estimado
y corregido, reposicionando el vehículo en su localización correcta dentro
del mapa. Esta parte sólo es desarrollada de manera teórica en el presente
proyecto, de tal manera que se propone su implementación para futuros
trabajos.
The objective of this project is to use zebra crossings as reference points within the environment, in order to correct the positioning error of systems like visual odometry or GPS, when locatinh a vehicle in a map. The work developed in this project can be divided into two parts. The rst one, consists in the development of a computer vision algorithm that can recognize zebra crossings using a stereoscopic camera system installed in a car. To achieve this goal, images obtained by the cameras are processed by a mix of a local 43rd percentile lter plus a thresholding (Sebsadji et al., 2010). The nal purpose of this is to extract from an image taken by one of the cameras those pixels which potentially belong to markings painted on the road. If the pixel in the original image had a gray level higher than its corresponding in the ltered image plus the threshold, that pixel would be considered to belong-to a road marking and therefore that pixel contains a gray level much higher than the pixels next to it. The result of this process is a binary image which represents in white colour those pixels that belong to a road marking. In addition to the road markings, outside the road there are many pixels that meet this condition. An algorithm belonging to another college project is used to remove all those pixels that are not on the road from the binary image. This algorithm performs this process using the disparity map and the u disparity. This is possible thanks of the stereoscopic camera system. After these two processes take place, a binary image which represents only road markings is obtained. A contrast enhancement of this part of the image is done if the bottom part of the picture is too dark. An erode operation is also performed to remove segmentation errors. When road markings in the image have been extracted from it, zebra crossings are distinguished of the rest of road markings using a frequency analysis of the Fast Fourier Transform (FFT); this transform is obtained from the histogram that results of the adding of the pixels of each of the colums from the ltered image (horizontal projection). When the zebra crossing is detected its position is computed using the vertical projection and its distance is obtained by using the v disparity and the Hough Transform. In the second part of this paper, once a zebra crossing has been detected and its position relative to the vehicle is known, this information will be used to correct the positioning error that another location systems, like GPS or Visual Odometry, have. Using the OpenStreetMap mapping as an input, if a system like GPS predicted the car is close to a zebra crossing, the algorithm would be activated. If the zebra crossing was detected by our algorithm before or later than the traditional positioning system expects, the error could be inferred and corrected, repositioning the vehicle in its correct location on the map. This part is only theoretically developed, however its implementation is intended in future researches.
The objective of this project is to use zebra crossings as reference points within the environment, in order to correct the positioning error of systems like visual odometry or GPS, when locatinh a vehicle in a map. The work developed in this project can be divided into two parts. The rst one, consists in the development of a computer vision algorithm that can recognize zebra crossings using a stereoscopic camera system installed in a car. To achieve this goal, images obtained by the cameras are processed by a mix of a local 43rd percentile lter plus a thresholding (Sebsadji et al., 2010). The nal purpose of this is to extract from an image taken by one of the cameras those pixels which potentially belong to markings painted on the road. If the pixel in the original image had a gray level higher than its corresponding in the ltered image plus the threshold, that pixel would be considered to belong-to a road marking and therefore that pixel contains a gray level much higher than the pixels next to it. The result of this process is a binary image which represents in white colour those pixels that belong to a road marking. In addition to the road markings, outside the road there are many pixels that meet this condition. An algorithm belonging to another college project is used to remove all those pixels that are not on the road from the binary image. This algorithm performs this process using the disparity map and the u disparity. This is possible thanks of the stereoscopic camera system. After these two processes take place, a binary image which represents only road markings is obtained. A contrast enhancement of this part of the image is done if the bottom part of the picture is too dark. An erode operation is also performed to remove segmentation errors. When road markings in the image have been extracted from it, zebra crossings are distinguished of the rest of road markings using a frequency analysis of the Fast Fourier Transform (FFT); this transform is obtained from the histogram that results of the adding of the pixels of each of the colums from the ltered image (horizontal projection). When the zebra crossing is detected its position is computed using the vertical projection and its distance is obtained by using the v disparity and the Hough Transform. In the second part of this paper, once a zebra crossing has been detected and its position relative to the vehicle is known, this information will be used to correct the positioning error that another location systems, like GPS or Visual Odometry, have. Using the OpenStreetMap mapping as an input, if a system like GPS predicted the car is close to a zebra crossing, the algorithm would be activated. If the zebra crossing was detected by our algorithm before or later than the traditional positioning system expects, the error could be inferred and corrected, repositioning the vehicle in its correct location on the map. This part is only theoretically developed, however its implementation is intended in future researches.
Description
Keywords
Tecnología automovilística, Cámaras estereoscópicas, V-disparity, Transformada de Hough, Visión artificial, Proceso de imágenes