Please use this identifier to cite or link to this item:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/1827
Monocular-SLAM dense mapping algorithm and hardware architecture for FPGA acceleration | |
ABIEL AGUILAR GONZALEZ | |
MIGUEL OCTAVIO ARIAS ESTRADA | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Monocular SLAM Mapping algorithm Hardware architecture FPGA | |
Simultaneous Localization and Mapping (SLAM) is the problem of constructing a 3D map while simultaneously keeping track of an agent location within the map. In recent years, work has focused on systems that use a single moving camera as the only sensing mechanism (monocular-SLAM). This choice was motivated because nowadays, it is possible to find inexpensive commercial cameras, smaller and lighter than other sensors previously used and, they provide visual environmental information that can be exploited to create complex 3D maps while camera poses can be simultaneously estimated. Unfortunately, previous monocular-SLAM systems are based on optimization techniques that limits the performance for real-time embedded applications. To solve this problem, in this work, we propose a new monocular SLAM formulation based on the hypothesis that it is possible to reach high efficiency for embedded applications, increasing the density of the point cloud map (and therefore, the 3D map density and the overall positioning and mapping) by reformulating the feature-tracking/feature-matching process to achieve high performance for embedded hardware architectures, such as FPGA or CUDA. In order to increase the point cloud map density, we propose new feature-tracking/feature-matching and depth-from-motion algorithms that consists of extensions of the stereo matching problem. Then, two di_erent hardware architectures (based on FPGA and CUDA, respectively) fully com- pliant for real-time embedded applications are presented. Experimental results show that it is possible to obtain accurate camera pose estimations. Compared to previous monocu lar systems, we are ranked as the 5th place in the KITTI benchmark suite, with a higher processing speed (we are the fastest algorithm in the benchmark) andmore than x10 the ensity of the point cloud from previous approaches. La localización y mapeo simultáneo (SLAM, por sus siglas en inglés) es el problema de construir un mapa en 3D mientras al mismo tiempo, se realiza un seguimiento de la ubicación de un agente dentro del mapa. En los últimos años, el trabajo previo se ha centrado en sistemas que utilizan una única cámara en movimiento como sensor (SLAM monocular). Esta elección fue motivada porque hoy en día, es posible encontrar cámaras comerciales económicas, mas pequeñas y livianas que otros sensores utilizados anteriormente, y proporcionan información visual que puede ser explotada para crear mapas 3D complejos, mientras que la posición de la cámara puede estimarse simultáneamente. Desafortunadamente, los sistemas SLAM monocular anteriores se basan en técnicas de optimización que limitan el rendimiento en aplicaciones embebidas en tiempo real. Para resolver este problema, en este trabajo proponemos una nueva formulación de SLAM monocular basada en la hipótesis de que es posible alcanzar una alta eficiencia para aplicaciones embebidas, aumentando la densidad de los puntos utilizados para estimar el posicionamiento y mapeo simultaneo mediante la reformulación del proceso de feature-tracking/feature-matching para alcanzar un alto rendimiento para arquitecturas de hardware embebidas, como FPGA o CUDA y al mismo tiempo, incrementar la densidad con respecto a los algoritmos anteriores. Para esto, proponemos nuevos algoritmos de feature-tracking/feature-matching y depth-from-motion, ambos definidos como una extensión del problema estéreo. Luego, se presentan dos diferentes arquitecturas de hardware (basadas en FPGA y CUDA, respectivamente) para aplicaciones embebidas en tiempo real. Los resultados experimentales demuestran que es posible obtener estimaciones precisas de la posición de la cámara (considerando los sistemas monoculares anteriores, estamos clasificados como el quinto lugar en el conjunto de pruebas de KITTI) con una mayor velocidad de procesamiento (somos el algoritmo más rápido en la prueba) y más de x10 la densidad de la nube de puntos de los enfoques anteriores (estatus en el benchmark de KITTI en enero de 2019). | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2019 | |
Tesis de doctorado | |
Inglés | |
Estudiantes Investigadores Público en general | |
Aguilar González, A., (2019), Monocular-SLAM dense mapping algorithm and hardware architecture for FPGA acceleration, Tesis de Doctorado, Instituto Nacional de Astrofísica, Óptica y Electrónica. | |
ARQUITECTURA DE ORDENADORES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Appears in Collections: | Doctorado en Ciencias Computacionales |
Upload archives
File | Size | Format | |
---|---|---|---|
AguilarGoA.pdf | 32.76 MB | Adobe PDF | View/Open |