Please use this identifier to cite or link to this item: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/1745
Human body pose tracking based on spatio-temporal joints dependency learning
Rodrigo Barrita Zebadúa
Luis Enrique Sucar Succar
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Body pose estimation
Coupled hidden Markov model
Graphical model
Human pose estimation consists on the localization of the body joints from images or videos and how they are connected between each other. An improvement in this issue will enhance the development of other areas such as video surveillance, action detection, human computer interaction, etc. The complexity of the problem is due to the flexibility of the human body structure that makes the space of movements high dimensional, in addition to other external factors such as clothes, illumination, occlusion, moving backgrounds, crowded scenes, etc. During the past couple of decades, great achievements have been made, although, there is still room for improvements and the problem remains open. We propose an architecture for tracking the human pose in video sequences. The proposed model is composed by a Convolutional Neural Network (CNN) based partdetector and a Coupled Hidden Markov Model (CoHMM). The combination of both models allows learning spatial and temporal dependencies. The part-detector, in addition to the advantages of a CNN, exploits the spatial correlations between neighboring regions through a Conditional Random Field (CRF). On the other hand, the CoHMMs generate the best movement sequence between interacting processes. We evaluate our model on the PoseTrack benchmark dataset. The obtained results show that in such cases in which the part detector fails to properly keep the body structure between frames our model helps to fill in these gaps.
La estimación de la pose humana consiste en la localización de las articulaciones del cuerpo a partir de imágenes o vídeos y como ´estos se conectan entre sí. Los avances en las soluciones a este problema tienen impacto en otras áreas tales como vídeo vigilancia, detección de acciones, interacción humano-computadora, etc. La complejidad de la estimación es debido a la flexibilidad de la estructura del cuerpo humano, lo que resulta en una espacio de movimientos de alta dimensionalidad. Además de otros factores como ropa, iluminación, oclusión, fondos en movimiento, escenas saturadas, etc. A pesar de los logros alcanzados en las últimas décadas aún hay espacio para mejoras y el problema permanece abierto. Este trabajo propone una arquitectura para el seguimiento de la pose humana en secuencias de video. El modelo propuesto está compuesto de una combinación de un detector de articulaciones basado en Redes Neuronales Convolucionales (CNN) y Modelos Ocultos de Markov Acoplados (CoHMMs). La combinación de ambos modelos permite el aprendizaje de dependencias espacio-temporales. El detector de articulaciones, además de las ventajas de una CNN, aprovecha las correlaciones espaciales entre regiones vecinas a través de Campos Aleatorios Condicionales (CRF). Por otro lado, los CoHMMs generan las mejores secuencias de movimiento entre procesos que interactúan entre sí. Los resultados obtenidos indican que nuestro modelo llena los vacíos generados por los casos en donde el detector de articulaciones no mantiene la estructura del cuerpo humano a lo largos de toda la secuencia.
Instituto Nacional de Astrofísica, Óptica y Electrónica.
2018-08
Tesis de maestría
Inglés
Estudiantes
Investigadores
Público en general
Barrita Zebadúa, R., (2018), Human body pose tracking based on spatio-temporal joints dependency learning, Tesis de Maestría, Instituto Nacional de Astrofísica, Óptica y Electrónica.
LENGUAJES DE PROGRAMACIÓN
Versión aceptada
acceptedVersion - Versión aceptada
Appears in Collections:Maestría en Ciencias Computacionales

Upload archives


File SizeFormat 
BarritaZR.pdf3.52 MBAdobe PDFView/Open