Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/274
Método para la segmentación y reconocimiento simultáneo de ademanes
HAROLD ANDRES VASQUEZ CHAVARRIA
LUIS ENRIQUE SUCAR SUCCAR
HUGO JAIR ESCALANTE BALDERAS
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Gesture recognition
Hidden markov models
Robots
Los ademanes son una forma natural de comunicación entre las personas, y por lo tanto también lo son para la interacción humano computadora (HCI). Aunque existen diversas técnicas para reconocer ademanes, asumen en general que se encuentran ya segmentados, por lo que no se ha resuelto aún el problema de segmentación. En este trabajo se propone un método para abordar ambas tareas a la vez, es decir, un método de segmentación y reconocimiento simultáneo de ademanes, usando modelos ocultos de Markov (HMM). Este método está basado en un esquema novedoso de exploración de la secuencia de vídeo denominado múltiples ventanas de tamaño dinámico. Esto consiste en varias ventanas superpuestas, que comienzan en puntos distintos de la secuencia y van aumentando su tamaño a medida que se va capturando al usuario con un Kinect. En cada instante de crecimiento de la ventanas, se obtienen predicciones de cada una de ellas, considerados como votos para cierto ademán. Cuando hay una mayoría absoluta entre las ventanas hacia cierto ademán, se espera el punto donde deja de ser unánime esta decisión y dicho punto se considera como el final del ademán. Una vez detectado ese punto final (segmentación), se arroja como resultado el ademán que obtuvo la votación mayoritaria hasta dicho momento (reconocimiento). El método propuesto se aplicó a comandar un robot de servicio, mediante la captura de información de los movimientos de el usuario con un sensor Kinect. Los resultados de los experimentos arrojaron un 82.76% de ademanes bien segmentados, con una holgura alrededor del punto final de 15 cuadros. Para efectos de nuestra aplicación de comandar robots, esta holgura representa apenas medio segundo, que es suficientemente bajo e imperceptible en tiempo real. De igual modo, el reconocimiento es muy bueno cuando se logra segmentar el ademán, obteniéndose un 89.58% de precisión. Una de las principales ventajas de esta propuesta, es que no es necesario el uso de un modelo HMM para no ademán, contrario a lo que se hace en otros trabajos. De igual modo, no es necesario un pose indicativo por parte del usuario para saber cuando empieza y termina un ademán.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2013
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Vasquez Chavarria H.A.
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Descripción Tamaño Formato  
VasquezCHA.pdf5.69 MBAdobe PDFVisualizar/Abrir