Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/274
Método para la segmentación y reconocimiento simultáneo de ademanes | |
HAROLD ANDRES VASQUEZ CHAVARRIA | |
LUIS ENRIQUE SUCAR SUCCAR HUGO JAIR ESCALANTE BALDERAS | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Gesture recognition Hidden markov models Robots | |
Los ademanes son una forma natural de comunicación entre las personas, y por lo tanto también lo son para la interacción humano computadora (HCI). Aunque existen diversas técnicas para reconocer ademanes, asumen en general que se encuentran ya segmentados, por lo que no se ha resuelto aún el problema de segmentación. En este trabajo se propone un método para abordar ambas tareas a la vez, es decir, un método de segmentación y reconocimiento simultáneo de ademanes, usando modelos ocultos de Markov (HMM). Este método está basado en un esquema novedoso de exploración de la secuencia de vídeo denominado múltiples ventanas de tamaño dinámico. Esto consiste en varias ventanas superpuestas, que comienzan en puntos distintos de la secuencia y van aumentando su tamaño a medida que se va capturando al usuario con un Kinect. En cada instante de crecimiento de la ventanas, se obtienen predicciones de cada una de ellas, considerados como votos para cierto ademán. Cuando hay una mayoría absoluta entre las ventanas hacia cierto ademán, se espera el punto donde deja de ser unánime esta decisión y dicho punto se considera como el final del ademán. Una vez detectado ese punto final (segmentación), se arroja como resultado el ademán que obtuvo la votación mayoritaria hasta dicho momento (reconocimiento). El método propuesto se aplicó a comandar un robot de servicio, mediante la captura de información de los movimientos de el usuario con un sensor Kinect. Los resultados de los experimentos arrojaron un 82.76% de ademanes bien segmentados, con una holgura alrededor del punto final de 15 cuadros. Para efectos de nuestra aplicación de comandar robots, esta holgura representa apenas medio segundo, que es suficientemente bajo e imperceptible en tiempo real. De igual modo, el reconocimiento es muy bueno cuando se logra segmentar el ademán, obteniéndose un 89.58% de precisión. Una de las principales ventajas de esta propuesta, es que no es necesario el uso de un modelo HMM para no ademán, contrario a lo que se hace en otros trabajos. De igual modo, no es necesario un pose indicativo por parte del usuario para saber cuando empieza y termina un ademán. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2013 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
Vasquez Chavarria H.A. | |
CIENCIA DE LOS ORDENADORES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
VasquezCHA.pdf | 5.69 MB | Adobe PDF | Visualizar/Abrir |