Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/703
Una gramática visual para la detección de rostros | |
AUGUSTO MELÉNDEZ TEODORO | |
LUIS ENRIQUE SUCAR SUCCAR | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Bayesian networks Grammars Face recognition | |
Several methods for face detection have been developed with certain success, these
methods typically include features like texture, skin color, some predefined templates
or deformable templates, etc., however these tend to fail under “difficult” conditions
such as partial occlusions and changes in orientation and illumination.
We propose a novel technique for face detection based on a visual grammar. We first
define a symbol relational grammar for faces, representing the visual elements of a face
and their spatial relations. This grammar is then transformed to a Bayesian network
representation. The structure of the Bayesian network is derived from the grammar,
and its parameters are obtained from data, i.e., from positive and negative examples of
faces. Then the Bayesian network is used for face detection via probabilistic inference,
using as evidence a set of weak detectors for different face components.
We evaluated our method on a set of sample images of faces under “difficult” conditions,
and contrasted it with a simplified model without spatial relationships, and the
AdaBoost face detector.
The results show a significant improvement when using our method based on a
visual grammar. Although the grammar is restricted to the representation of faces, it is
possible to extend it to represent a complete person or other object. Existen varios métodos de detección de rostros que se han desarrollado con cierto éxito, estos métodos suelen incluir características como textura, color de la piel, plantillas predefinidas o deformables, etc.; sin embargo, estos tienden a fallar en condiciones difíciles, tales como oclusiones parciales y cambios en la orientación y la iluminación en los rostros de las imágenes. En esta tesis proponemos una nueva técnica para la detección de rostros basada en una gran ática visual. Primero, definimos una gramática simbólica–relacional para rostros, para poder representar los elementos visuales de un rostro y sus relaciones espaciales. Después, esta gramática se transforma en una representación con base en una red bayesiana. La estructura de la red bayesiana es derivada a partir de la gramática y sus parámetros se obtienen a partir de datos; es decir, a partir de ejemplos positivos y negativos de rostros. Luego la red bayesiana es utilizada para la detección de rostros a través de la inferencia probabilística, utilizando un conjunto de detectores débiles para los diferentes componentes del rostro. Evaluamos nuestro método utilizando un conjunto de imágenes de rostros en condiciones difíciles, y lo comparamos con un modelo simplificado sin relaciones espaciales, y el detector de rostros AdaBoost. Los resultados muestran una mejora significativa en la detección de rostros al usar nuestro método basado en una gramática visual. Aunque la gramática está restringida a la representación de rostros, es posible extenderla para representar a una persona completa u otro tipo de objetos. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2011-01 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
Melendez-Teodoro A. | |
CIENCIA DE LOS ORDENADORES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
MelendezTA.pdf | 1.15 MB | Adobe PDF | Visualizar/Abrir |