Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/2519
Sistemas multibiométricos audiovisuales con enfoque en Redes Neuronales de Aprendizaje Profundo y fusión de información | |
Juan Atenco | |
Juan Manuel Ramirez_Cortes | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Deep Learning Machine Learning Multimodal Biometrics Face recognition Speaker recognition Convolutional neural networks Multitask networks Classifier Ensembles Information fusion Feature extraction | |
Actualmente ha aumentado la cantidad de aplicaciones en la que es necesario autentificar la identidad de los usuarios como acceso a servicios digitales otorgados por el gobierno o por entidades privadas, uso en áreas forenses y de aplicación de la ley, etc. Tradicionalmente se han empleado métodos de autentificación como tarjetas de identificación, contraseñas, o dispositivos electrónicos que almacenan información personal por mencionar algunos ejemplos. Estos métodos no son completamente seguros, aquellos que dependen de un objeto físico pueden extraviarse, ser objeto de robo o clonación; mientras que las contraseñas pueden ser olvidadas o el usuario puede entregar esta información sin intención a terceras partes.
Biometría se ha posicionado como una tecnología viable para construir sistemas de autentificación de identidad bajo la premisa de que existen rasgos fisiológicos o de comportamiento del ser humano que permiten diferenciar a un individuo de otro. Actualmente la investigación en este campo se ha concentrado en gran medida en proponer sistemas biométricos multimodales, los cuales pueden procesar dos o más de estos rasgos para combinar su información y fortalecer la seguridad de una
aplicación dificultando en gran medida la posibilidad de un acceso no autorizado.
En este trabajo de tesis proponemos diferentes propuestas de multibiometría empleando los rasgos de voz y rostro tomados de las bases de datos BIOMEX-DB y VidTimit, siendo la primera generada por nuestro equipo de trabajo. Los sistemas biométricos fueron desarrollados con diferentes modelos de los paradigmas de aprendizaje máquina y profundo (Machine Learning y Deep Learning respectivamente) enfocándonos principalmente en el segundo paradigma.
El primer desarrollo presentado es un sistema biométrico unimodal de voz multialgoritmo compuesto por un ensamble de clasificadores para llevar a cabo la tarea de verificación de identidad. Se entrenaron 2 sistemas base: el primero consiste en un conjunto de Modelos Ocultos de Markov (HMM) y el segundo está basado en d-vectors extraídos de una Red Neuronal Profunda (DNN). Para fusionar los sistemas base se empleó un tercer clasificador que combina los scores generados por los dos primeros y completar el ensamble; se utilizaron 4 modelos de fusión para determiner
cual creaba el ensamble que entregara los mejores resultados. Currently, the number of applications in which it is necessary to authenticate the identity of users has increased in the past years, examples of these applications are access to digital devices provided by the government or by private entities, forensics, law enforcement, etc. Traditional authentication methods such as ID cards, passwords or electronic devices that store personal information, to name a few examples, are not completely secure. Those that depend on a physical object can be lost, stolen or cloned; while passwords can be forgotten or the user can unintentionally leak this information to third parties. Biometrics has been positioned as a viable technology to build identity authentication systems under the premise that human beings have physiological or behavioral traits that help to tell them apart from each other. Current research on this field has largely focused on proposing multimodal biometric systems which process two or more of these traits to combine their information and strengthen the security of the system, greatly hindering the possibility of an unauthorized access. In this thesis we propose different multibiometric systems using data of the voice and face modalities taken from our proprietary database BIOMEX-DB and the audiovisual database VidTimit. Our proposed biometric systems were developed using Machine and mostly Deep Learning (ML and DL respectively) models. The first developed system is a multi-algorithm unimodal voice biometric system composed of a ensmble of classifiers to carry out identity verification. Two base systems were trained: the first one is based on Hidden Markov Models (HMM) and Universal Background Models (UBM), while the second one is based on the d-vectors framework extracted from a Deep Neural Network (DNN). In order to fuse both base systems a third classifier was used to combine the output scores produced by the base systems; 4 fusion models were tested in order to study which one produces the best results as part of the ensemble. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2023-08 | |
Tesis de doctorado | |
Español | |
Estudiantes Investigadores Público en general | |
Atenco Vázquez, J. C., (2023), Sistemas multibiométricos audiovisuales con enfoque en Redes Neuronales de Aprendizaje Profundo y fusión de información, Tesis de Doctorado, Instituto Nacional de Astrofísica, Óptica y Electrónica | |
ELECTRÓNICA | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Doctorado en Electrónica |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
ATENCOVJC_DE.pdf | 5.33 MB | Adobe PDF | Visualizar/Abrir |