Mi INAOE Alertas Editar Perfil

Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/393

Título :	Caracterización Automática del Llanto de Bebé para su Estudio con Modelos de Clasificación
Autor:	ERIKA AMARO CAMARGO
Colaborador:	CARLOS ALBERTO REYES GARCIA
Nivel de acceso:	Acceso Abierto
Licencia:	Atribución-NoComercial-SinDerivadas
Materia:	Classification Pattern recognition Feature extraction
Resumen o descripción:	As a part of a project that seeks to support early detection of pathologies in newborn babies, this thesis proposes a system of Automatic Infant Cry Recognition based on a characterization defined by the combination of acoustical features, which are obtained by different extraction techniques. Experiments were performed to recognize three types of cry: normal, pathological cry of hypo-acoustic (deaf) infants and asphyxia. The fact that the parameters have been derived from different spectral representation of the signal, suggests the possibility of raising different combinations of features to provide benefits to improve the representation of each type of crying, and consequently, increase the final recognition rate. In general, four characteristics extraction techniques were used: LPC (Linear Predictive Coding), MFCC (Mel Frequency Cepstral Coefficients), Intensity and Cochleograms. The original characteristic vectors were reduced through two methods like: LDA (Linear Discriminant Analysis), and a proposed method which is called, "Reduction by Statistics Operations". The combination of characteristics was carried out using the reduced characteristic vectors. The use of cochleograms to classify infant cry is one of the contributions of this thesis work. According to experiments, it was observed that cochleograms equalized, and in some cases improved the results obtained by techniques such as LPC or MFCC, which are widely used in speech recognition for their good results. Several tests were performed to validate the characterization. By applying traditional techniques such as ten-fold-cross-validation, results of an accuracy of 98.66% were achieved with vectors formed by the combination of four types of features. Other tests, which we call “individual tests” achieved results of 100% for the classification of the deaf class. Finally we defined a knowledge base for the classification of baby's cry considering the results and observations derived from this research. Como parte de un proyecto que busca apoyar la detección temprana de patologías en bebés recién nacidos, este trabajo de tesis propone un sistema de reconocimiento automático del llanto de bebés basado en una caracterización definida por la combinación de características, las cuales, son obtenidas por diferentes técnicas de extracción. Los experimentos se realizaron para reconocer tres tipos de llanto: normal (normo-oyente), patológico de bebés con hipoacusia (sordera) y asfixia. El hecho de que los parámetros hayan sido derivados de distintas representaciones de la señal, sugiere la posibilidad de plantear distintas combinaciones de características que aporten ventajas para mejorar la representación de cada tipo de llanto, y en consecuencia, aumentar la tasa de reconocimiento final. En general, se utilizaron cuatro técnicas de extracción de características: LPC (Codificación Predictiva Lineal), MFCC (Coeficientes Cepstrales de Frecuencia Mel), Intensidad y Cocleograma. Los vectores característicos originales fueron reducidos a través de dos métodos que son: LDA (Análisis Discriminante Lineal) y un método que se propone, el cual se denominó, “Reducción por Operaciones Estadísticas”. La combinación de características se llevó a cabo utilizando los vectores característicos reducidos. El uso de cocleogramas para llevar a cabo el reconocimiento automático del llanto de bebés es una de las aportaciones de este trabajo de tesis. De acuerdo a los experimentos realizados, se observó que los cocleogramas igualaron y en algunos casos mejoraron los resultados obtenidos por técnicas como LPC o MFCC, las cuales, son ampliamente utilizadas en reconocimiento de habla y han dado buenos resultados en reconocimiento de llanto. Diversas pruebas fueron realizadas para validar la caracterización. Aplicando técnicas tradicionales como validación cruzada, se lograron resultados del 98.66% de precisión con vectores formados por la combinación de cuatro tipos de características. Otro tipo de pruebas, las cuales denominamos pruebas por individuo arrojaron resultados de clasificación del 100% para la clase sordos. Finalmente, se define una base de conocimiento para la clasificación del llanto de bebé considerando los resultados y las aportaciones derivadas de este trabajo de investigación.
Editor:	Instituto Nacional de Astrofísica, Óptica y Electrónica
Fecha de publicación :	2008
Tipo de publicación :	Tesis de maestría
Audiencia:	Estudiantes Investigadores Público en general
Forma de citación:	Amaro-Camargo E
Área de conocimiento:	TECNOLOGÍA MÉDICA
Versión de la publicación:	Versión aceptada
Versión de la publicación:	acceptedVersion - Versión aceptada
Aparece en las colecciones:	Maestría en Ciencias Computacionales

Cargar archivos:

Fichero	Tamaño	Formato
AmaroCE.pdf	1.42 MB	Adobe PDF	Visualizar/Abrir