Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/393
Caracterización Automática del Llanto de Bebé para su Estudio con Modelos de Clasificación | |
ERIKA AMARO CAMARGO | |
CARLOS ALBERTO REYES GARCIA | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Classification Pattern recognition Feature extraction | |
As a part of a project that seeks to support early detection of pathologies in newborn
babies, this thesis proposes a system of Automatic Infant Cry Recognition based on a
characterization defined by the combination of acoustical features, which are obtained
by different extraction techniques. Experiments were performed to recognize three
types of cry: normal, pathological cry of hypo-acoustic (deaf) infants and asphyxia.
The fact that the parameters have been derived from different spectral representation
of the signal, suggests the possibility of raising different combinations of features to
provide benefits to improve the representation of each type of crying, and
consequently, increase the final recognition rate. In general, four characteristics
extraction techniques were used: LPC (Linear Predictive Coding), MFCC (Mel
Frequency Cepstral Coefficients), Intensity and Cochleograms. The original
characteristic vectors were reduced through two methods like: LDA (Linear
Discriminant Analysis), and a proposed method which is called, "Reduction by
Statistics Operations". The combination of characteristics was carried out using the
reduced characteristic vectors. The use of cochleograms to classify infant cry is one
of the contributions of this thesis work. According to experiments, it was observed
that cochleograms equalized, and in some cases improved the results obtained by
techniques such as LPC or MFCC, which are widely used in speech recognition for
their good results. Several tests were performed to validate the characterization. By
applying traditional techniques such as ten-fold-cross-validation, results of an
accuracy of 98.66% were achieved with vectors formed by the combination of four
types of features. Other tests, which we call “individual tests” achieved results of
100% for the classification of the deaf class. Finally we defined a knowledge base for
the classification of baby's cry considering the results and observations derived from
this research. Como parte de un proyecto que busca apoyar la detección temprana de patologías en bebés recién nacidos, este trabajo de tesis propone un sistema de reconocimiento automático del llanto de bebés basado en una caracterización definida por la combinación de características, las cuales, son obtenidas por diferentes técnicas de extracción. Los experimentos se realizaron para reconocer tres tipos de llanto: normal (normo-oyente), patológico de bebés con hipoacusia (sordera) y asfixia. El hecho de que los parámetros hayan sido derivados de distintas representaciones de la señal, sugiere la posibilidad de plantear distintas combinaciones de características que aporten ventajas para mejorar la representación de cada tipo de llanto, y en consecuencia, aumentar la tasa de reconocimiento final. En general, se utilizaron cuatro técnicas de extracción de características: LPC (Codificación Predictiva Lineal), MFCC (Coeficientes Cepstrales de Frecuencia Mel), Intensidad y Cocleograma. Los vectores característicos originales fueron reducidos a través de dos métodos que son: LDA (Análisis Discriminante Lineal) y un método que se propone, el cual se denominó, “Reducción por Operaciones Estadísticas”. La combinación de características se llevó a cabo utilizando los vectores característicos reducidos. El uso de cocleogramas para llevar a cabo el reconocimiento automático del llanto de bebés es una de las aportaciones de este trabajo de tesis. De acuerdo a los experimentos realizados, se observó que los cocleogramas igualaron y en algunos casos mejoraron los resultados obtenidos por técnicas como LPC o MFCC, las cuales, son ampliamente utilizadas en reconocimiento de habla y han dado buenos resultados en reconocimiento de llanto. Diversas pruebas fueron realizadas para validar la caracterización. Aplicando técnicas tradicionales como validación cruzada, se lograron resultados del 98.66% de precisión con vectores formados por la combinación de cuatro tipos de características. Otro tipo de pruebas, las cuales denominamos pruebas por individuo arrojaron resultados de clasificación del 100% para la clase sordos. Finalmente, se define una base de conocimiento para la clasificación del llanto de bebé considerando los resultados y las aportaciones derivadas de este trabajo de investigación. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2008 | |
Tesis de maestría | |
Estudiantes Investigadores Público en general | |
Amaro-Camargo E | |
TECNOLOGÍA MÉDICA | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
AmaroCE.pdf | 1.42 MB | Adobe PDF | Visualizar/Abrir |