Mi INAOE Alertas Editar Perfil

Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/621

Título :	Segmentación del habla con independencia de texto para reconocimiento fonético
Autor:	LUIS DAVID HUERTA HERNANDEZ
Colaborador:	CARLOS ALBERTO REYES GARCIA
Nivel de acceso:	Acceso Abierto
Licencia:	Atribución-NoComercial-SinDerivadas
Materia:	Speech recognition Pattern recognition Natural languages
Resumen o descripción:	Nowadays, Speech Technologies are considering with high importance the sub-words units like phonemes, because for the recognition process, these units reduce the model complexity, classification and storage of the languages information. The problem to solve in this Master Thesis is the phoneme speech segmentation with text independence. The problem consists on obtaining phoneme boundaries, from the speech wave without any kind of information known a priori, as it happens commonly with text. Although some related works have been reported oriented to carry out segmentation in sub-words, they have been tested under a set of restrictions as speaker independence [1] [2], text [3][4], vocabulary [5] [6], without continuos speech expressed naturally and without considering the over-segmentation [7]. Recently it was reported a method [8] avoiding all the previous restrictions mentioned, reach 73.58% of correct segmentation and a over-segmentation near to 0 %. Considering te existence of phoneme boundaries vaguely defined, the performances was increased by using fuzzy measures and different speech representations, obtaining major detail of some boundaries. The performance on the English language was increasing in 4% with respect to [8], and for Spanish language were detected approximately 80% of phoneme boundaries present on the speech signal. Actualmente, en las Tecnologías del Habla se están considerando con mayor importancia las unidades de sub-palabras como los fonemas, puesto que para el proceso de reconocimiento estas unidades reducen la complejidad de modelado, de clasificación, y de almacenamiento de información de los lenguajes. El problema a resolver en esta Tesis de Maestría es la segmentación fonética del habla con independencia de texto. Este problema consiste en obtener las posiciones de las fronteras entre fonemas, a partir de la onda de habla sin el apoyo de ningún tipo de información conocida a priori, como lo es comúnmente el texto. Aunque se han reportado trabajos encausados a la segmentación en sub-palabras, estos han sido probados bajo una serie de restricciones como dependencia de hablante [1] [2], texto [3][4], vocabulario [5] [6], sin hacer uso de habla continúa expresada naturalmente y sin considerar la sobre- segmentación [7]. Recientemente se reporto un método [8] que suprime todas estas restricciones alcanzando una tasa de detecciones correctas de límites del 73.58% y una tasa de sobre-segmentación cercana al 0 %. Considerando que existen fronteras fonéticas vagamente definidas, el desempeño se incremento haciendo uso de medidas difusas y distintas representaciones del habla, obteniendo mayor detalle de esas fronteras. Para el idioma ingles se incrementó la tasa de detecciones correctas en un 4% respecto a [8], y para el idioma español, se detectaron aproximadamente un 80% de límites fonéticos presentes en la señal del habla.
Editor:	Instituto Nacional de Astrofísica, Óptica y Electrónica
Fecha de publicación :	2007-02
Tipo de publicación :	Tesis de maestría
Idioma:	Español
Audiencia:	Estudiantes Investigadores Público en general
Forma de citación:	Huerta-Hernández LD
Área de conocimiento:	LENGUAJES DE PROGRAMACIÓN
Versión de la publicación:	Versión aceptada
Versión de la publicación:	acceptedVersion - Versión aceptada
Aparece en las colecciones:	Maestría en Ciencias Computacionales

Cargar archivos:

Fichero	Tamaño	Formato
HuertaHLD.pdf	1.57 MB	Adobe PDF	Visualizar/Abrir