Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/555
Un método para recuparación de información en documentos orales basado en codificación fonética
MANUEL ALEJANDRO REYES BARRAGAN
LUIS VILLASEÑOR PINEDA
MANUEL MONTES Y GOMEZ
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Information retrieval
Speech processing
Phonetics
The amount of information available thanks to the advances on the technology has been increased in the last years. The storage media and formats can be of varied nature. The amount of available multimedia repositories is increasing; there are collections of text, images, audio and video. However these collections are not useful if we can’t organize them to identify the pertinent elements to a necessity of information. It’s exactly this problem the one that deal the Information Retrieval. Of course, the information retrieval methods vary depending of the collection. In this thesis we focus on the task of Spoken Document Retrieval. By the term Spoken Documents we mean to speech recordings as political speeches, conferences, news. The approach of this thesis is to deal with the problem generated by the automatic transcriptions of speech recordings. Unfortunately, the transcriptions generated by the automatic speech recognition are not perfect, so is common to find several transcription errors (such as word substitutions, insertions and deletions). The result of this situation are documents with own characteristics, different to those find in text written manually. Therefrom, that the traditional methods of information retrieval don’t work appropriately, and become necessary to define methods focused to the treatment of this type of documents. In this thesis we propose an original method based on the phonetic codification of the automatic speech transcriptions. The idea of the method consists on enriching the representation of the documents to deal with the errors generated by the automatic speech recognition. Thanks to the phonetic codification it’s possible represent with the same code words whose pronunciation is similar. The method was evaluated using the same set of data proportionate for the evaluation forum CLEF CL-SR. These allow us to compare the performance of our system objectively. In comparison with the rest of the teams that participate in the forum, our system was located in the second place, demonstrating that the method is appropriate for this task.
La cantidad de información disponible gracias a los avances de la tecnología se ha incrementado enormemente en los últimos años. Los medios y formatos en que esta información está conservada, puede ser de muy variada naturaleza. Actualmente existen enormes colecciones de textos, de imágenes, de audio, de video, etc. Sin embargo, estas colecciones no son útiles si no llegamos a organizarlas para identificar aquellos elementos pertinentes a una determinada necesidad de información. Es justamente este problema el que aborda la Recuperación de Información. Por supuesto, los métodos de recuperación varían dependiendo de la naturaleza de la colección. En este trabajo de tesis nos enfocamos a la recuperación de información en documentos orales. Por documentos orales nos referimos a grabaciones de habla tales como discursos políticos, conferencias, noticieros radiofónicos, etc. El enfoque de esta tesis para abordar el problema parte de las transcripciones automáticas de esas grabaciones. Desafortunadamente, las transcripciones generadas por un reconocedor automático del habla no son perfectas, de tal forma que es común encontrar errores de inserción, eliminación o substitución de palabras en las transcripciones automáticas. Esta situación tiene por resultado documentos con características propias, diferentes a las que se encuentran en texto escrito manualmente. De ahí, que los métodos tradicionales de recuperación de información no funcionen adecuadamente y sea necesario definir métodos enfocados al tratamiento de este tipo de documentos. En esta tesis se propone un método original basado en la codificación fonética de las transcripciones automáticas. La idea del método consiste en enriquecer la representación de los documentos para tratar de abordar los errores inducidos por el reconocedor. Gracias a la codificación fonética es posible representar con un mismo código palabras cuya pronunciación es similar. El método utilizado fue evaluado utilizando el mismo conjunto de datos proporcionado por el foro de evaluación del CLEF CL-SR, lo cuál nos permite comparar objetivamente el desempeño de nuestro sistema. En comparación con los resultados de otros equipos en este foro, nuestro sistema se ubicó en el segundo lugar, demostrando que el método es adecuado para esta tarea.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2008-08
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Reyes-Barragán MA
BANCOS DE DATOS
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
ReyesBMA.pdf593.16 kBAdobe PDFVisualizar/Abrir