Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/464
Método de clasificación multi-etapa para el direccionamiento de solicitudes en un centro de llamadas
FERNANDO UCEDA PONGA
LUIS VILLASEÑOR PINEDA
MANUEL MONTES Y GOMEZ
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Classification
Natural language
Processing
Call centres
The recognition of spoken languages for the communication between humans and technological systems has gotten more attention in the last years. Specifically, this is true for the case of call centers, where it is desirable for an automatic system to link a user with the corresponding service. Typically, the use of voice for automatic call routing requires two main steps. In the first step, the elocution or intervention from the user is transcribed using a voice recognition system. Then, in a second step, the automatic transcription is analyzed in order to determinate the user requested service. This second step is the focus of this thesis, and it is defined as a problem of automatic text classification. It is important to point out that the application of traditional text-classification approaches is not possible for this task; on the one hand, because transcriptions from the elocutions are very short (commonly a phrase of few words), and, on the other hand, because current voice recognizers are not perfect and tend to produce several wrong transcriptions. In addition, and given the functionality of a call center, it is always possible to search help from a human operator. Thanks to this possibility, the interventions that can not be recognized are rejected by the system and are resolved through an operator. Evidently, this rejection implies a cost; the higher the rejection rate the higher the cost. The current work presents a multi-step classification method that allows finding a balance between the rejection rate and the precision for an automatic call center. The proposed classification scheme considers two steps. The first step tries to ensure a high precision in the classification of the interventions, by incurring in a high rejection rate. Later, in the second step, the rejected interventions are reclassified with the aim of recovering some of them (which were erroneously rejected in the fist step). It is important to mention that for this classification scheme we also developed a new weighting method. Thanks to this method we could better describe the contribution of each attribute to each one of the categories. The experiments reported in this work demonstrate the relevance of the proposed method; its results were better than those obtained by other state of art approaches.
El reconocimiento del lenguaje hablado para la comunicación humana en los sistemas tecnológicos ha cobrado gran auge en los últimos años. Específicamente para su uso en centros de llamadas o call centers. Donde gracias a un sistema automático es posible enlazar al usuario con el servicio correspondiente. Típicamente, el direccionamiento automático de llamadas a través del habla requiere dos pasos. Durante el primero, se transcribe la elocución o intervención del usuario que llama utilizando un sistema de reconocimiento de habla. Un segundo paso, toma la transcripción automática y determina el servicio solicitado por el usuario. Este segundo paso es foco de atención de esta tesis y es abordado como un problema de clasificación automática de texto. Sin embargo, aplicar los enfoques tradicionales de clasificación de textos a esta tarea no es posible. En primer lugar, las transcripciones provienen de elocuciones muy cortas, una frase de unas cuantas palabras con las que un usuario expresa su necesidad. Además, dado que aún no se cuenta con un reconocedor de habla perfecto, es posible encontrar transcripciones erróneas. Por otro lado, debido a la naturaleza propia de un centro de llamadas, siempre existe la posibilidad de buscar el apoyo de un operador humano. Gracias a esta posibilidad el sistema puede recurrir a un operador en caso de la incomprensión de una orden. De esta manera, aquellas intervenciones no reconocibles son rechazadas por el sistema y resueltas por un operador. Por supuesto, este rechazo implica un costo, mientras más alta sea la tasa de rechazo más alto será el costo. El presente trabajo presenta un método de clasificación multi-etapa que permite encontrar un balance entre una baja tasa de rechazo y una alta precisión para un centro de llamadas. El esquema de clasificación propuesto se compone de dos etapas. Una primera etapa busca asegurar una alta precisión en la clasificación de las transcripciones incurriendo inevitablemente en un alto rechazo. Posteriormente, en una segunda etapa, las llamadas inicialmente rechazadas se revisan y se reclasifican, recuperando de entre ellas las rechazadas erróneamente. Cabe resaltar que para este esquema de clasificación también se desarrolló un nuevo método de pesado. Gracias a este método se logra describir de mejor manera la contribución de cada atributo en la discriminación entre las categorías.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2009-01
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Uceda-Ponga F
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
UcedaPF.pdf834.82 kBAdobe PDFVisualizar/Abrir