Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/697
Reconocimiento fuera de línea de palabras manuscritas, basado en un mapa auto-organizado
RODOLFO LUNA PÉREZ
MARIA DEL PILAR GOMEZ GIL
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Neural nets
Self-organising feature maps
Handwriting recognition
Nowadays there is a huge amount of information available in many different electronic devices; however, there is still a lot of information that only can be found in non-digital handwritten documents or handwritten documents digitalized as images; and even diverse activities produces yet handwritten documents. This has motivated the development of handwritten text recognition methods to retrieve such information, whether stored documents (off-line recognition) or by recognizing the text as it is generated (online recognition). However, handwriting recognition is a challenging task due to the variation of writing existing styles and it is still an open problem that is in research. The handwriting recognition problem has been attacked in several ways: recognizing characters, recognizing words and even recognizing whole lines of text. This document proposes a novel method for off-line handwritten word recognition, which takes advantage of recurrent neural networks for classification of time-dependent data, and self-organization of the SOM neural networks in clustering similar word segments and use this information of similarity to improve the process of classification. The proposed method uses a simple recurrent network, also known as Elman network, which is fed by a vector of features obtained from the application of a probability distribution function on the outcome of activation of a SOM map. The method presented was tested using a subset of the IAM database through several experiments, the results obtained showed that the combination of a SOM network, similarity measures and recurrent neural networks significantly improve the classification of handwritten words. The classifier trained had an average of 78.2% of accuracy in recognition of 10 classes of words, compared to 66.2% obtained by a recognizer based solely on a combination of SOM networks and multi-layered perceptron, and 32.1% obtained by a multi-layer perceptron classifier.
En la actualidad grandes volúmenes de información están disponibles en distintos medios electrónicos, sin embargo, todavía existe una gran cantidad de información escrita a mano que se encuentra sólo en papel o en documentos digitalizados (imágenes), e incluso se siguen generando una gran cantidad de este tipo de documentos. Esta situación ha motivado el desarrollo de métodos de reconocimiento de texto manuscrito para recuperar dicha información, ya sea de documentos almacenados (reconocimiento fuera de línea) o reconociendo el texto mientras es generado (reconocimiento en línea). Sin embargo, reconocer texto manuscrito es una tarea muy complicada debido a la variación de los estilos de escritura que existen, siendo aún un problema abierto y sobre el cual se sigue investigando. El problema de reconocer texto manuscrito se ha atacado de distintas formas: reconociendo caracteres, reconociendo palabras e incluso reconociendo líneas de texto completas. En este documento se propone un método novedoso para el reconocimiento fuera de línea de palabras manuscritas, que aprovecha las ventajas que ofrecen las redes neuronales recurrentes para la clasificación de datos que dependen del tiempo, y la auto-organización de las redes neuronales SOM para agrupar segmentos de palabra similares y utilizar esta información de similitud para lograr una mejor clasificación. El método propuesto utiliza una red recurrente simple, también conocida como “red Elman”, la cual es alimentada por un vector de características obtenido de la aplicación de una función de distribución de probabilidad sobre los resultados de activación de un mapa SOM. El método que se presenta fue probado utilizando un sub-conjunto de la base de datos IAM a través de varios experimentos, encontrándose que la combinación de redes SOM, medidas de similitud y redes neuronales recurrentes mejoran sustancialmente la clasificación de palabras manuscritas. El clasificador construido obtuvo un promedio de 78.2% de exactitud en el reconocimiento de 10 palabras distintas, en comparación al 66.2% obtenido por un reconocedor basado únicamente en una combinación de redes SOM y perceptrones de varios niveles, y al 32.1% obtenido por un clasificador basado únicamente en perceptrones.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2011-02
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Luna-Perez R.
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
LunaPR.pdf2.72 MBAdobe PDFVisualizar/Abrir