Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/633
Extracción de características en imágenes de células de médula ósea para la clasificación de leucemias agudas
BLANCA AURORA MORALES GONZALEZ
JESUS ANTONIO GONZALEZ BERNAL
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Classification
Data mining
Image processing
In this work, we present the development of a methodology that allows classifying acute leukemias from the extracted characteristics of bone marrow cells images using computer vision and data mining tools. We first created an images database from bone marrow smears elaborated at the chemistry laboratory of the IMSS San José Specialties Hospital located in Puebla City, México. Then, the smears were digitized using a Carl Seizz optical microscope with a digital camera connected to a frame grabber. Before the pre-processing phase, we used computer vision techniques to filter the images and to extract significant characteristics to build a database containing the characteristics of the regions of interest to feed the data mining/machine learning algorithms for the discovery of patterns that best describe the two leukemia types: linfoblastic and mieloblastic. Finally, we evaluated the classification results using the 10 fold crossvalidation technique, which provides us with the accuracy for the classification of new samples. The objective of this work was the elaboration of a methodology which can be used to create a medical diagnosis support tool for classifying acute leukemias. The most efficient algorithms used for this work were: “Logistic Regression” and “MultilayerPerceptron” (1 layer with 4 neurons or 2 layers with 6 neurons for layer) which have a predictive accuracy of 89.80% and 91.79% respectively. In this research, we carried out tests with two types of images databases: the first one is a balanced database (there is the same number of samples of linfoblastic acute leukemia and mieloblastic acute leukemia), while the second database is unbalanced, taking into account the leukemia types proportion that exists in the real world (80% of LLA vs. 20% of LMA). Two algorithms were developed: one, to describe the methodology proposed in this research for classifying acute leukemias, and the other, to filter the images and extract regions of interest. There is still future work to carry out to improve classification accuracy, such as: classification of leukemias subtypes, testing other texture and geometric characteristics, as well as testing other data mining techniques. The achieved results were good according to the domain experts, considering that there is not much research to classify leukemia from a morphological point of view using computational methods.
En este trabajo se presenta el desarrollo de una metodología que permite clasificar leucemias agudas a partir de características extraídas en imágenes de células de médula ósea utilizando herramientas de las áreas de Visión por Computadora y Minería de Datos. En este proceso, lo primero que se realiza es la creación de la base de datos de imágenes, estas imágenes se obtuvieron a partir de frotis de sangre de médula ósea elaborados en el laboratorio de química del Hospital de Especialidades del IMSS en San José, Puebla. Posteriormente se procede a su digitalización, empleando para ello un microscopio óptico Carl Seizz, el cual tiene incorporada una cámara digital, a través de la cual se conecta a una tarjeta digitalizadora para poder obtener las imágenes digitalizadas. Después en la fase del pre-procesamiento se utilizan técnicas de visión por computadora para el filtrado de las imágenes y la extracción de características significativas, para que posteriormente la base de datos de características de las regiones de interés alimente a los algoritmos de minería de datos y/o aprendizaje computacional para el descubrimiento de patrones que describen a los dos tipos de leucemia: linfoblásticas y mieloblásticas. Por último, se evalúan los resultados con la técnica de validación cruzada con 10 pasos (10 fold cross-validation), la cual nos proporciona el porcentaje de confiabilidad en las clasificaciones de las nuevas imágenes. El objetivo de esta investigación es la elaboración de una metodología que sirva para la creación de una herramienta de apoyo al diagnóstico médico en la clasificación de leucemias agudas. Los algoritmos utilizados y con los cuales se obtuvieron mejores resultados son: “Logistic” y “Redes Neuronales Multicapa” (1 capa con 4 neuronas o 2 capas con 6 neuronas por capa) con un 89.80% y 91.79% respectivamente. En esta investigación las pruebas se realizaron con 2 tipos de base de datos de imágenes: la primera es una base de datos balanceada (igual número de muestras del tipo de leucemia linfoblástica aguda (LLA) y leucemia mieloblástica aguda (LMA)) y la segunda es una base de datos desbalanceada tomando en cuenta la proporción que existe en el mundo real (80% de LLA Vs. 20% LMA). Se desarrollaron dos algoritmos: uno que describe la metodología propuesta en esta investigación para la clasificación de las leucemias, y el otro para el filtrado de las imágenes y la extracción de características de las mismas.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2007-02
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Morales-González BA
LENGUAJES DE PROGRAMACIÓN
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
MoralesGBA.pdf2.83 MBAdobe PDFVisualizar/Abrir