Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/633
Extracción de características en imágenes de células de médula ósea para la clasificación de leucemias agudas | |
BLANCA AURORA MORALES GONZALEZ | |
JESUS ANTONIO GONZALEZ BERNAL | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Classification Data mining Image processing | |
In this work, we present the development of a methodology that allows classifying acute
leukemias from the extracted characteristics of bone marrow cells images using
computer vision and data mining tools. We first created an images database from bone
marrow smears elaborated at the chemistry laboratory of the IMSS San José Specialties
Hospital located in Puebla City, México. Then, the smears were digitized using a Carl
Seizz optical microscope with a digital camera connected to a frame grabber. Before the
pre-processing phase, we used computer vision techniques to filter the images and to
extract significant characteristics to build a database containing the characteristics of the
regions of interest to feed the data mining/machine learning algorithms for the
discovery of patterns that best describe the two leukemia types: linfoblastic and
mieloblastic. Finally, we evaluated the classification results using the 10 fold crossvalidation
technique, which provides us with the accuracy for the classification of new
samples.
The objective of this work was the elaboration of a methodology which can be used to
create a medical diagnosis support tool for classifying acute leukemias. The most
efficient algorithms used for this work were: “Logistic Regression” and
“MultilayerPerceptron” (1 layer with 4 neurons or 2 layers with 6 neurons for layer)
which have a predictive accuracy of 89.80% and 91.79% respectively.
In this research, we carried out tests with two types of images databases: the first one is
a balanced database (there is the same number of samples of linfoblastic acute leukemia
and mieloblastic acute leukemia), while the second database is unbalanced, taking into
account the leukemia types proportion that exists in the real world (80% of LLA vs.
20% of LMA).
Two algorithms were developed: one, to describe the methodology proposed in this
research for classifying acute leukemias, and the other, to filter the images and extract
regions of interest.
There is still future work to carry out to improve classification accuracy, such as:
classification of leukemias subtypes, testing other texture and geometric characteristics,
as well as testing other data mining techniques. The achieved results were good
according to the domain experts, considering that there is not much research to classify
leukemia from a morphological point of view using computational methods. En este trabajo se presenta el desarrollo de una metodología que permite clasificar leucemias agudas a partir de características extraídas en imágenes de células de médula ósea utilizando herramientas de las áreas de Visión por Computadora y Minería de Datos. En este proceso, lo primero que se realiza es la creación de la base de datos de imágenes, estas imágenes se obtuvieron a partir de frotis de sangre de médula ósea elaborados en el laboratorio de química del Hospital de Especialidades del IMSS en San José, Puebla. Posteriormente se procede a su digitalización, empleando para ello un microscopio óptico Carl Seizz, el cual tiene incorporada una cámara digital, a través de la cual se conecta a una tarjeta digitalizadora para poder obtener las imágenes digitalizadas. Después en la fase del pre-procesamiento se utilizan técnicas de visión por computadora para el filtrado de las imágenes y la extracción de características significativas, para que posteriormente la base de datos de características de las regiones de interés alimente a los algoritmos de minería de datos y/o aprendizaje computacional para el descubrimiento de patrones que describen a los dos tipos de leucemia: linfoblásticas y mieloblásticas. Por último, se evalúan los resultados con la técnica de validación cruzada con 10 pasos (10 fold cross-validation), la cual nos proporciona el porcentaje de confiabilidad en las clasificaciones de las nuevas imágenes. El objetivo de esta investigación es la elaboración de una metodología que sirva para la creación de una herramienta de apoyo al diagnóstico médico en la clasificación de leucemias agudas. Los algoritmos utilizados y con los cuales se obtuvieron mejores resultados son: “Logistic” y “Redes Neuronales Multicapa” (1 capa con 4 neuronas o 2 capas con 6 neuronas por capa) con un 89.80% y 91.79% respectivamente. En esta investigación las pruebas se realizaron con 2 tipos de base de datos de imágenes: la primera es una base de datos balanceada (igual número de muestras del tipo de leucemia linfoblástica aguda (LLA) y leucemia mieloblástica aguda (LMA)) y la segunda es una base de datos desbalanceada tomando en cuenta la proporción que existe en el mundo real (80% de LLA Vs. 20% LMA). Se desarrollaron dos algoritmos: uno que describe la metodología propuesta en esta investigación para la clasificación de las leucemias, y el otro para el filtrado de las imágenes y la extracción de características de las mismas. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2007-02 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
Morales-González BA | |
LENGUAJES DE PROGRAMACIÓN | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
MoralesGBA.pdf | 2.83 MB | Adobe PDF | Visualizar/Abrir |