Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/1960
Automated method to assist breast cancer diagnosis
Jonathan Hernandez Capistran
Jorge Martinez Carballido
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Mammograms
Machine learning
SVM
KNN
Breast cancer
Micro-calcifications
Breast cancer is the top cause of deaths by cancer in women worldwide. Methods for early detection of breast cancer are of great help to improve prognosis of patients, providing less aggressive treatment, and better time/cost performance. Stage 0 of can-cer, also known as pre-cancer, is not palpable and is only detected by screening mam-mogram examination. Therefore, the detection of cancer in this stage is desirable. This stage is characterized by lesions, known as micro-calcifications (MCs), the first clini-cally observable lesions, indicating such disease. Their typical size is less or equal to 1 mm, that is why it is difficult to be detected by an expert. In recent years, different methods, for micro-calcification detection on mammograms (X-ray images from the breast), have been proposed; however, the issue is still open to reach acceptable levels of detection rate and false alarm rate, preventing its use as a pre-diagnostic tool. This work analyzes and proposes a new and simple system for detection of MCs, based on the use of the two most used public mammogram data sets, MIAS and DDSM. We first, analyze how an expert detects MCs in an image and which are its distinctive characteristics; such as intensity values of the surrounding tissue and the prominent peak in a MC. Therefore, a classification according to their local surroundings: obvi-ous, subtle and clusters. Additionally, a new MC detection method based on (1) mor-phologic segmentation for detection of regions of interest (ROIs), (2) extraction of few and effective attributes from candidates to MCs, and (3) one classification stage with two different classifiers, k Nearest Neighbor (kNN) and Support Vector Machine (SVM). For dense mammograms in MIAS database with a sensitivity of 0.9752, false alarm rate of 0, accuracy of 0.9876, and 0.9951 for area under the ROC curve using SVM, for a classifier. The proposed MC detection method achieves sensitivity, false positive rate, accuracy and area under the ROC curve of 0.9664, 0.0224, 0.9683 and 0.9934 for the MIAS data set; and 0.9386, 0.0526, 0.9664 and 0.9742 for the DDSM data set. The proposed method gives better results than those from state-of-the-art literature, when the mammograms are classified in fatty, fatty-glandular, and dense. Methods, that report results for dense mammograms, have poor performance; however, the presented method shows the best performance for dense mammograms.
El cáncer de mama es la principal causa de muerte por cáncer en mujeres de todo el mundo. Los métodos para la detección temprana del cáncer de seno son de gran ayuda para mejorar el pronóstico de las pacientes, ya que proporcionan un tratamiento menos agresivo y un mejor desempeño en tiempo- costo. La etapa 0 del cáncer, también conocida como pre-cáncer, no es palpable y solo se detecta mediante un examen de ma-mografía. Por lo tanto, la detección de cáncer en esta etapa es deseable. Esta etapa se caracteriza por lesiones, conocidas como microcalcificaciones (MC), las primeras le-siones clínicamente observables, que indican dicha enfermedad. Su tamaño típico es menor o igual a 1 mm, por eso es difícil que un experto lo detecte. En los últimos años, se han propuesto diferentes métodos para la detección de microcalcificaciones en ma-mografías (imágenes de rayos X del seno); sin embargo, el problema aún está abierto para alcanzar niveles aceptables de tasa de detección y tasa de falsos positivos, evitando su uso como herramienta de diagnóstico previo. Este trabajo analiza y propone un sis-tema nuevo y sencillo para la detección de MC, basado en el uso de los dos conjuntos de datos de mamografías públicas más utilizados, MIAS y DDSM. Primero, analiza-mos cómo un experto detecta los MC en una imagen y cuáles son sus características distintivas; tales como los valores de intensidad del tejido circundante y el pico promi-nente en un MC. Por lo tanto, una clasificación de acuerdo con su entorno local: obvio, sutil y agrupaciones. Además, un nuevo método de detección de MC basado en (1) segmentación morfológica para la detección de regiones de interés (ROI), (2) extrac-ción de relevantes características de candidatos a MC, y (3) una etapa de clasificación con dos clasificadores kNN y SVM. Para mamografías densas en la base de datos MIAS con una sensibilidad de 0.9752, tasa de falsa alarma de 0, precisión de 0.9876 y 0.9951 para el área bajo la curva ROC usando SVM, como clasificador. El método de detección de MC propuesto logra sensibilidad, tasa de falsos positivos, precisión y área bajo la curva ROC de 0.9664, 0.0224, 0.9683 y 0.9934 para el conjunto de datos MIAS; y 0.9386, 0.0526, 0.9664 y 0.9742 para el conjunto de datos DDSM. El método pro-puesto ofrece mejores resultados que los de la literatura actual, cuando las mamografías se clasifican en grasosas, glandulares grasosas y densas. Los métodos, que informan resultados de mamografías densas, tienen bajo rend
Instituto Nacional de Astrofísica, Óptica y Electrónica.
2019-12
Tesis de doctorado
Inglés
Estudiantes
Investigadores
Público en general
Hernández Capistrán, J., (2019), Automated method to assist breast cancer diagnosis, Tesis de Doctorado, Instituto Nacional de Astrofísica, Óptica y Electrónica.
ELECTRÓNICA
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Doctorado en Electrónica

Cargar archivos:


Fichero Tamaño Formato  
HernandezCaJ.pdf3.45 MBAdobe PDFVisualizar/Abrir