Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/826
Supervised classifiers based on emerging patterns for class imbalance problems
OCTAVIO LOYOLA GONZALEZ
JOSE FRANCISCO MARTINEZ TRINIDAD
MILTON GARCÍA BORROTO
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Pattern recognition
Imbalance problems
Supervised classifiers
In the last years, emerging pattern-based classifiers have become an important family of supervised classifiers. However, in those problems where the objects are not equally distributed into the classes (class imbalance problems), emerging pattern mining algorithms, not designed for this kind of problems, extract several emerging patterns with high support for the majority class and only a few (or none) emerging patterns with low support for the minority class. As a consequence, emerging pattern-based classifiers tend to bias their classification results toward the majority class; obtaining poor classification results for the minority class. Hence, in this PhD research, we first present a study about the effect of class imbalance on quality measures for patterns; from this study, we select the best measure for ranking emerging patterns in class imbalance problems. Additionally, we propose three new algorithms for extracting emerging patterns from imbalanced databases. Our emerging pattern mining algorithms extract a collection of emerging patterns which allows attaining higher accuracies for supervised classification in class imbalance problems than those emerging patterns extracted by other emerging pattern miners developed for this kind of problems. Finally, we propose a new emerging pattern-based classifier specifically designed for class imbalance problems, which obtains significantly better classification results than other classifiers for class imbalance problems reported in the literature.
Los clasificadores basados en patrones emergentes son una familia importante de clasificadores dentro de la clasificación supervisada. Sin embargo, en aquellos problemas dónde los objetos no están distribuidos equitativamente entre las clases (problemas con desbalance de clases), los algoritmos para la extracción de patrones emergentes, que no toman en cuenta este tipo de problemas, extraen muchos patrones emergentes con alto soporte para la clase mayoritaria y sólo unos pocos (a veces ninguno) patrones emergentes con bajo soporte para la clase minoritaria. Como consecuencia, los clasificadores basados en patrones emergentes tienden a sesgar sus resultados de clasificación hacia la clase mayoritaria; obteniendo así, bajos resultados de clasificación para la clase minoritaria. Por ello, en esta investigación doctoral, primero presentamos un estudio acerca del efecto del desbalance de clases en las medidas de calidad para patrones. Adicionalmente, propusimos tres nuevos algoritmos para extraer patrones emergentes en bases de datos con desbalance de clases. Estos algoritmos extraen una colección de patrones emergentes que permiten obtener mayor eficacia, en problemas con desbalance de clases, que la que puede obtenerse al utilizar la colección de patrones emergentes extraídos mediante otros extractores de patrones emergentes reportados en la literatura. Finalmente, propusimos un nuevo clasificador basado en patrones emergentes, específicamente diseñado para problemas con desbalance de clases, que obtiene significativamente mejores resultados de clasificación que aquellos clasificadores reportados en la literatura para problemas con desbalance de clases.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2017-10
Tesis de doctorado
Inglés
Estudiantes
Investigadores
Público en general
Loyola-González O.
LENGUAJES DE PROGRAMACIÓN
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Doctorado en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
LoyolaGoO.pdf954.68 kBAdobe PDFVisualizar/Abrir