Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/688
Desarrollo de clasificadores basados en reglas de asociación de clase
RAUDEL HERNANDEZ LEON
JESUS ARIEL CARRAZCO OCHOA
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Data mining
Pattern recognition
Classification
Classification based on Class Association Rules (CARs) or associative classification is a data mining technique that consists of, given a training instance set, finding certain characteristics in the instances in order to build rules that are subsequently used for classifying unseen instances. Associative classification has been used in different tasks, for example: text classification, text segmentation, and automatic image annotation, among others. However, associative classification methods still have some weaknesses. In this doctoral dissertation we propose an algorithm called CAR-CA, which introduces a new pruning strategy that allows to obtain specific rules with high values of the quality measure. Besides, we introduce two classifiers based on CARs, CAR-IC and CAR-NF, both use a new way for ordering the set of CARs based on the rule size, a new covering criterion that considers the inexact coverage when any rule covers the new instance, and a new strategy for deciding the class of a new instance. Additionally, these classifiers use as threshold for the quality measure, the minimum value that avoids ambiguity at the classification stage. In particular, The CAR-NF classifier introduces the use of the Netconf measure to compute the set of CARs. The experimental results show that the proposed CARs based classifiers CAR-IC and CAR-NF have better performance than the main successful classifiers based on CARs.
La clasificación basada en Reglas de Asociación de Clase (CARs) es una técnica de la Minería de Datos que consiste en dado un conjunto de instancias de entrenamiento, identificar ciertas características en las instancias para construir reglas que posteriormente se utilicen en la clasificación de nuevas instancias. La clasificación basada en CARs se ha utilizado en diferentes tareas como: la clasificación y segmentación de textos, el etiquetado automático de imágenes, entre otras. No obstante, los principales clasificadores desarrollados, basados en CARs, presentan varias limitaciones. En el marco de esta tesis doctoral se introduce un algoritmo para calcular el conjunto de reglas, CAR-CA, el cual introduce una nueva estrategia de poda que permite obtener reglas específicas, en lugar de reglas generales, con altos valores de la medida de calidad. Además, se introducen dos clasificadores basados en CARs, CAR-IC y CAR-NF, que utilizan una nueva estrategia de ordenamiento basada en el tamaño de las reglas, un nuevo criterio de cubrimiento que considera el cubrimiento inexacto en ausencia de reglas que cubran completamente a la nueva instancia, y un nuevo criterio de decisión para asignar una clase a la nueva instancia. Adicionalmente, ambos clasificadores utilizan como umbral de la medida de calidad, el mínimo valor que evita la ambigüedad al momento de clasificar. En el caso específico del clasificador CAR-NF se introduce el uso de la medida de calidad Netconf para calcular las reglas. Los experimentos realizados muestran que los clasificadores propuestos son superiores en calidad a los clasificadores más exitosos basados en CARs.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2011
Tesis de doctorado
Español
Estudiantes
Investigadores
Público en general
Hernandez-Leon R.
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Doctorado en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
HernandezLeR.pdf874.31 kBAdobe PDFVisualizar/Abrir