Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/688
Desarrollo de clasificadores basados en reglas de asociación de clase | |
RAUDEL HERNANDEZ LEON | |
JESUS ARIEL CARRAZCO OCHOA | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Data mining Pattern recognition Classification | |
Classification based on Class Association Rules (CARs) or associative classification
is a data mining technique that consists of, given a training instance set, finding certain
characteristics in the instances in order to build rules that are subsequently used for
classifying unseen instances. Associative classification has been used in different tasks,
for example: text classification, text segmentation, and automatic image annotation,
among others. However, associative classification methods still have some weaknesses.
In this doctoral dissertation we propose an algorithm called CAR-CA, which introduces
a new pruning strategy that allows to obtain specific rules with high values of
the quality measure. Besides, we introduce two classifiers based on CARs, CAR-IC and
CAR-NF, both use a new way for ordering the set of CARs based on the rule size, a
new covering criterion that considers the inexact coverage when any rule covers the new
instance, and a new strategy for deciding the class of a new instance. Additionally, these
classifiers use as threshold for the quality measure, the minimum value that avoids ambiguity
at the classification stage. In particular, The CAR-NF classifier introduces the
use of the Netconf measure to compute the set of CARs. The experimental results show
that the proposed CARs based classifiers CAR-IC and CAR-NF have better performance
than the main successful classifiers based on CARs. La clasificación basada en Reglas de Asociación de Clase (CARs) es una técnica de la Minería de Datos que consiste en dado un conjunto de instancias de entrenamiento, identificar ciertas características en las instancias para construir reglas que posteriormente se utilicen en la clasificación de nuevas instancias. La clasificación basada en CARs se ha utilizado en diferentes tareas como: la clasificación y segmentación de textos, el etiquetado automático de imágenes, entre otras. No obstante, los principales clasificadores desarrollados, basados en CARs, presentan varias limitaciones. En el marco de esta tesis doctoral se introduce un algoritmo para calcular el conjunto de reglas, CAR-CA, el cual introduce una nueva estrategia de poda que permite obtener reglas específicas, en lugar de reglas generales, con altos valores de la medida de calidad. Además, se introducen dos clasificadores basados en CARs, CAR-IC y CAR-NF, que utilizan una nueva estrategia de ordenamiento basada en el tamaño de las reglas, un nuevo criterio de cubrimiento que considera el cubrimiento inexacto en ausencia de reglas que cubran completamente a la nueva instancia, y un nuevo criterio de decisión para asignar una clase a la nueva instancia. Adicionalmente, ambos clasificadores utilizan como umbral de la medida de calidad, el mínimo valor que evita la ambigüedad al momento de clasificar. En el caso específico del clasificador CAR-NF se introduce el uso de la medida de calidad Netconf para calcular las reglas. Los experimentos realizados muestran que los clasificadores propuestos son superiores en calidad a los clasificadores más exitosos basados en CARs. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2011 | |
Tesis de doctorado | |
Español | |
Estudiantes Investigadores Público en general | |
Hernandez-Leon R. | |
CIENCIA DE LOS ORDENADORES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Doctorado en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
HernandezLeR.pdf | 874.31 kB | Adobe PDF | Visualizar/Abrir |