Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/750
Clasificación jerárquica multidimensional
JULIO NOE HERNANDEZ TORRES
EDUARDO FRANCISCO MORALES MANZANARES
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Classification
Multidimensional systems
Hierarchical systems
Hierarchical classification is a variant of multidimensional classification where the classes are arranged in a hierarchy and the objective is to predict a class, or a set of classes, according to a pre-established taxonomy. Different alternatives have been proposed for hierarchical classification, from which the most important are the local and global approaches. Local approaches suffer from the inconsistency error problem, it occurs when a classification error in a certain node is propagated to all its descendants. The global approaches produce more complex models and, in general, tend to be dependent to the selected classifier. In this thesis is presented a new hierarchical classifier method that takes into account all the possible paths in the hierarchy at the moment of realize a prediction. The proposed method is an alternative approach inspired in multidimensional classification. The method builds a multi-class classifier per each parent node in the hierarchy. In the classification phase all the local classifiers are applied simultaneously to each instance resulting in a most probable class for each classifier. Then, one of three proposed methods is applied to obtain a set of classes, consistent with a branch of the hierarchy. We also developed two extensions: the first consider the dependencies between the local classifiers using a chain classifier, and the second to classify at different levels in the hierarchy based on information gain. The proposed method was tested on three different hierarchical classification data sets and was compared against state-of-the-art systems, resulting in superior or similar predictive performance to the other approaches in all the datasets.
La clasificación jerárquica es una variante de la clasificación multidimensional en donde las clases están organizadas en una jerarquía y el objetivo es predecir una clase, o un conjunto de ellas, de acuerdo a una taxonomía prestablecida. Se han propuesto diferentes alternativas para resolver problemas de tipo jerárquico, de las cuales las más destacadas son las aproximaciones locales y globales. El problema principal de los métodos locales es el de inconsistencia, _este se presenta cuando se produce un error de clasificación en un cierto nodo siendo propagado a todos sus descendientes. Los clasificadores jerárquicos globales tienen el problema de producir modelos complejos y, por lo general, tienden a ser dependientes al clasificador elegido. El objetivo de este trabajo de tesis es desarrollar un nuevo método de clasificación jerárquico que tome en consideración todos los posibles caminos (ramas) en la jerarquía al momento de realizar una predicción. El método propuesto es una alternativa inspirada en la clasificación multidimensional. El método construye un clasificador multi-clase para cada nodo padre de la jerarquía. Durante la fase de clasificación, todos los clasificadores locales son aplicados simultáneamente a cada instancia, dando como resultado la clase más probable para cada clasificador. Posteriormente, se aplica uno de los tres métodos propuestos para obtener un conjunto de clases consistentes con alguna de las ramas de la jerarquía. Se desarrollaron dos extensiones al método base: La primera considera la dependencia entre los clasificadores locales aplicando el método de encadenamiento, y la segunda para clasificar a diferentes niveles de la jerarquía basados en ganancia de información. El método propuesto fue probado en tres diferentes conjuntos de datos y fue comparado con los métodos del estado del arte, resultando en un desempeño predictivo similar o superior a las demás aproximaciones en todas las bases de datos.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2012
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Hernandez-Torres J.N.
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
HernandezTJN.pdf1.09 MBAdobe PDFVisualizar/Abrir