Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/750
Clasificación jerárquica multidimensional | |
JULIO NOE HERNANDEZ TORRES | |
EDUARDO FRANCISCO MORALES MANZANARES | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Classification Multidimensional systems Hierarchical systems | |
Hierarchical classification is a variant of multidimensional classification where the
classes are arranged in a hierarchy and the objective is to predict a class, or a set of
classes, according to a pre-established taxonomy. Different alternatives have been
proposed for hierarchical classification, from which the most important are the
local and global approaches. Local approaches suffer from the inconsistency error
problem, it occurs when a classification error in a certain node is propagated to
all its descendants. The global approaches produce more complex models and, in
general, tend to be dependent to the selected classifier. In this thesis is presented a
new hierarchical classifier method that takes into account all the possible paths in
the hierarchy at the moment of realize a prediction. The proposed method is an alternative
approach inspired in multidimensional classification. The method builds
a multi-class classifier per each parent node in the hierarchy. In the classification
phase all the local classifiers are applied simultaneously to each instance resulting
in a most probable class for each classifier. Then, one of three proposed methods
is applied to obtain a set of classes, consistent with a branch of the hierarchy.
We also developed two extensions: the first consider the dependencies between the
local classifiers using a chain classifier, and the second to classify at different levels
in the hierarchy based on information gain. The proposed method was tested
on three different hierarchical classification data sets and was compared against
state-of-the-art systems, resulting in superior or similar predictive performance to
the other approaches in all the datasets. La clasificación jerárquica es una variante de la clasificación multidimensional en donde las clases están organizadas en una jerarquía y el objetivo es predecir una clase, o un conjunto de ellas, de acuerdo a una taxonomía prestablecida. Se han propuesto diferentes alternativas para resolver problemas de tipo jerárquico, de las cuales las más destacadas son las aproximaciones locales y globales. El problema principal de los métodos locales es el de inconsistencia, _este se presenta cuando se produce un error de clasificación en un cierto nodo siendo propagado a todos sus descendientes. Los clasificadores jerárquicos globales tienen el problema de producir modelos complejos y, por lo general, tienden a ser dependientes al clasificador elegido. El objetivo de este trabajo de tesis es desarrollar un nuevo método de clasificación jerárquico que tome en consideración todos los posibles caminos (ramas) en la jerarquía al momento de realizar una predicción. El método propuesto es una alternativa inspirada en la clasificación multidimensional. El método construye un clasificador multi-clase para cada nodo padre de la jerarquía. Durante la fase de clasificación, todos los clasificadores locales son aplicados simultáneamente a cada instancia, dando como resultado la clase más probable para cada clasificador. Posteriormente, se aplica uno de los tres métodos propuestos para obtener un conjunto de clases consistentes con alguna de las ramas de la jerarquía. Se desarrollaron dos extensiones al método base: La primera considera la dependencia entre los clasificadores locales aplicando el método de encadenamiento, y la segunda para clasificar a diferentes niveles de la jerarquía basados en ganancia de información. El método propuesto fue probado en tres diferentes conjuntos de datos y fue comparado con los métodos del estado del arte, resultando en un desempeño predictivo similar o superior a las demás aproximaciones en todas las bases de datos. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2012 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
Hernandez-Torres J.N. | |
CIENCIA DE LOS ORDENADORES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
HernandezTJN.pdf | 1.09 MB | Adobe PDF | Visualizar/Abrir |