Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/675
Clasificación semi-supervisada con pesos dinámicos aplicada a imágenes de percepción remota
OLMO SEBASTIAN ZAVALA ROMERO
EDUARDO FRANCISCO MORALES MANZANARES
LEOPOLDO ALTAMIRANO ROBLES
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Classification
Semi-supervised
Remote sensing
In this thesis two semi-supervised classifiers are proposed: Expectation Maximization with Dynamic Weights EM-DW and Tree Augmented Naive Bayes with Dynamic Weights TAN-DW. These classifiers reduced the individual contribution of the unlabeled examples with the final purpose of decreasing the impact of the mistaken labeled examples in the model of the classifiers. In this work 14 databases are tested, 12 of them from the UCI Machine Learning Repository. In these tests the following algorithms are compared: the semi-supervised TAN-EM, the semi-supervised EM-NB, the supervised TAN and Naive Bayes. The results of the tests are that around 50% of the trials the semi-supervised classifiers are better than the supervised ones. The proposed classifier EM-DW improves in 57% of the cases the EM-NB algorithm while the TAN-DW improves the TAN-EM classifier in 54% of the cases. An analysis of confidence is also made, this analysis show that the results of the algorithms TAN-DW and TAN-EM are less significant that those of EM-DW and EM-NB. This analysis is important because it shows that for the EM-DW there are some results were it improves over the EM-NB algorithm and that the results are significant. A methodology to classify satellite images with semi-supervised algorithms is also proposed. This methodology uses a color based segmentation algorithm and 24 attributes to train the classifiers. To test this methodology 210 regions are used to identify 7 different classes. These regions are obtained manually from images of the SPOT5 satellite. In these tests the TAN-DW classifier obtains up to 96% of correct classification while the EM-DW algorithm up to 90.8%. In other tests 6 satellite images were classified modifying the amount of unlabeled examples by class. These tests show the effect of unbalanced classes in the semi-supervised classifiers.
En ésta tesis se proponen dos clasificadores semi-supervisados Expectation Maximization - Dynamic Weights (EM-DW) y Tree Augmented Naive Bayes - Dynamic Weights (TAN-DW). Estos algoritmos se basan en el clasificador Expectation Maximization - Naive Bayes (EM-NB) propuesto por Nigam et al [?] y el clasificador TAN-EM propuesto por Cohen et al [?] respectivamente. En los algoritmos anteriores (EM-NB y TAN-EM) el conjunto de datos no etiquetados tiene un peso fijo que disminuye su aportación en el modelo del clasificador. Los algoritmos propuestos reducen la aportación de los ejemplos no etiquetados de forma individual, con el objetivo de minimizar el impacto de los datos mal etiquetados en el modelo final del clasificador. Ambos clasificadores son algoritmos probabilistas que dependiendo la clase a posteriori más probable, asignan etiquetas a los ejemplos no clasificados. La propuesta de asignar pesos individuales se basa en la hipótesis: los ejemplos que obtengan una probabilidad mayor por el clasificador supervisado (TAN o NB) son los que se clasifican con mayor seguridad y por lo tanto, es más probable que sean etiquetados de forma correcta; mientras que los ejemplos que reciban una menor probabilidad son aquellos que fueron etiquetados de forma incierta y por lo tanto, es más probable que sean clasificados incorrectamente. En este trabajo se hacen experimentos con 14 bases de datos, 12 de ellas del repositorio de aprendizaje computacional UCI y se comparan los algoritmos propuestos con los clasificadores semi-supervisados TAN-EM y EM-NB así como con los algoritmos supervisados TAN y NB, modificando los porcentajes de ejemplos etiquetados. Las pruebas muestran los siguientes resultados: los algoritmos semi-supervisados mejoran en menos de la mitad de los casos a los clasificadores supervisados, el algoritmo propuesto EM-DW mejora o iguala al clasificador EM-NB en el 57% de los casos, mientras que el algoritmo TAN-DW mejora al algoritmo TAN-EM en el 54% de las pruebas. También se presentan pruebas estadísticas en donde se observa que las pruebas hechas entre el algoritmo TAN-DW y TAN-EM son poco significativas a diferencia de las pruebas entre el algoritmo propuesto EM-DW y EM-NB en donde si hay resultados significativos. En el área de percepción remota se propone una metodología para aplicar los algoritmos semi-supervisados en la clasificación de imágenes de satélite.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2007-02
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Zavala-Romero OS
LENGUAJES ALGORÍTMICOS
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
ZavalaROS.pdf7.11 MBAdobe PDFVisualizar/Abrir