Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/424
Métodos para la selección de prototipos
JOSE ARTURO OLVERA LOPEZ
JOSE FRANCISCO MARTINEZ TRINIDAD
JESUS ARIEL CARRAZCO OCHOA
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Pattern recognition
Data analysis
Artificial intelligence
In Pattern Recognition, the supervised classifiers assign a label or class to unseen objects or prototypes. For classifying new prototypes a set of prototypes called training set is used, this set provides useful information to the classifiers during the training stage. In practice, not all the information in the training set is useful so it is possible to discard irrelevant prototypes from the training set. This process is known as prototype selection and it is the main topic of this research. Through prototype selection the training set size is reduced which allows reducing the runtimes in the classification and/or training stages of the classifiers with acceptable classification accuracy, which is the purpose of the prototype selection. In the literature, several methods have been proposed for selecting prototypes however, their performance is strongly related to the use of a specific classifier and when different classifiers are used, the performance of these methods decreases. In addition, most of the methods spend long time selecting prototypes when large datasets are processed and in some cases, they cannot be applied. The contribution of this research are four methods for selecting prototypes which solve drawbacks of some methods in the state of the art. The first two methods are based on the sequential search and the remaining methods uses clustering and prototypes relevance for selecting border prototypes. According to the results reported in this work, the proposed methods are a good option for solving the prototype selection problem. In addition, two of the proposed methods are faster than other methods from the state of the art mainly in the large-training sets case.
En reconocimiento de patrones, los clasificadores supervisados asignan una clase a nuevos objetos o prototipos. Para llevar a cabo este proceso se usa un conjunto de entrenamiento, mediante el cual se proporciona información al clasificador durante su etapa de entrenamiento. En la práctica, no toda la información en los conjuntos de entrenamiento es útil, por lo que es necesario descartar algunos prototipos del conjunto de entrenamiento. A este proceso se le denomina selección de prototipos, la cual corresponde al área en que se ubica el trabajo de investigación de esta tesis. Mediante la selección de prototipos se reduce el tamaño de un conjunto de entrenamiento y como consecuencia, se reducen los tiempos de ejecución en los procesos de clasificación y/o entrenamiento con una calidad de clasificación aceptable con respecto a la obtenida con los conjuntos originales de entrenamiento. Siendo ésta la principal utilidad de la selección de prototipos. Se han propuesto diversos métodos para la selección de prototipos, varios de ellos presentan un buen desempeño pero la selección está fuertemente ligada al uso de un clasificador particular, por lo que, cuando se requieren utilizar otros clasificadores, el desempeño de estos métodos se ve afectado. Otra de las características que presentan los métodos del estado del arte es que el tiempo requerido por éstos para llevar a cabo la selección crece cuando el conjunto de entrenamiento es grande, lo cual provoca que sean métodos costosos y, en algunas ocasiones, inaplicables. La contribución de este trabajo son métodos para la selección de prototipos que solucionan las limitantes de algunos de los métodos existentes, tales como altos tiempos de ejecución y la dependencia del uso de algún clasificador particular en el desempeño de los métodos de selección. En particular, se proponen cuatro métodos para la selección de prototipos; dos de ellos se basan en la búsqueda secuencial y los restantes en la selección de prototipos borde mediante agrupamientos y relevancia de prototipos, respectivamente. De acuerdo a los experimentos realizados y resultados obtenidos, los métodos propuestos presentan una solución al problema de la selección de prototipos considerando las limitantes en los métodos relevante existentes. Dos de estos métodos llevan a cabo la selección en un tiempo mucho menor con respecto a otros métodos para el caso específico de grandes conjuntos de datos.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2009-03
Tesis de doctorado
Español
Estudiantes
Investigadores
Público en general
Olvera-Lopez J.A.
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Doctorado en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
OlveraLoJA.pdf747.1 kBAdobe PDFVisualizar/Abrir