Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/424
Métodos para la selección de prototipos | |
JOSE ARTURO OLVERA LOPEZ | |
JOSE FRANCISCO MARTINEZ TRINIDAD JESUS ARIEL CARRAZCO OCHOA | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Pattern recognition Data analysis Artificial intelligence | |
In Pattern Recognition, the supervised classifiers assign a label or class to
unseen objects or prototypes. For classifying new prototypes a set of prototypes
called training set is used, this set provides useful information to the classifiers
during the training stage. In practice, not all the information in the training set
is useful so it is possible to discard irrelevant prototypes from the training set.
This process is known as prototype selection and it is the main topic of this
research.
Through prototype selection the training set size is reduced which allows
reducing the runtimes in the classification and/or training stages of the
classifiers with acceptable classification accuracy, which is the purpose of the
prototype selection.
In the literature, several methods have been proposed for selecting
prototypes however, their performance is strongly related to the use of a specific
classifier and when different classifiers are used, the performance of these
methods decreases. In addition, most of the methods spend long time selecting
prototypes when large datasets are processed and in some cases, they cannot be
applied.
The contribution of this research are four methods for selecting prototypes
which solve drawbacks of some methods in the state of the art. The first two
methods are based on the sequential search and the remaining methods uses
clustering and prototypes relevance for selecting border prototypes.
According to the results reported in this work, the proposed methods are a
good option for solving the prototype selection problem. In addition, two of the
proposed methods are faster than other methods from the state of the art
mainly in the large-training sets case. En reconocimiento de patrones, los clasificadores supervisados asignan una clase a nuevos objetos o prototipos. Para llevar a cabo este proceso se usa un conjunto de entrenamiento, mediante el cual se proporciona información al clasificador durante su etapa de entrenamiento. En la práctica, no toda la información en los conjuntos de entrenamiento es útil, por lo que es necesario descartar algunos prototipos del conjunto de entrenamiento. A este proceso se le denomina selección de prototipos, la cual corresponde al área en que se ubica el trabajo de investigación de esta tesis. Mediante la selección de prototipos se reduce el tamaño de un conjunto de entrenamiento y como consecuencia, se reducen los tiempos de ejecución en los procesos de clasificación y/o entrenamiento con una calidad de clasificación aceptable con respecto a la obtenida con los conjuntos originales de entrenamiento. Siendo ésta la principal utilidad de la selección de prototipos. Se han propuesto diversos métodos para la selección de prototipos, varios de ellos presentan un buen desempeño pero la selección está fuertemente ligada al uso de un clasificador particular, por lo que, cuando se requieren utilizar otros clasificadores, el desempeño de estos métodos se ve afectado. Otra de las características que presentan los métodos del estado del arte es que el tiempo requerido por éstos para llevar a cabo la selección crece cuando el conjunto de entrenamiento es grande, lo cual provoca que sean métodos costosos y, en algunas ocasiones, inaplicables. La contribución de este trabajo son métodos para la selección de prototipos que solucionan las limitantes de algunos de los métodos existentes, tales como altos tiempos de ejecución y la dependencia del uso de algún clasificador particular en el desempeño de los métodos de selección. En particular, se proponen cuatro métodos para la selección de prototipos; dos de ellos se basan en la búsqueda secuencial y los restantes en la selección de prototipos borde mediante agrupamientos y relevancia de prototipos, respectivamente. De acuerdo a los experimentos realizados y resultados obtenidos, los métodos propuestos presentan una solución al problema de la selección de prototipos considerando las limitantes en los métodos relevante existentes. Dos de estos métodos llevan a cabo la selección en un tiempo mucho menor con respecto a otros métodos para el caso específico de grandes conjuntos de datos. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2009-03 | |
Tesis de doctorado | |
Español | |
Estudiantes Investigadores Público en general | |
Olvera-Lopez J.A. | |
CIENCIA DE LOS ORDENADORES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Doctorado en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
OlveraLoJA.pdf | 747.1 kB | Adobe PDF | Visualizar/Abrir |