Please use this identifier to cite or link to this item: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/581
Algoritmos conceptuales restringidos basados en semillas
IRENE OLAYA AYAQUICA MARTINEZ
JOSE FRANCISCO MARTINEZ TRINIDAD
JESUS ARIEL CARRAZCO OCHOA
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Algorithm theory
Cluster tools
Classification
The non-supervised classification algorithms determine clusters such that objects in the same cluster are very similar among them, while objects in different clusters are not similar. However, there are some problems where it is required, besides determining the clusters, to know the properties that characterize them. This problem is known as conceptual clustering. There are different methods that allow to solve the conceptual clustering problem, one of them is the conceptual k-means algorithm, which is a conceptual version of the k-means algorithm; one of the most studied and used algorithms for solving the restricted non-supervised classification problem (when the number of clusters is specified a priori). The main characteristic of the conceptual k-means algorithm is that it requires generalization lattices for the construction of the concepts. The generalization lattices for the qualitative features must be given and the generalization lattices for the quantitative features are built starting from a codification of their values. In this thesis, an improvement of the conceptual k-means algorithm, which uses a different strategy for building the clusters and in the characterization phase, a different generalization lattice for the quantitative features, is proposed. The inconvenience of using generalization lattices is that, in general, it is difficult to determine the generalization lattices. Also, there are not automatic methods to build the generalization lattices; therefore, this task must be done by the user. For this reason, in this thesis, a conceptual k-means algorithm that does not depend on generalization lattices for building the concepts is proposed. Finally, in this thesis, two fuzzy conceptual clustering algorithms, which are fuzzy versions of the proposed hard conceptual clustering algorithms, are proposed.
El estudio de la clasificación no supervisada ha sido enfocado principalmente a desarrollar métodos que determinen agrupamientos tales que objetos en un mismo agrupamiento sean muy similares entre ellos, mientras que objetos de agrupamientos diferentes sean poco similares. Sin embargo, para algunos problemas prácticos se requiere, además de determinar los agrupamientos, conocer las propiedades que describan cómo son dichos agrupamientos. A este problema se le conoce como agrupamiento conceptual. Existen diversos algoritmos que permiten resolver el problema de agrupamiento conceptual entre los que se encuentra el algoritmo k-means conceptual, el cual es una versión conceptual del algoritmo k-means; uno de los algoritmos más estudiados y utilizados para resolver el problema de clasificación no supervisada restringida (cuando se especifica a priori el número de agrupamientos). La principal característica del algoritmo k-means conceptual es que requiere retículos de generalización para la construcción de los conceptos. El retículo de generalización para los atributos cualitativos debe ser dado por el especialista y el retículo de generalización para los atributos cuantitativos se construye a partir de una codificación de los valores de estos atributos. En esta tesis, se propone una mejora del algoritmo k-means conceptual, la cual usa una estrategia diferente para construir los agrupamientos y en la fase de caracterización, un retículo de generalización diferente para los atributos cuantitativos. Un inconveniente al usar retículos de generalización es que, en general, es difícil determinar los retículos de generalización. Además, no se tienen métodos automáticos para construir los retículos, por lo que esta tarea se deja al especialista. Por esta razón, en esta tesis, se propone también un algoritmo k-means conceptual que no depende de retículos de generalización para la construcción de los conceptos. Finalmente, en esta tesis, se proponen dos algoritmos conceptuales difusos, los cuales son versiones difusas de los algoritmos conceptuales duros propuestos.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2007-07
Tesis de doctorado
Español
Estudiantes
Investigadores
Público en general
Ayaquica-Martínez IO
LENGUAJES ALGORÍTMICOS
Versión aceptada
acceptedVersion - Versión aceptada
Appears in Collections:Doctorado en Ciencias Computacionales

Upload archives


File SizeFormat 
AyaquicaMIO.pdf3.28 MBAdobe PDFView/Open