Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/628
Algoritmos de agrupamiento global para datos mezlados | |
SAUL LOPEZ ESCOBAR | |
JOSE FRANCISCO MARTINEZ TRINIDAD | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Pattern recognition Pattern clustering Machine learning | |
Clustering problem arises in many practical applications in several areas such as Pat-
tern Recognition, Machine Learning, Data Mining, Digital Image Processing, etc. The
k-means algorithm is one of the most frequently algorithms used to solve the clustering
problem, this is due its simplicity but, it has many drawbacks such as: i) it only allows
working with numeric data and ii) it heavily depends on the initial conditions.
On the other hand, in soft sciences such as Medicine, Geology, Sociology, Market-
ing, etc, it is common that objects are described in terms of numeric and no numeric
features (mixed data).
In this context, we propose two clustering algorithms based in the k-Means algo-
rithm. Both algorithms allow working with mixed data and they don't depend on the
initial conditions. The proposed algorithms are tested with data sets obtained from
one public repository and they are compared against other clustering algorithms. El agrupamiento es un problema que se presenta en una gran cantidad de aplicaciones prácticas en varios campos tales como Reconocimiento de Patrones, Aprendizaje Automático, Minería de Datos, Procesamiento Digital de Imágenes, etc. El algoritmo k-Means es uno de los algoritmos más frecuentemente usados para resolver el problema de agrupamiento, debido principalmente a su simplicidad, pero tiene varias desventa- jas entre las que se tienen: i) sólo permite trabajar con datos exclusivamente numéricos y ii) depende fuertemente de las condiciones iniciales con las que sea ejecutado. Por otro lado, se tiene que en ciencias denominadas \suaves" (soft sciences) tales como Medicina, Geología, Sociología, Mercadotecnia, etc. es común que los datos se encuentren descritos por medio de atributos numéricos y no numéricos (datos mezclados) simultáneamente. Dentro de este contexto, en este trabajo se proponen dos algoritmos de agrupamiento restringido basados en el algoritmo k-Means. Ambos algoritmos permiten trabajar con datos mezclados y no dependen de las condiciones iniciales con las que sean ejecutados. Los algoritmos propuestos son evaluados usando conjuntos de datos obtenidos de un repositorio público y son comparados contra otros algoritmos de agrupamiento restringido. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2007-02 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
López-Escobar S | |
BANCOS DE DATOS | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
LopezES.pdf | 810.79 kB | Adobe PDF | Visualizar/Abrir |