Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/226
Construcción automática de un modelo de predicción a partir del análisis de datos desbalanceados
GERMAN CUAYA SIMBRO
ANGELICA MUÑOZ MELENDEZ
EDUARDO FRANCISCO MORALES MANZANARES
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Artificial intelligence
Bayes methods
Model-based reasoning
Prediction theory
Esta investigación se orienta al procesamiento y análisis de datos con características particulares como son, datos temporales, incertidumbre en los datos, bases de datos con clases binarias, datos con clases desbalanceadas, datos con un evento de interés en la clase minoritaria, datos no estacionarios. Las propiedades anteriores son propias de colecciones de datos del dominio biomédico, industrial, económico, por mencionar algunos ejemplos. Así, la tesis contribuye en tres áreas principales. En primer lugar, en la construcción de un método de selección de variables que favorece la identificación de la clase minoritaria en bases de datos con clases desbalanceadas. Segundo, la representación y construcción de un modelo dinámico probabilista, en la forma de una Red Bayesiana Dinámica no estacionaria que permite pronosticar la ocurrencia de un evento de la clase mayoritaria y minoritaria, favoreciendo a la clase minoritaria, y tercero la aplicación del método propuesto para la construcción de un modelo de la marcha para pronóstico de caídas en adultos mayores. Los resultados obtenidos muestran que el algoritmo de selección de variables propuesto ayuda a seleccionar mejor las variables relevantes para identificar un evento en la clase minoritaria en bases de datos con clases binarias, tanto balanceadas como desbalanceadas, que algoritmos tradicionales de selección de variables. Por otro lado, el modelo propuesto basado en una red Bayesiana dinámica no estacionaria obtiene un mejor desempeño para el pronóstico de la clase minoritaria en datos estacionarios con clases balanceadas y desbalanceadas y datos no estacionarios con clases balanceadas y desbalanceadas, que modelos construidos con técnicas convencionales como las Redes Bayesianas Dinámicas. Además, se tiene evidencia de que los modelos construidos utilizando selección de variables tienen un mejor desempeño que los modelos construidos usando todas las variables del conjunto de datos. El interés en el análisis de este tipo de datos surgió del estudio de la degradación de la marcha. Los modelos propuestos en esta tesis proporcionan información adicional a los expertos en el análisis clínico de la marcha, con quienes se interactuó directamente, dado que no conocen con precisión cuáles son las variables más relevantes que reflejen la degradación patológica de la marcha, ni la manera en que los cambios en las variables de la marcha son desencadenados en personas con alto riesgo de sufrir caídas.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2013-05
Tesis de doctorado
Español
Estudiantes
Investigadores
Público en general
Cuaya-Simbro G.
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Doctorado en Ciencias Computacionales

Cargar archivos:


Fichero Descripción Tamaño Formato  
CuayaSiG.pdf10.5 MBAdobe PDFVisualizar/Abrir