Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/1237
Dependability for ESB systems in critical environments based on self-healing and checkpointing principles.
Mariano Vargas-Santiago
SAUL EDUARDO POMARES HERNANDEZ
LUIS ALBERTO MORALES ROSALES
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Distributed systems
Autonomic computing
Web services
Checkpointing
Fuzzy logic
Ensuring dependability for computer systems based on fault tolerance is an open challenge. Due to the complexity and heterogeneity of the interactions and services, offered by distributed systems, they make the administration and management of resources in highly dynamic environments exceed the capabilities of more experienced network administrators. As a consequence, new paradigms emerge (autonomic computing) and the Service-Oriented Architecture (SOA). In this dissertation, on the one hand, autonomic computing is focused on solving the complexity of monitoring and diagnosing the behavior of the systems with low resources and little human intervention. On the other hand, to consider the heterogeneity of the systems, the SOA paradigm and the Enterprise Service Bus (ESB) were used for their integration. Applications and systems are needed to intercommunicate with each other, often in unreliable environments such as the nature of the Internet. There are sophisticated solutions, such as replication of services, rollback recovery, and self-healing, which increase the systems' reliability. However, these approaches have drawbacks; for example, they affect the performance of the system, have high implementation costs and/or can endanger its scalability. On the other hand, to facilitate the self-management of the systems, in this dissertation, we implement the Monitoring, Analysis, Planning and Execution (MAPE) control cycle. An open challenge for the MAPE cycle is to effciently carry out the diagnostic and decision-making processes, collecting data from which the system can detect, diagnose and repair potential problems, that is, increase the dependability of the systems specifically with fault tolerant mechanisms. A useful tool for this purpose is through the implementation of communication-induced checkpointing (CiC) mechanism. The experimental results support the viability of our proposals.
Garantizar la confiabilidad (dependability) para sistemas computacionales basados en tolerancia a fallos es un reto que representa un desafío, aún abierto. Debido a la complejidad y heterogeneidad de las interacciones de los servicios ofrecidos por los sistemas distribuidos, estos hacen que la administración y el manejo de los recursos en entornos altamente dinámicos excedan las capacidades incluso de los administradores de red más experimentados. Como consecuencia, surgen nuevos paradigmas: el cómputo autonómico (autonomic computing) y el de la arquitectura orientada al servicio (SOA, Service-Oriented Architecture). En esta disertación, por un lado, enfocamos al cómputo autonómico para resolver la complejidad de monitorizar y diagnosticar con bajos recursos y poca intervención humana el comportamiento de los sistemas. Por otro lado, para considerar la heterogeneidad de los sistemas se utilizó el paradigma SOA y el bus de servicios empresariales (ESB, Enterprise Service Bus) para su integración. Las aplicaciones y sistemas se necesitan intercomunicar entre sí, muchas veces en ambientes no confiables como lo es la naturaleza del Internet. Existen soluciones sofisticadas, tales como: replicación de servicios, regresión en reversión, y auto-sanación, que aumentan la confiabilidad del sistema. Sin embargo, esos enfoques tienen inconvenientes; por ejemplo, afectan el rendimiento del sistema, tienen altos costos de implementación y/o pueden poner en peligro su escalabilidad. En contraparte, para facilitar la autogestión de los sistemas, en esta disertación, implementamos el ciclo de control de Monitoreo, Análisis, Planificación y Ejecución (MAPE). Un desafío abierto para el ciclo MAPE es llevar a cabo de manera eficiente los procesos de diagnóstico y toma de decisiones, recolectando datos de los cuales el sistema puede detectar, diagnosticar y reparar problemas potenciales, es decir, incrementar la confiabilidad de los sistemas específicamente con mecanismos tolerantes a fallas. Una herramienta útil para este propósito es mediante la implementación de puntos de control inducidos por comunicación (CiC, communication-induced checkpointing). Los resultados experimentales respaldan la viabilidad de nuestras propuestas.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2018
Tesis de doctorado
Inglés
Estudiantes
Investigadores
Público en general
Vargas Santiago, M., (2018). Dependability for ESB systems in critical environments based on self-healing and checkpointing principles, Tesis de Doctorado, Instituto Nacional de Astrofísica, Óptica y Electrónica
LENGUAJES DE PROGRAMACIÓN
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Doctorado en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
VargasSaM.pdf5.16 MBAdobe PDFVisualizar/Abrir