Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/511
Algoritmo genético multi-objetivo para el descubrimiento de secuencias reguladoras
JOSE LUIS HERNANDEZ DOMINGUEZ
AURELIO LOPEZ LOPEZ
JESUS ANTONIO GONZALEZ BERNAL
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Genetic algorithms
Biotecnology
Genetics
In some areas such as biology and medicine, it is important to understand de behavior and functionality of living organism in a genetic level. The main reason is that every organism is controlled by short strings of genetic code called genes. To active gen it must receive a directive of the DNA and RNA segments known as regulatory sequence. To find a regulatory sequence is fundamental to search motives inside of the genetic code. A motive is a short sequence made of nucleotides that repeat in certain region of the DNA, commonly near a gen. One technique that has been used to search regulatory sequence is Genetic Algorithm. These stochastic searches, based on evolution of the species, are based on the improvement of individual characteristic through breeding of itself. Since the motive and different characteristic complexity an approach of a mono-objective is not enough since motives have many qualities and not every quality is in all motives. Because of this, the use of a multi-objective algorithm is proposed. This is in order to find most of the motives and, in this way, be able regulatory sequences. The obtained results show that this method is well suited to do the task. This is because it found high conserved regions and, also, there are sequences inside those founded by other methods. Another advantage is that our algorithm was capable on finding big sequence with a length of 18bp (base pair). This is important because is less probable to find a random patron without biological meaning with big sequences.
En algunas áreas como la biología y la medicina, es de suma importancia entender el comportamiento y funcionamiento de los seres vivos a un nivel genético. Esto se debe, principalmente, a que los seres vivos son regulados por segmentos de código llamados genes. Para que un gen se active debe recibir una directriz de segmentos del ADN y ARN conocidos como secuencias reguladoras. Para encontrar una secuencia reguladora es fundamental buscar motivos dentro del código genético. Un motivo es una secuencia de nucleótidos que se repite en determinadas regiones del ADN, comúnmente cerca de los genes. Una de las técnicas que se han utilizado para realizar la búsqueda de secuencias reguladoras son los Algoritmos Genéticos. Estas búsquedas estocásticas, basadas en la evolución de las especies, se basan en el perfeccionamiento de las características de los individuos mediante el entrecruzamiento (reproducción) de los mismos, con una continua evaluación. Dada la complejidad de los motivos y las diferentes características que tienen, un acercamiento con un solo objetivo es insuficiente dado que cada motivo puede tener diferentes cualidades y no todas las cualidades se repiten en todos los motivos. Debido a esto, se plantea el uso de varios objetivos (optimización multi-objetivo). Esto se hace para encontrar la mayor cantidad de motivos y de esta forma obtener las secuencias reguladoras. Los resultados obtenidos muestran que el método es competente para la tarea, ya que ha encontrado regiones altamente conservadas y, también, se han encontrado secuencias dentro de las cuales se han observado subsecuencias obtenidas por otros métodos. Otra ventaja del método propuesto es que fue capaz de encontrar secuencias de gran tamaño con una longitud de hasta 18bp (“base pair” o pares de bases). Esto es importante debido que, entre más larga es la cadena, menos probable es que sea un patrón aleatorio sin significado biológico.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2010
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Hernandez-Dominguez J.L.
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
HernandezDJL.pdf697.18 kBAdobe PDFVisualizar/Abrir