Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/401
Aprendizaje por transferencia de redes bayesianas | |
ROGER LUIS VELAZQUEZ | |
LUIS ENRIQUE SUCAR SUCCAR EDUARDO FRANCISCO MORALES MANZANARES | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Belie networks Machine learning Transfer learning | |
In several domains, it is common to have data from different, but closely related problems (this
means that the distributions of the data are similars but no equals). For instance, in manufacturing
many products follow the same industrial process but with different conditions; or in
industrial diagnosis, where there is equipment with similar specifications. In these cases, it is
common to have plenty of data for some scenarios but very little for other, for example, for rare
products of little production. When there are a lot of data they can induce models from which
can be used in diagnosis and classification tasks. However, as the exactitude of the induced
model is based on the data available, having relatively little data are obtained very poor models.
In order to improve the accuracy of models for learning domains with little data, one possibility is
to use data and knowledge of similar domains. Using knowledge of similar domains has already
been addressed in previous works introducing techniques known as MULTITASK LEARNING, whose
objective is to improve multiple models simultaneously, or otherwise improve a single model
using techniques known as TRANSFER LEARNING. The bayesians networks have not been used
with the mentioned techniques previously. In this thesis, we propose a transfer learning method
to learn Bayesian networks that considers both, structure and parameter learning. For structure
learning, we use conditional independence tests, by combining measures from the target domain
with those obtained from one or more auxiliary domains, transferring information from the
most related domains with the aim of improving the accuracy of the less reliable parts of the
network. For parameter learning, it’s compared three techniques for probability aggregation that
combine probabilities estimated from the target domain with the auxiliary data. Through these
techniques is to address two related problems: the lack of information in the domains with little
data using domains related and a way of transferring knowledge from those domains related
retaining characteristics of the target model. To validate the approach, are used three standard
Bayesian networks commonly used in literature, and generated variants of each model by changing the structure as well as the parameters. Then learned on one of the variants with a small
data set and combined it with information from the other variants. En muchos dominios, es común tener datos de problemas similares (entendiéndose así porque las distribuciones de los datos son parecidos entre sí pero no iguales). Por ejemplo, en la industria se tienen muchos productos que se obtienen por el mismo proceso industrial pero con diferentes condiciones; o en el diagnóstico industrial donde se encuentran equipos con especificaciones similares. En estos casos, es común tener una gran cantidad de datos para algunos escenarios pero muy pocos para otros, por ejemplo, para productos raros de poca producción. Cuando se cuenta con muchos datos se pueden inducir modelos a partir de éstos que pueden ser utilizados en tareas de diagnóstico y clasificación. Sin embargo, como la exactitud del modelo inducido está en función de los datos disponibles, al tener relativamente pocos datos se obtienen modelos muy pobres. Con el objetivo de mejorar la exactitud del aprendizaje de modelos para dominios con pocos datos, una posibilidad es utilizar datos y conocimiento de dominios similares. Utilizar conocimiento de dominios similares ya ha sido abordado en la literatura presentándose técnicas conocidas como APRENDIZAJE DE MÚLTIPLES TAREAS, cuyo objetivo es mejorar múltiples modelos simultáneamente, o en otros casos mejorar un único modelo utilizando técnicas de APRENDIZAJE POR TRANSFERENCIA. Las redes bayesianas no han sido muy utilizadas con las técnicas mencionadas anteriormente. En esta tesis, se propone utilizar aprendizaje por transferencia en métodos de obtención de la estructura y parámetros de redes bayesianas a partir de datos. Para el aprendizaje estructural, se usan pruebas de independencia condicional, combinando medidas desde el dominio objetivo con las obtenidas de uno o más de los dominios auxiliares, transfiriendo información desde los dominios más relacionados con el objetivo de mejorar la precisión de las partes menos confiables de la red. Para el aprendizaje paramétrico, se compararon técnicas de agregación de probabilidades que combinan las probabilidades estimadas de los datos con los datos auxiliares. Mediante estas técnicas se trata de abordar dos problemas relacionados: la falta de información en los dominios con pocos datos utilizando problemas relacionados y una manera de transferir conocimiento desde problemas relacionados conservando aquellas características propias del modelo objetivo. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2009 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
Luis Velazquez R. | |
CIENCIA DE LOS ORDENADORES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
LuisVR.pdf | 3.04 MB | Adobe PDF | Visualizar/Abrir |