Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/752
Aprendizaje de tareas por imitación y retroalimentación en robots de servicio
LUIS ADRIAN LEON ALCALA
EDUARDO FRANCISCO MORALES MANZANARES
LEOPOLDO ALTAMIRANO ROBLES
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Learning
Learning by example
Visual perception
There is an increasing interest in the development of robots able to assist humans in the execution of daily activities, better known as service robots. Their better acceptance and complete incorporation to society will depend of their capability to adapt themselves to the environment and to the user's needs. For that it is necessary to endow the robots with the capability to learn new tasks by interacting, naturally, with users even if they are non-expert in robotics or related areas. In this thesis a new method is proposed which combines learning by demonstration, reinforcement learning and online feedback to allow a human instructor to teach the robot how to execute new tasks. In this method, a user can provide new abilities to the robot simply by demonstrating them with corporal movements. In the research instead of depending of sophisticated sensors for the demonstration, it is used a commercial sensor called Kinect which has low cost and is robust to deferent illumination conditions; its principal function is to perceive the demonstrated task. On the other hand, instead of depending completely on the quality of the user's demonstration, reinforcement learning is applied with the idea of introduce autonomous training. In addition, on-line feedback during the autonomous learning process is introduced which allows the teacher guide the robot toward the improvement of the task demonstrated and achieve faster training times. Finally, a state-action representation based on relative positions and distances is used to characterize the demonstration, to reduce the correspondence problem between human and robot and to produce more general control policies that can be used on deferent instances of the original task. The development was tested with a real robot in simple manipulation tasks with very promising results.
En la actualidad existe un gran interés por el desarrollo de robots que asistan a los humanos en la ejecución de tareas de la vida diaria conocidos como robots de servicio. Su mejor aceptación y completa incorporación a la sociedad dependerá, en gran medida, de la capacidad que tengan para adaptarse a su entorno y satisfacer las necesidades de sus usuarios. Por ello, es necesario dotar a estos robots con capacidad suficiente para que puedan aprender tareas a partir de interactuar, de manera natural, con usuarios incluso no expertos en robótica o áreas afines. En esta tesis se propone un método que combina ideas de aprendizaje por demostración, aprendizaje por refuerzo y retroalimentación en línea, que permite a un humano instructor enseñar a un robot cómo realizar tareas. Con este método un usuario puede dotar de nuevas habilidades a un robot simplemente con la demostración de _estas mediante movimientos corporales. Para la demostración de la tarea se utiliza un sensor comercial Kinect cuya función principal es permitir la percepción de la tarea instruida. Por otro lado, en lugar de depender por completo de la calidad de la demostración humana, se utiliza aprendizaje por refuerzo para dar lugar a una etapa de aprendizaje autónomo. Además, se introduce retroalimentación en línea que, durante el proceso de aprendizaje autónomo, permite al instructor guiar al robot hacia la mejora de la tarea demostrada y lograr un entrenamiento más rápido, en contraste con métodos de aprendizaje por refuerzo tradicionales. Finalmente, se ha decidido incluir una representación basada en posiciones y distancias relativas para caracterizar la demostración, reducir el problema de correspondencia entre humano y robot, y dar origen a políticas de control que permitan la ejecución de variantes de la tarea original. El desarrollo ha sido probado con un robot manipulador real, en tareas sencillas de manipulación de objetos y ha mostrando resultados prometedores.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2012-02
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Leon-Alcala L.A.
CIENCIA DE LOS ORDENADORES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
LeonALA.pdf17.59 MBAdobe PDFVisualizar/Abrir