Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/752
Aprendizaje de tareas por imitación y retroalimentación en robots de servicio | |
LUIS ADRIAN LEON ALCALA | |
EDUARDO FRANCISCO MORALES MANZANARES LEOPOLDO ALTAMIRANO ROBLES | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Learning Learning by example Visual perception | |
There is an increasing interest in the development of robots able to assist humans
in the execution of daily activities, better known as service robots. Their better
acceptance and complete incorporation to society will depend of their capability to
adapt themselves to the environment and to the user's needs. For that it is necessary
to endow the robots with the capability to learn new tasks by interacting, naturally,
with users even if they are non-expert in robotics or related areas. In this thesis a
new method is proposed which combines learning by demonstration, reinforcement
learning and online feedback to allow a human instructor to teach the robot how to
execute new tasks. In this method, a user can provide new abilities to the robot simply
by demonstrating them with corporal movements. In the research instead of depending
of sophisticated sensors for the demonstration, it is used a commercial sensor
called Kinect which has low cost and is robust to deferent illumination conditions; its
principal function is to perceive the demonstrated task. On the other hand, instead of
depending completely on the quality of the user's demonstration, reinforcement learning
is applied with the idea of introduce autonomous training. In addition, on-line
feedback during the autonomous learning process is introduced which allows the teacher
guide the robot toward the improvement of the task demonstrated and achieve
faster training times. Finally, a state-action representation based on relative positions
and distances is used to characterize the demonstration, to reduce the correspondence
problem between human and robot and to produce more general control policies that
can be used on deferent instances of the original task. The development was tested with a real robot in simple manipulation tasks with very promising results. En la actualidad existe un gran interés por el desarrollo de robots que asistan a los humanos en la ejecución de tareas de la vida diaria conocidos como robots de servicio. Su mejor aceptación y completa incorporación a la sociedad dependerá, en gran medida, de la capacidad que tengan para adaptarse a su entorno y satisfacer las necesidades de sus usuarios. Por ello, es necesario dotar a estos robots con capacidad suficiente para que puedan aprender tareas a partir de interactuar, de manera natural, con usuarios incluso no expertos en robótica o áreas afines. En esta tesis se propone un método que combina ideas de aprendizaje por demostración, aprendizaje por refuerzo y retroalimentación en línea, que permite a un humano instructor enseñar a un robot cómo realizar tareas. Con este método un usuario puede dotar de nuevas habilidades a un robot simplemente con la demostración de _estas mediante movimientos corporales. Para la demostración de la tarea se utiliza un sensor comercial Kinect cuya función principal es permitir la percepción de la tarea instruida. Por otro lado, en lugar de depender por completo de la calidad de la demostración humana, se utiliza aprendizaje por refuerzo para dar lugar a una etapa de aprendizaje autónomo. Además, se introduce retroalimentación en línea que, durante el proceso de aprendizaje autónomo, permite al instructor guiar al robot hacia la mejora de la tarea demostrada y lograr un entrenamiento más rápido, en contraste con métodos de aprendizaje por refuerzo tradicionales. Finalmente, se ha decidido incluir una representación basada en posiciones y distancias relativas para caracterizar la demostración, reducir el problema de correspondencia entre humano y robot, y dar origen a políticas de control que permitan la ejecución de variantes de la tarea original. El desarrollo ha sido probado con un robot manipulador real, en tareas sencillas de manipulación de objetos y ha mostrando resultados prometedores. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2012-02 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
Leon-Alcala L.A. | |
CIENCIA DE LOS ORDENADORES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
LeonALA.pdf | 17.59 MB | Adobe PDF | Visualizar/Abrir |