Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/1951
Aprendizaje supervisado por la web basado en información multi-modal de imágenes
Ricardo Benitez-Jimenez
Hugo Jair Escalante Balderas
Eduardo F. Morales
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Meta-learning
Multi-modal
Web supervised learning
Nowadays, in domestic assistance robotics it is of great interest to find objects as part of a sub-task of a particular activity, such as carrying an object from one place to another. However, sometimes the object to be recognized is not part of the existing models for object recognition. An alternative it is learning to recognize a new object category is by retrieving images of the object via the Internet, this technique is known as Webly-supervised learning (WSL). However, use all the retrieved images to train a classifier produces a low performance in this task due to the amount of irrelevant images retrieved from the Web. Recent approaches use irrelevant images in their initial classifiers in order to filter irrelevant images, furthermore, they do not show evidence that their approaches work to learn unknown object categories. In this thesis we present a new method inspired by meta-learning allowing to take advantage of the information (textual and visual) in the Web to image filtering of unknown object categories in a multi-modal approach. The experimental results show that the proposed method is an alternative that offers a similar performance to the manual selection of relevant images in object recognition task.
Actualmente en robótica de asistencia doméstica es de gran interés encontrar objetos como parte de una subtarea de una actividad en particular, tal es el caso de mover un objeto de un lugar a otro. Sin embargo, en ocasiones el objeto a reconocer no forma parte de los modelos existentes para el reconocimiento de objetos. Una manera de aprender a reconocer un nuevo objeto es recuperando imágenes del objeto por medio de Internet, a esta técnica se le conoce como aprendizaje supervisado por la Web (WSL por sus siglas en inglés). No obstante, utilizar todas las imágenes recuperadas para el entrenamiento de un clasificador produce un bajo rendimiento en esta tarea debido a la cantidad de imágenes irrelevantes recuperadas de la Web. Los enfoques existentes conservan imágenes irrelevantes en sus clasificadores iniciales para el filtrado de imágenes irrelevantes, además de no presentar evidencia de que sus enfoques funcionen adecuadamente en objetos desconocidos. En este trabajo se propone un nuevo método inspirado en el meta-aprendizaje que permite tomar ventaja de la información (textual y visual) presente en la Web para filtrar de manera multi-modal imágenes de categorías desconocidas. Los resultados experimentales muestran que el método propuesto es una alternativa que ofrece un rendimiento similar a la selección manual de imágenes relevantes en la tarea de reconocimientos de objetos.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2019-08
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Benítez Jiménez, R., (2019), Aprendizaje supervisado por la web basado en información multi-modal de imágenes, Tesis de Maestría, Instituto Nacional de Astrofísica, Óptica y Electrónica.
DISPOSITIVOS DE ALMACENAMIENTO
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
BenitezJR.pdf7.18 MBAdobe PDFVisualizar/Abrir