Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/1686
Author profiling in social media with multimodal information
Miguel Ángel Alvarez Carmona
Luis Villaseñor Pineda
ESAU VILLATORO TELLO
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Natural languaje processing
Textual classification
Author profiling
Multimodal information
Images representation
Determine aspects of a person as gender, age, residency, occupation, among others, through his/her texts is a task that is part of the natural language processing and is known as author profiling. In this thesis work, we propose a solution for the task of profiling authors in social networks. Our solution uses a multimodal approach to extracting information from written messages and images shared by users. Previous work has shown the existence of useful information for this task in these modalities; however, our proposal goes further demonstrating the complementarity of the modalities when merging these two sources of information. To do this, we propose to map images in a text, and with that, to have the same framework of representation through which to achieve the fusion of information. Our work explores different methods for extracting information either from the text or from the images. To represent the textual information, different distributional term representations approaches were explored in order to identify the topics addressed by the user. For this purpose, an evaluation framework was proposed in order to identify the most appropriate method for this task. To represent visual information, approaches were explored to convert an image into a set of descriptive terms. The results show that the textual descriptions of the images contain information for the author profiling task, and the fusion of textual information with information extracted from the images increases the accuracy of this task.
Determinar aspectos de una persona como su género, edad, lugar de origen, ocupación, entre otros, a través de sus textos es una tarea que se enmarca dentro del procesamiento del lenguaje natural y se le conoce como perfilado del autor. En este trabajo de tesis se propone una solución para la tarea de perfilado de autores en redes sociales. Nuestra solución utiliza un enfoque multimodal extrayendo información tanto de los mensajes escritos como de las imágenes compartidos por los usuarios. Trabajos previos han demostrado la existencia de información útil para esta tarea en estas modalidades, sin embargo, nuestra propuesta va más allá demostrando la complementariedad de las modalidades al fusionar estas dos fuentes de información. Para ello, se optó por llevar a las imágenes a una representación textual, y con ello contar con un mismo marco de representación a través del cual lograr la fusión de información. Nuestro trabajo explora diferentes métodos para la extracción de información ya sea a partir del texto o de las imágenes. Para representar la información textual, se exploraron diferentes representaciones distribucionales con la finalidad de identificar los temas abordados por el usuario. Para ello se propuso un marco de evaluación de manera a identificar el método más adecuado para esta tarea. Para representar la información visual, se exploraron enfoques para convertir una imagen en conjuntos de términos descriptivos. Los resultados muestran que las descripciones textuales de las imágenes contienen información para la tarea de perfilado de autor; y la fusión de la información textual con información extraída de las imágenes incrementa la exactitud en esta tarea.
Instituto Nacional de Astrofísica, Óptica y Electrónica.
2019-03
Tesis de doctorado
Inglés
Estudiantes
Investigadores
Público en general
Álvarez Carmona, M. A., (2019), Author profiling in social media with multimodal information, Tesis de Doctorado, Instituto Nacional de Astrofísica, Óptica y Electrónica.
LENGUAJES DE PROGRAMACIÓN
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Doctorado en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
AlvarezCaMA.pdf4.48 MBAdobe PDFVisualizar/Abrir