Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/1722
Detección de lenguaje ofensivo en Twitter basada en expansión automática de lexicones
ESTEFANIA GUZMAN FALCON
Luis Villaseñor Pineda
Manuel Montes y Gómez
ANTONIO RICO SULAYES
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Lenguaje ofensivo
Expansion de lexicones
Twitter
Actualmente las redes sociales son el medio de comunicación más utilizado, en ellas las personas pueden interactuar con usuarios de diferentes lugares, compartir aspectos de su vida y expresar su opinión en diferentes temáticas. Los usuarios pueden manifestar libremente su criterio y ver los de otros, sin embargo, al ser un medio en el que todos tienen la total libertad de expresión, existen personas que aprovechan esto para promover o ejercer conductas como la discriminación, bullying, racismo, clasismo, sexismo y acoso. Este tipo de comportamientos son de gran preocupación debido a que suelen trascender las redes y perjudicar por completo la vida de la víctima. Plataformas como Facebook y Twitter han realizado campañas para incentivar la denuncia de esta clase de conflictos, sin embargo no todas las personas denuncian. Debido a que los usuarios no denuncian, se han desarrollado diversos métodos para detectar discriminación y agresión en mensajes de redes sociales. La mayoría de las soluciones suelen requerir datos etiquetados manualmente para que los métodos aprendan a identificar los mensajes ofensivos. Estos suelen tener muy buenos resultados, sin embargo, los datos son escasos debido a la dificultad en la tarea de etiquetado. Por otra parte, los métodos que no requieren datos etiquetados manualmente tienen la ventaja de no depender de una tarea de etiquetado, pero se enfrentan al lenguaje en redes sociales que es informal y está en constante cambio. Con base en lo anterior, los enfoques ya propuestos se encuentran limitados. Por lo tanto en el presente trabajo se propone el desarrollo de un método que utiliza un diccionario de insultos expandido para realizar un etiquetado automático y un enfoque basado en aprendizaje el cual se encarga de identificar mensajes ofensivos en función de lo aprendido con los datos etiquetados automáticamente. El enfoque propuesto está adaptado para el idioma inglés y español de México. Debido a que no existían datos para detectar lenguaje ofensivo en México, se desarrolló un conjunto de datos, el cual proporcionó un panorama amplio de la dificultad de la tarea de etiquetado.
Instituto Nacional de Astrofísica, Óptica y Electrónica.
2018-12
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Guzmán Falcón, E., (2018), Detección de lenguaje ofensivo en Twitter basada en expansión automática de lexicones, Tesis de Maestría, Instituto Nacional de Astrofísica, Óptica y Electrónica.
BANCOS DE DATOS
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
GuzmanFE.pdf1.2 MBAdobe PDFVisualizar/Abrir