Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/1722
Detección de lenguaje ofensivo en Twitter basada en expansión automática de lexicones | |
ESTEFANIA GUZMAN FALCON | |
Luis Villaseñor Pineda Manuel Montes y Gómez ANTONIO RICO SULAYES | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Lenguaje ofensivo Expansion de lexicones | |
Actualmente las redes sociales son el medio de comunicación más utilizado, en ellas las personas pueden interactuar con usuarios de diferentes lugares, compartir aspectos de su vida y expresar su opinión en diferentes temáticas. Los usuarios pueden manifestar libremente su criterio y ver los de otros, sin embargo, al ser un medio en el que todos tienen la total libertad de expresión, existen personas que aprovechan esto para promover o ejercer conductas como la discriminación, bullying, racismo, clasismo, sexismo y acoso. Este tipo de comportamientos son de gran preocupación debido a que suelen trascender las redes y perjudicar por completo la vida de la víctima. Plataformas como Facebook y Twitter han realizado campañas para incentivar la denuncia de esta clase de conflictos, sin embargo no todas las personas denuncian. Debido a que los usuarios no denuncian, se han desarrollado diversos métodos para detectar discriminación y agresión en mensajes de redes sociales. La mayoría de las soluciones suelen requerir datos etiquetados manualmente para que los métodos aprendan a identificar los mensajes ofensivos. Estos suelen tener muy buenos resultados, sin embargo, los datos son escasos debido a la dificultad en la tarea de etiquetado. Por otra parte, los métodos que no requieren datos etiquetados manualmente tienen la ventaja de no depender de una tarea de etiquetado, pero se enfrentan al lenguaje en redes sociales que es informal y está en constante cambio. Con base en lo anterior, los enfoques ya propuestos se encuentran limitados. Por lo tanto en el presente trabajo se propone el desarrollo de un método que utiliza un diccionario de insultos expandido para realizar un etiquetado automático y un enfoque basado en aprendizaje el cual se encarga de identificar mensajes ofensivos en función de lo aprendido con los datos etiquetados automáticamente. El enfoque propuesto está adaptado para el idioma inglés y español de México. Debido a que no existían datos para detectar lenguaje ofensivo en México, se desarrolló un conjunto de datos, el cual proporcionó un panorama amplio de la dificultad de la tarea de etiquetado. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica. | |
2018-12 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
Guzmán Falcón, E., (2018), Detección de lenguaje ofensivo en Twitter basada en expansión automática de lexicones, Tesis de Maestría, Instituto Nacional de Astrofísica, Óptica y Electrónica. | |
BANCOS DE DATOS | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
GuzmanFE.pdf | 1.2 MB | Adobe PDF | Visualizar/Abrir |