Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/2692
A Multidimensional Analysis of Text for Automated Detection of Computational Propaganda in Twitter
Marco Casavantes
Manuel Montes y Gómez
Alberto Barrón-Cedeño
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Propaganda detection
Contextual features
Text classification
BERT´s auxiliary input
Propaganda corpus
Social media
The way we consume news has been transformed, with technological advancements allowing people to easily express their views to vast audiences, including political opinions. These opinions can enhance a richer public dialogue; however, they also possess the potential to elevate extreme ideas that seek to manipulate or skew political narratives for personal benefit or agendas. Social media is frequently praised for its ability to boost political involvement, to the extent that its role in the spread of misinformation has even sparked worries about its impact on democracy. The importance of propaganda spread via social media can be linked to its influence in political matters, representing a domain where political factions compete for influence and control. In the past few years, there has been a noticeable surge in the volume of research studies focused on the detection of propaganda across various domains, reflecting a growing recognition of the significance and impact of propaganda in contemporary society. In this research study, we aim to contribute to the ongoing expansion of academic research surrounding the phenomenon of propaganda distributed through social networks, while also acknowledging the importance of various contextual factors that significantly influence the expression of propaganda in these environments. To facilitate this goal, we introduce a novel corpus specifically centered on propaganda posted and spread on Twitter, which has been collected from a diverse array of news media accounts. By leveraging this unique dataset, we are putting forth a classification approach that incorporates a multitude of contextual attributes, thereby enabling a more effective detection of propaganda, particularly in comparison to a baseline strategy that focuses solely on the textual content of the messages without considering a broader context. We have carried out an evaluation of the performance of our proposed approach across multiple data collections to assess its capabilities. From our evaluations, we report that our approach consistently outperforms the baseline classifier, demonstrating its superior effectiveness in detecting propaganda.
La forma en que consumimos noticias se ha transformado gracias a los avances tecnológicos que permiten a las personas expresar fácilmente sus opiniones a un público amplio, incluyendo sus opiniones políticas. Estas opiniones pueden enriquecer el diálogo público; sin embargo, también tienen el potencial de impulsar ideas extremas que buscan manipular o distorsionar las narrativas políticas para beneficio propio. Las redes sociales son frecuentemente elogiadas por su capacidad para impulsar la participación política, hasta el punto de que su papel en la difusión de desinformación ha suscitado incluso preocupación por su impacto en la democracia. La importancia de la propaganda difundida a través de las redes sociales puede vincularse a su influencia en asuntos políticos, representando un ámbito donde las facciones políticas compiten por influencia y el control. En los últimos años, se ha observado un notable aumento en el volumen de estudios de investigación centrados en la detección de propaganda en diversos ámbitos, lo que refleja un creciente reconocimiento de la importancia y el impacto de la propaganda en la sociedad contemporánea. En este estudio de investigación, buscamos contribuir a la continua expansión de la investigación académica en torno al fenómeno de la propaganda distribuida a través de las redes sociales, reconociendo al mismo tiempo la importancia de diversos factores contextuales que influyen significativamente en la expresión de la propaganda en estos entornos. Para facilitar este objetivo, presentamos un novedoso corpus centrado específicamente en la propaganda publicada y difundida en Twitter, recopilado a partir de diversas cuentas de medios de comunicación. Al aprovechar este conjunto de datos único, proponemos un enfoque de clasificación que incorpora una multitud de atributos contextuales, lo que permite una detección más eficaz de la propaganda, especialmente en comparación con una estrategia de línea base que se centra únicamente en el contenido textual de los mensajes sin considerar un contexto más amplio. Hemos llevado a cabo una evaluación del rendimiento de nuestro enfoque propuesto en múltiples conjuntos de datos para evaluar sus capacidades.
Instituto Nacional de Astrofísica, Óptica y Electrónica
2025-03
Tesis de doctorado
Inglés
Estudiantes
Investigadores
Público en general
Casavantes Moreno, M.E., (2025), A Multidimensional Analysis of Text for Automated Detection of Computational Propaganda in Twitter, Tesis de Doctorado, Instituto Nacional de Astrofísica, Óptica y Electrónica
OTRAS ESPECIALIDADES TECNOLÓGICAS
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Doctorado en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
CASAVANTESMME_DCC.pdf2.5 MBAdobe PDFVisualizar/Abrir