Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/2470
Identificación de reacciones adversas a medicamentos en redes sociales basada en recuperación de información
José Alberto Fuentes
Manuel Montes y Gómez
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Clasification
Information retrieval
Data mining
Text analysis
Deep learning
El rápido crecimiento de las redes sociales se ha convertido en una fuente de información útil para diferentes tareas debido a que los usuarios publican información valiosa sobre varios aspectos de su vida, incluida la atención médica. Esta forma de intercambiar opiniones y experiencias ha proporcionado una rica fuente de información sobre los medicamentos y su eficacia y, lo que es más importante, sus posibles reacciones adversas. Las reacciones adversas a medicamentos (RA) son una causa importante de morbilidad en pacientes hospitalizados y una carga financiera para los sistemas de salud. Para abordar esta problemática, diferentes métodos se han desarrollado para la identificación de RA que van desde una simple clasificación de textos hasta la normalización de los tramos de texto que mencionen dicha RA a un diccionario médico por medio de técnicas de Aprendizaje Computacional y Aprendizaje Profundo. Estos últimos suelen tener buenos resultados, sin embargo, los conjuntos de datos existentes (específicamente de Twitter) cuentan con unos pocos miles de tweets etiquetados como positivos en comparación con los negativos. Además de esto, los problemas asociados a las redes sociales como la polisemia de las palabras, el lenguaje coloquial y los errores ortográficos dificultan el correcto entrenamiento de los sistemas. Con base en lo anterior, en el presente trabajo proponemos un método alternativo de dos etapas para la normalización de RA. Para la primera etapa utilizamos un modelo de Transformer pre-entrenado con el que abordaremos la clasificación como una clasificación de pares de oraciones al considerar oraciones auxiliares generadas a partir de los tweets de entrada como información contextual adicional y como segunda etapa utilizamos un sistema de recuperación de información con el que normalizaremos las menciones de RA a términos médicos con ayuda de un diccionario. Los diferentes experimentos realizados muestran un enfoque diferente al estado del arte mediante un sistema de recuperación, brindando un panorama distinto para construir herramientas que ayuden a expertos en la fármaco-vigilancia.
The rapid growth of social networks has made them to become a useful data source for different tasks as users post valuable information about various aspects of their lives, including medical care details. This way of exchanging opinions and experiences has provided a rich source of information about drugs and their efficacy and, more importantly, their possible adverse drug reactions. Adverse drug reactions (ADR) are a major cause of patient morbidity and a source of financial burden for healthcare systems. To address this problem, different methods have been developed for the identification of ADRs ranging from simple text classification to the normalization of the text sections mentioning such ADR to a medical dictionary by means of Machine Learning and Deep Learning techniques. The latter usually have good results, however, existing datasets specifically from Twitter have a few thousand tweets labeled as positive compared to negative ones, in addition to the problems associated with social networks such as polysemy of words, colloquial language and misspellings that hinder the correct training of the systems. Based on the above, in the present work, we propose an alternative two-stage method for the normalization of ADRs. For the first stage, we use a pre-trained Transformer model with which we will approach the classification as a sentence pair classification by considering auxiliary sentences generated from the input tweets as additional contextual information and, as a second stage, we use an information retrieval system with which we will normalize mentions of ADRs to medical terms, helped by a dictionary. The different experiments performed show a different approach to the state of the art through a retrieval system, providing a different approach to build tools to help experts in pharmacovigilance.
Instituto Nacional de Astrofísica, Óptica y Electrónica.
2023-03
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Fuentes Carbajal, J. A., (2023), Identificación de reacciones adversas a medicamentos en redes sociales basada en recuperación de información, Tesis de Maestría, Instituto Nacional de Astrofísica, Óptica y Electrónica.
OTRAS ESPECIALIDADES TECNOLÓGICAS
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
FUENTESCJA_MCC.pdf2.84 MBAdobe PDFVisualizar/Abrir