Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/2591
Detection of signs of depression based on a multimiodal approach
Karla Maria Valencia-Segura
Luis Villaseñor-Pineda
Hugo Jair Escalante Balderas
Fernando Martínez Santiago
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Clinical Interviews
Depression
Detection
Multimodal
La depresión es un trastorno mental común que afecta a aproximadamente 800 millones de personas en todo el mundo, siendo solo una fracción las que reciben tratamiento adecuado. La detección de la depresión es un desafío debido a diversas razones como la disposición del paciente para buscar ayuda, la opinión de expertos y la diversidad de síntomas. Estudios han demostrado que las personas con depresión pueden presentar indicadores del trastorno a través de características verbales y no verbales. En los últimos años, se han desarrollado técnicas para detectar y diagnosticar la depresión, incluyendo cuestionarios y modelos de aprendizaje automático. La mayoría de los trabajos en aprendizaje automático para la detección de la depresión utilizan datos de redes sociales, los cuales pueden carecer de la fiabilidad y validez necesarias para una evaluación precisa de la depresión. La información compartida en línea podría ser incompleta, exagerada o engañosa, dificultando la confianza en los datos con fines diagnósticos. Además, la mayoría de los trabajos se centran en utilizar solo una modalidad para la detección de la depresión, ignorando los diferentes indicadores depresivos que pueden presentarse. Debido a esto, la integración de datos multimodales, que incluyen voz, texto y señales no verbales, puede mejorar la precisión y el alcance diagnóstico. Esta investigación se centra en detectar la depresión utilizando datos multimodales, incluyendo audio, video y texto de entrevistas clínicas basadas en el cuestionario PHQ-8. Proponemos una solución que aprovecha la evidencia psicológica para extraer ”puntos de interés”, utilizando información tanto verbal como no verbal. El enfoque busca capturar la naturaleza multifacética de la depresión, abordando la complejidad inherente del problema. Los hallazgos subrayan la importancia de priorizar puntos de interés basados en el soporte psicológico. Además, los resultados preliminares demuestran la viabilidad y novedad de su solución propuesta, aunque la efectividad de priorizar puntos de interés basados en el soporte psicológico y adoptar un enfoque simple para modelar entrevistas.
Depression is a common mental disorder affecting around 800 million people world-wide, with only a fraction receiving adequate treatment. Detection of depression is challenging due to different reasons like: patient’s disposition to seek help, expert opinion, and the diversity of symptoms. Studies have shown that people with depression can present indicators of the disorder through verbal and non-verbal features. In recent years, techniques have been developed to detect and diagnose depression, including questionnaires and machine learning models. Most of the works in machine learning for depression detection use data from social networks, this data may lack the reliability and validity required for accurate depression assessment. The information shared online might be incomplete, exaggerated, or misleading, making it difficult to trust the data for diagnostic purposes. Also, most of the works are focused on using only one modality for depression detection, ignoring the different depression indicators that can be presented. Due that, integrating multimodal data, including speech, text, and non-verbal cues, can enhance diagnostic accuracy and scope. This research focuses on detecting depression using multimodal data, including audio, video, and text from clinical interviews based on the PHQ-8 questionnaire. We propose a solution that leverages psychological evidence to extract ”interest points,” using both verbal and non-verbal information. The approach seeks to capture the multifaceted nature of depression, addressing the inherent complexity of the problem. The findings underscore the importance of prioritizing interest points based on psychological support. Also the preliminary results demonstrate the feasibility and novelty of their proposed solution, but the effectiveness of prioritizing interest points based on psychological support and adopting a simple approach to model interviews.
Instituto Nacional de Astrofísica, Óptica y Electrónica
19-02-2024
Reporte
Inglés
Estudiantes
Investigadores
Público en general
Valencia Segura, K. M., (2024), Detection of signs of depression based on a multimiodal approach, Reporte Técnico, Instituto Nacional de Astrofísica, Óptica y Electrónica
OTRAS ESPECIALIDADES TECNOLÓGICAS
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Reportes Técnicos de Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
VALENCIASKM_RT693.pdf895.22 kBAdobe PDFVisualizar/Abrir