Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/2541
Detección de Alzheimer mediante Análisis Estilístico y de Contenido del Habla | |
Carlos Antonio Olachea Hernández | |
Luis Villaseñor Pineda Manuel Montes y Gómez | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Dementia Alzheimer's Detection Text Classification | |
Currently, due to population aging, there has been an increase in Alzheimer’s cases, with the most affected countries being those with aging populations. In Mexico, the prevalence of this disease in older adults is 7. 3 %, and it is expected that the number will increase with time. Alzheimer is a difficult disease to detect, which often means that it is not detected until it is at an advanced stage; this makes pharmacological treatments ineffective. In addition, affected people require multiple care, especially in the later stages where they may have limited mobility and independency. Although memory loss is its most well-known symptom, language problems can occur from the early stages; these manifest as interruptions in speech known as disfluencies. This has motivated the search for ways to diagnose Alzheimer by analyzing audios using computational models. In previous work, this task was attempted to be solved by extracting features from the audio. However, in recent years, it has been observed that using linguistic features from audio transcripts offers good results, outperforming models that only use acoustic features. While the optimal features for solving the task are still unknown, in recent literatura Transformer-based models have dominated the task. However, these models depend on the subject, which means that without major changes in semantic speech in a person, the model struggles. In addition, relevant features such as the distribution of pause and disfluency features have been omitted. Consequently, a method is proposed to address the problem from two different perspectives, combining semantic features based on word embeddings, denoted as “content” features, with another lexical-semantic and paralinguistic group called “style” features. The method with the combined features achieves an accuracy of 0.87, outperforming both the baseline at 0.83 and the state of the art at 0.85. The results and subsequent feature analysis confirm that approaching the task through two different modalities results in a better overall classification performance. Additionally, it was detected that using style features allows for better initial detection of Alzheimer’s cases. En la actualidad, por efectos del envejecimiento poblacional, se ha observado un incremento en los casos de Alzheimer, siendo los principales afectados países con poblaciones envejecidas. En México, esta enfermedad tiene una prevalencia del 7.8 % en adultos mayores, y se espera que el número se incremente con el tiempo. El Alzheimer es una enfermedad difícil de detectar, dado que a menudo esta detección sucede en etapas avanzadas de la enfermedad, lo cual vuelve los tratamientos farmacológicos inefectivos. Además, los afectados requieren de múltiples cuidados; especialmente en las últimas etapas, donde pueden verse limitados en su movilidad e independencia. Si bien el síntoma más conocido es la pérdida de memoria, pueden presentarse problemas del lenguaje desde etapas tempranas de dicha enfermedad; que se manifiestan en forma de interrupciones de lenguajes conocidas como disfluencias. Esto ha motivado, buscar formas de diagnosticar la enfermedad a través del análisis de audios, mediante modelos computacionales. En trabajos previos, la tarea se intentó resolver utilizando características extraídas del audio. Sin embargo, en años recientes, se ha observado que utilizar características lingüísticas de transcripciones de los audios, ofrece buenos resultados superando a modelos que solo utilizan características acústicas. Si bien, todavía se desconoce cuáles son las características óptimas para resolver la tarea, en trabajos recientes, modelos basados en Transformers han dominado la tarea. Sin embargo, estos modelos son dependientes del tema, esto significa que si no hay cambios importantes en la parte semántica de habla de una persona, el modelo presenta problemas; además, se han omitido características relevantes como la dispersión de características como pausas y disfluencias. Por consiguiente, se propone un método para abordar el problema desde dos perspectivas distintas, combinando características semánticas basadas en word embeddings, también llamadas de “contenido”, con otro grupo que es léxico-semántico y paralingüístico denominado de “estilo”. El método con las características combinadas alcanza una exactitud de 0.87, lo cual supera al baseline (0.83) y al estado del arte (0.85). Los resultados y el posterior análisis de características confirman que aproximar la tarea mediante dos modalidades distintas, se traduce en un mejor desempeño en la clasificación en general. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
2023-08 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
Olachea Hernández, C. A., (2023), Detección de Alzheimer mediante Análisis Estilístico y de Contenido del Habla, Tesis de Maestría, Instituto Nacional de Astrofísica, Óptica y Electrónica | |
OTRAS ESPECIALIDADES TECNOLÓGICAS | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
OLACHEAHCA_MCC.pdf | 1.24 MB | Adobe PDF | Visualizar/Abrir |