Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/843
Método probabilista para clasificación de polaridad: negación e intensificación en análisis de sentimientos
SAMARA GRETEL VILLALBA OSORNIO
LUIS VILLASEÑOR PINEDA
MANUEL MONTES Y GOMEZ
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Opinion Mining
Sentiment Analysis
Information Transfer
Negation Handling
Sentiment Analysis (SA) is an area that uses Natural Language processing and Machine Learning techniques to extract subjective information from texts. In SA area, several problems are still open, one of them is negation handling. Negation is a linguistic phenomenon presented in all human languages. In written documents, negation is presented as marks or negative particles. Negative particles invert the true value of a sentence. In traditional text classification, semantic information is lost and with that, the capacity to recognize some linguistic phenomena like negation and intensification is lost too. To correctly understand the meaning of a text it is necessary to identify and to treat these linguistic phenomena. The aim of this work is to consider the negation and intensification to improve polarity classification in opinion texts. A probabilistic approach that suggests some modifications to the Multinomial Naive Bayes (MNB) that allows the handling of negation and intensification in the texts improving their classification is proposed. The work proposes a method that is little dependent of language and kind of text. Experiments in English and Spanish texts and in some domains like movies, hotels, books, electronics, etc. were performed. The results were compared with the ones published in related works.
El Análisis de Sentimientos (AS) es un área que utiliza técnicas de procesamiento de lenguaje natural y de aprendizaje automático para extraer información subjetiva de los textos. En el AS aún quedan muchos problemas abiertos, uno de ellos es el tratamiento de la negación. La Negación es un fenómeno lingüístico presente en todos los idiomas humanos. En documentos, la negación está dada por la presencia de señales o partículas negativas. Las partículas negativas invierten el valor de verdad de una frase. Para lograr un correcto entendimiento del significado de un texto es necesario identificar y tratar estos fenómenos lingüísticos. La finalidad de este trabajo es considerar los fenómenos lingüísticos de negación e intensificación para mejorar la clasificación por polaridad en textos de opinión. Para ello se utilizará un enfoque de tipo probabilista, proponiendo algunas modificaciones al método de Naive Bayes Multinomial (NBM), las cuales permiten añadir información lingüística a los textos mejorando con ello su clasificación. El método propuesto es poco dependiente del lenguaje y la temática de los textos. Se realizaron experimentos en Español e Inglés y en varios dominios tales como cine, hoteles, libros, electrónicos, etc. Los resultados de los experimentos fueron comparados con métodos del estado del arte.
Instituto Nacional de Astrofísica, Óptica y Electrónica
13-09-2016
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Villalba-Osornio SG
SISTEMAS DE RECONOCIMIENTO DE CARACTERES
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
VillalbaOSG.pdf2.19 MBAdobe PDFVisualizar/Abrir