Por favor, use este identificador para citar o enlazar este ítem:
http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/843
Método probabilista para clasificación de polaridad: negación e intensificación en análisis de sentimientos | |
SAMARA GRETEL VILLALBA OSORNIO | |
LUIS VILLASEÑOR PINEDA MANUEL MONTES Y GOMEZ | |
Acceso Abierto | |
Atribución-NoComercial-SinDerivadas | |
Opinion Mining Sentiment Analysis Information Transfer Negation Handling | |
Sentiment Analysis (SA) is an area that uses Natural Language processing and
Machine Learning techniques to extract subjective information from texts. In SA
area, several problems are still open, one of them is negation handling. Negation is
a linguistic phenomenon presented in all human languages. In written documents,
negation is presented as marks or negative particles. Negative particles invert the
true value of a sentence. In traditional text classification, semantic information is lost
and with that, the capacity to recognize some linguistic phenomena like negation and
intensification is lost too. To correctly understand the meaning of a text it is necessary
to identify and to treat these linguistic phenomena. The aim of this work is to consider
the negation and intensification to improve polarity classification in opinion texts. A
probabilistic approach that suggests some modifications to the Multinomial Naive
Bayes (MNB) that allows the handling of negation and intensification in the texts
improving their classification is proposed. The work proposes a method that is little
dependent of language and kind of text. Experiments in English and Spanish texts
and in some domains like movies, hotels, books, electronics, etc. were performed. The
results were compared with the ones published in related works.
El Análisis de Sentimientos (AS) es un área que utiliza técnicas de procesamiento de lenguaje natural y de aprendizaje automático para extraer información subjetiva de los textos. En el AS aún quedan muchos problemas abiertos, uno de ellos es el tratamiento de la negación. La Negación es un fenómeno lingüístico presente en todos los idiomas humanos. En documentos, la negación está dada por la presencia de señales o partículas negativas. Las partículas negativas invierten el valor de verdad de una frase. Para lograr un correcto entendimiento del significado de un texto es necesario identificar y tratar estos fenómenos lingüísticos. La finalidad de este trabajo es considerar los fenómenos lingüísticos de negación e intensificación para mejorar la clasificación por polaridad en textos de opinión. Para ello se utilizará un enfoque de tipo probabilista, proponiendo algunas modificaciones al método de Naive Bayes Multinomial (NBM), las cuales permiten añadir información lingüística a los textos mejorando con ello su clasificación. El método propuesto es poco dependiente del lenguaje y la temática de los textos. Se realizaron experimentos en Español e Inglés y en varios dominios tales como cine, hoteles, libros, electrónicos, etc. Los resultados de los experimentos fueron comparados con métodos del estado del arte. | |
Instituto Nacional de Astrofísica, Óptica y Electrónica | |
13-09-2016 | |
Tesis de maestría | |
Español | |
Estudiantes Investigadores Público en general | |
Villalba-Osornio SG | |
SISTEMAS DE RECONOCIMIENTO DE CARACTERES | |
Versión aceptada | |
acceptedVersion - Versión aceptada | |
Aparece en las colecciones: | Maestría en Ciencias Computacionales |
Cargar archivos:
Fichero | Tamaño | Formato | |
---|---|---|---|
VillalbaOSG.pdf | 2.19 MB | Adobe PDF | Visualizar/Abrir |