Por favor, use este identificador para citar o enlazar este ítem: http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/2339
Análisis de la Legibilidad y Comprensibilidad en Documentos Académicos
José Medardo Tapia Téllez
AURELIO LOPEZ LOPEZ
Acceso Abierto
Atribución-NoComercial-SinDerivadas
Procesamiento de Lenguaje Natural
Comprensibilidad
Legibilidad
Minería de Textos
Textos Académicos
Aprendizaje Automático
This research is a computational linguistic analysis of academic texts through its Comprehensibility and Legibility. In our work we refer to Comprehensibility as the ease or difficulty to understand a text, and we understand Legibility as the ease of reading of a text for a reader with a specific academic level. We utilize three Comprehensibility measures: Comprehensibility Burden (which refers to the correct sequentiality between concepts), Connectivity (that focuses in the connection between concepts), and Dispersion (which describes the density of information for the reader). Methologically, for Comprehensibility, from a collection of selected academic documents, we obtain these three measures and, with them, we generate evaluation parameters as well as a evaluation process which consists in visual feedback for the partial report of the metrics in a thesis draft. For Legibility, we build classifiers through the use of machine learning which are capable to distinguish between a couple of texts, which one of them is more or less legible than the other. Based on these classifiers, evaluators are built, which are instances capable of creating top and bottom limits on the academic level of a working thesis document. Our contributions then are: a procedure to evaluate the Comprehensibility based on three measures validated through a collection of texts, a process of preliminary evaluation of thesis drafts based on visual feedback, classifiers based on academic documents of different leves, and evaluators that limit the top and bottom level of an academic thesis draft. Finally, and as future work, we want to evaluate our visual feedback process, modify the construction of classifiers and now base it on a LSTMR, and the generation of an API capable of evaluating a thesis draft through our contributions.
Esta investigación es un análisis lingüístico-computacional de textos académicos a través de su Comprensibilidad y Legibilidad. En nuestro trabajo nos referimos a Comprensibilidad como la facilidad o dificultad para entender un texto, y la Legibilidad la entendemos como la facilidad de lectura de un texto para un lector con un determinado nivel educativo. Utilizamos tres medidas de Comprensibilidad: Carga de Comprensibilidad (que refiere a la correcta secuenciación entre los conceptos), Conectividad (que se enfoca en la conexión entre conceptos) y Dispersión (que describe la densidad de información para el lector por párrafo). Metodológicamente, para Comprensibilidad, de una colección de documentos académicos seleccionados, se obtienen estas tres medidas y con ellas se generan parámetros de valoración, así como un proceso de evaluación que consiste en retroalimentación visual para el reporte parcial de las métricas en un documento nuevo (borrador). Para Legibilidad, se construyen clasificadores a través de aprendizaje de máquina los cuales son capaces de distinguir entres dos textos, cuál de ellos es más o menos legible y es con estos clasificadores se crean evaluadores que son capaces de acotar superior e inferiormente el nivel académico de un nuevo documento (borrador). Nuestras aportaciones son entonces: un procedimiento para evaluar la Comprensibilidad basado en tres medidas validadas a través de una colección de textos, un proceso de evaluación preliminar de Comprensibilidad de borradores de tesis a través de retroalimentación visual, clasificadores/comparadores basados en documentos académicos de diferentes niveles y evaluadores capaces de acotar el nivel académico de un texto. Finalmente y como trabajo a futuro, buscamos la evaluación del proceso de retroalimentación visual, la construcción de clasificadores basados en una LSTMR y la generación de una API capaz de evaluar un documento de tesis en proceso a través de nuestras aportaciones.
Instituto Nacional de Astrofísica, Óptica y Electrónica.
2022-02
Tesis de maestría
Español
Estudiantes
Investigadores
Público en general
Tapia Téllez, José Medardo, (2022), Análisis de la Legibilidad y Comprensibilidad en Documentos Académicos, Tesis de Maestría, Instituto Nacional de Astrofísica, Óptica y Electrónica.
LENGUAJES DE PROGRAMACIÓN
Versión aceptada
acceptedVersion - Versión aceptada
Aparece en las colecciones: Maestría en Ciencias Computacionales

Cargar archivos:


Fichero Tamaño Formato  
TapiaTJM.pdf3.46 MBAdobe PDFVisualizar/Abrir