摘要:El siguiente artículo presenta el diseño e implementación de un módulo de análisis semántico, enfocado en la predicción de la coherencia textual, programado en Python 3. Las etapas de implementación comprenden el trabajo realizado en el diseño de una herramienta para la recopilación automática del corpus (noticias sobre política), de otra destinada a preparar los textos reunidos para su procesamiento posterior, hasta llegar al diseño de la herramienta final que realiza el análisis de los textos. El método empleado para esto es el Análisis Semántico Latente. El artículo concluye con la presentación de los resultados de las pruebas realizadas, con el fin de testear la herramienta mediante el procesamiento de textos, para observar su sensibilidad en la evaluación de la coherencia textual.
其他摘要:The following article presents the steps to build a semantic analysis module focused on the prediction of textual coherence, programmed in Python 3. The steps described include the work done in the design of a tool for automatic recopilation of the corpus (politic news), another destined to prepare the texts collected for further processing, up to the final design tool that performs the analysis of the texts. The method used for this is the Latent Semantic Analysis. Finally, the article presents the results of tests performed in order to test the tool, through texts processing, with the goal of watching sensitivity in the evaluation of textual coherence.
关键词:Procesamiento de Lenguaje Natural; coherencia; Análisis Semántico Latente; noticias políticas.
其他关键词:Natural Language Processing; coherence; Latent Semantic Analysis; politic news.