摘要:En esta investigación, proponemos un modelo para la generación de resúmenes abstractivos de un solo documento, basado en la representación conceptual del texto. Aunque hay investigaciones que toman en cuenta la representación sintáctica o semántica parcial del texto, hasta ahora, una representación semántica completa de textos no se ha usado para la generación de resúmenes. Nuestro modelo usa una representación semántica completa del texto por medio de estructuras de grafos conceptuales. En este contexto, la tarea de la generación del resumen se reduce a resumir el conjunto de los grafos conceptuales correspondientes. Para realizar esto, se aplica un conjunto de operaciones sobre los grafos: generalización, unión o asociación, ponderación y poda. Además, se usan una jerarquía de conceptos (WordNet) y reglas heurísticas basadas en los patrones semánticos de VerbNet para apoyar a las operaciones. El conjunto resultante de grafos representa al resumen del texto a nivel conceptual. El método se evaluó con la colección de datos DUC 2003. Los resultados muestran que el método es efectivo para resumir textos cortos.
其他摘要:In this study, we propose a model for generating single-document abstractive summaries, based on the conceptual representation of the text. Although there are studies that take into account the partial syntactic or semantic representation of the text, so far, a complete semantic representation of texts has not been used for generating summaries. Our model uses a complete semantic representation of text by means of conceptual graph structures. In this context, the task of generating the summary is reduced to summarize the set of corresponding conceptual graphs. In order to do this, a set of operations on graphs is applied: generalization, join or association, ranking, and pruning. Furthermore, a hierarchy of concepts (WordNet) and heuristic rules based on the semantic patterns from VerbNet are used in order to support such operations. The resulting set of graphs depicts the text summary at the conceptual level. The method was evaluated on the DUC 2003 data collection. The results show that the method is effective for summarizing short texts.
关键词:Resúmenes abstractivos; grafos conceptuales ponderados; algoritmos de ponderación basada en grafos; algoritmo HITS.