摘要:Pour les systèmes de TAL, traiter la résolution de la référence s’impose pour repérer les thèmes qui qualifient le contenu sémantique des documents. Dans cet article, nous proposons une manière d’acquérir des informations sémantiques pour résoudre les anaphores où l’expression référentielle est de la forme NdeN et l’expression anaphorique est un pronom relatif sujet. Afin de prendre en compte le contenu sémantique des noms des NdeN, nous spécifions une méthode automatisable de construction d’une liste de noms concrets du français à partir des définitions du TLFi dans sa version XML catégorisée. Ce sous-lexique permet ensuite d’étiqueter sémantiquement les corpus et de prédire le référent du pronom relatif sujet (35% des cas font intervenir un nom concret).
其他摘要:For NLP systems, a major issue consists in resolving reference in order to find the themes of documents. In this article, we present a way to find semantic informations to resolve anaphors which use a referential expression of the form NdeN and an anaphor realized by a subject relative pronoun. This method is based on the semantic content of nouns in NdeN groups and uses a list of concrete nouns in French which can be automatically extracted from the definitions of the TLFi dictionary in its XML-tagged version. Such a list is then used to annotate corpora in order to predict the selection of the good nominal referent which can be the second noun or the entire NP (35% of referential expressions contain a concrete noun).
关键词:sémantique lexicale; anaphore; NdeN; étiquetage sémantique; extraction de lexique