首页    期刊浏览 2024年09月13日 星期五
登录注册

文章基本信息

  • 标题:Un corpus arboré pour le français : le French Treebank
  • 本地全文:下载
  • 作者:Anne Abeillé ; Lionel Clément ; Loïc Liégeois
  • 期刊名称:Traitement Automatique des Langues
  • 印刷版ISSN:1248-9433
  • 电子版ISSN:1965-0906
  • 出版年度:2019
  • 卷号:60
  • 期号:2
  • 页码:1-25
  • 语种:French
  • 出版社:ATALA - Assoc Traitement Automatique Langues
  • 摘要:Nous présentons un bilan du Corpus arboré du français, ou French Treebank (FTB) (1996-2016), qui est une ressource lexicale et syntaxique unique en son genre, richement anno- tée (et validée manuellement) pour les linguistes, et pour le TAL, avec environ 300 utilisateurs dans le monde. Après avoir exposé les principes de construction, et les principaux choix d’anno- tation, nous présentons l’état final du corpus, ses différents formats, et une première évaluation. Nous présentons aussi quelques ressources dérivées et des exemples d’interrogation.
  • 其他摘要:We present a review of the French Treebank (FTB) (1996-2016), a lexical and syn- tactic resource with rich annotation and manual validation, which is usable by linguists and for NLP and has about 300 users in the world. We summarize the building principles and the main annotation choices, and describe the final version, the different formats and a first evaluation. We also present some derived resources and some query examples.
国家哲学社会科学文献中心版权所有