首页    期刊浏览 2024年09月20日 星期五
登录注册

文章基本信息

  • 标题:Annoter la parole spontanée en arbres de constituants pour les besoins de l’analyse temporelle : résultats et comparaison français parlé / français écrit
  • 本地全文:下载
  • 作者:Ilaine Wang ; Jean-Yves Antoine ; Lotfi Abouda
  • 期刊名称:SHS Web of Conferences
  • 印刷版ISSN:2416-5182
  • 电子版ISSN:2261-2424
  • 出版年度:2020
  • 卷号:78
  • 页码:1-18
  • DOI:10.1051/shsconf/20207811004
  • 语种:French
  • 出版社:EDP Sciences
  • 摘要:Cet article présente les principaux résultats de la partie syntaxique du projet Temporal@ODIL, une initiative visant la construction d’un corpus de français parlé spontané annoté en temporalité. Nous présentons ici ODIL_Syntax, corpus arboré en constituants sur lequel s’appuie l’annotation temporelle et qui est diffusé librement sous licence Creative Commons. ODIL_Syntax a été créé à l’aide de Contemplata, une plateforme Web d’annotation développée spécifiquement dans le cadre du projet, diffusée elle aussi librement et qui présente l’intérêt de permettre une annotation semi-automatique utilisant un analyseur syntaxique.L’article décrit la procédure d’annotation avec cet outil, nos choix d’annotation ainsi que le corpus produit, en s’intéressant en particulier à une comparaison avec le corpus équivalent FTB (French Treebank) développé pour l’écrit.
  • 其他摘要:This paper presents the main results drawn from thesyntactic part of Temporal@ODIL, a project whose objective is theconstruction of a temporally annotated corpus of spontaneous speech forFrench. We describe ODIL_Syntax, a freely distributed constituencytreebank on which our temporal annotation is grounded. The syntacticannotation was performed on Contemplata, a Web-based annotationplatform developed specifically for our project, which is also freelydistributed and which integrates a syntactic parser, allowing a semiautomatic annotation. This paper gives a description of the annotationguidelines and the annotation procedure using Contemplata, as well as astatistical description of our corpus, compared with the French Treebank,the largest constituency-based resource for written French.
国家哲学社会科学文献中心版权所有