首页    期刊浏览 2024年09月19日 星期四
登录注册

文章基本信息

  • 标题:Un grand corpus oral « disponible » : le corpus d’Orléans 1968-2012
  • 本地全文:下载
  • 作者:Iris Eshkol-Taravella ; Olivier Baude ; Denis Maurel
  • 期刊名称:Traitement Automatique des Langues
  • 印刷版ISSN:1248-9433
  • 电子版ISSN:1965-0906
  • 出版年度:2011
  • 卷号:52
  • 期号:3
  • 出版社:ATALA - Assoc Traitement Automatique Langues
  • 摘要:Cet article présente la constitution et la mise à disposition du corpus oral ESLO. Notre objectif est de montrer qu’il ne s’agit pas seulement de recueillir et rendre disponible des données langagières mais aussi de rendre explicite l’ensemble de la chaîne de traitement qui permet d’élaborer un tel corpus. Après avoir présenté le projet et le corpus nous préciserons les problèmes juridiques et méthodologiques qui ont conditionné les opérations de traitement du corpus et notamment les procédures d’anonymisation indispensables à la libre diffusion de cette ressource. Dans une seconde partie, nous présenterons les différentes annotations effectuées sur les données brutes avec quelques exemples de leurs exploitations. Nous expliquerons la méthodologie suivie qui est toujours guidée par la nature des données et l’objectif final visé : constituer un grand corpus oral variationniste du français. Nous aborderons enfin les questions de mise à disposition du corpus en ligne.
国家哲学社会科学文献中心版权所有