首页    期刊浏览 2024年11月30日 星期六
登录注册

文章基本信息

  • 标题:Le Corpus de référence du français contemporain (CRFC), un corpus massif du français largement diversifié par genres
  • 本地全文:下载
  • 作者:Dirk Siepmann ; Christoph Bürgel ; Sascha Diwersy
  • 期刊名称:SHS Web of Conferences
  • 印刷版ISSN:2416-5182
  • 电子版ISSN:2261-2424
  • 出版年度:2016
  • 卷号:27
  • 页码:1-13
  • DOI:10.1051/shsconf/20162711002
  • 语种:French
  • 出版社:EDP Sciences
  • 摘要:Cet article porte sur le Corpus de référence du français contemporain (ci-après abrégé en CRFC), un nouveau corpus qui, tout en présentant une taille considérable, vise, dans sa conception, à un équilibre en termes de genres textuels. La première version du corpus, qui sera enrichi au fur et à mesure de la disponibilité de nouveaux documents, compte 310 millions de mots du français tel qu'il se parle et s'écrit en France pour une période comprise entre 1945 et 2014, avec plus de 90 % de textes remontant aux deux dernières décennies. Ce corpus est destiné à représenter la langue française de telle manière qu'il réponde aux besoins des apprenants, des enseignants et des chercheurs en français contemporain.
  • 其他摘要:The Corpus de référence du français contemporain (CRFC) is a new purposebuilt genre-diverse corpus for investigating modern French. The 310-million-word corpus is the first collection of French to incorporate a substantial amount of spontaneous speech (approx. 30 m words) and ‘pseudo-spoken' data (approx. 125 m words); it is evenly divided between spoken/pseudo-spoken and written sources. The present article discusses major issues relating to the design of the corpus and the sources used in compiling it.
国家哲学社会科学文献中心版权所有