摘要:Cet article porte sur le Corpus de référence du français contemporain (ci-après abrégé en CRFC), un nouveau corpus qui, tout en présentant une taille considérable, vise, dans sa conception, à un équilibre en termes de genres textuels. La première version du corpus, qui sera enrichi au fur et à mesure de la disponibilité de nouveaux documents, compte 310 millions de mots du français tel qu'il se parle et s'écrit en France pour une période comprise entre 1945 et 2014, avec plus de 90 % de textes remontant aux deux dernières décennies. Ce corpus est destiné à représenter la langue française de telle manière qu'il réponde aux besoins des apprenants, des enseignants et des chercheurs en français contemporain.
其他摘要:The Corpus de référence du français contemporain (CRFC) is a new purposebuilt genre-diverse corpus for investigating modern French. The 310-million-word corpus is the first collection of French to incorporate a substantial amount of spontaneous speech (approx. 30 m words) and ‘pseudo-spoken' data (approx. 125 m words); it is evenly divided between spoken/pseudo-spoken and written sources. The present article discusses major issues relating to the design of the corpus and the sources used in compiling it.