首页    期刊浏览 2025年02月22日 星期六
登录注册

文章基本信息

  • 标题:Comparabilité de corpus et fouille terminologique multilingue
  • 本地全文:下载
  • 作者:Emmanuel Morin ; Béatrice Daille
  • 期刊名称:Traitement Automatique des Langues
  • 印刷版ISSN:1248-9433
  • 电子版ISSN:1965-0906
  • 出版年度:2006
  • 卷号:47
  • 期号:1
  • 出版社:ATALA - Assoc Traitement Automatique Langues
  • 摘要:Les principaux travaux en fouille textuelle privilégient communément la taille du corpus sur sa qualité. Ainsi dans le cadre de l’alignement lexical à partir de corpus comparables, les meilleurs résultats sont obtenus pour des corpus de grande taille (plusieurs millions de mots). Pour les domaines de spécialité, et pour de nombreuses paires de langues, il n’est pas possible de disposer de corpus textuels aussi volumineux. Dans le cadre de ce travail, nous soutenons l’hypothèse que la qualité des données textuelles peut non seulement suppléer à leur quantité mais garantit aussi celle des ressources lexicales extraites. En particulier, nous montrons l’intérêt de prendre en compte le type du discours lors de la constitution du corpus comparable pour obtenir des listes terminologiques de qualité.
国家哲学社会科学文献中心版权所有