首页    期刊浏览 2024年12月05日 星期四
登录注册

文章基本信息

  • 标题:PARADOCS : l’entremetteur de documents parallèles indépendant de la langue
  • 本地全文:下载
  • 作者:Alexandre Patry ; Philippe Langlais
  • 期刊名称:Traitement Automatique des Langues
  • 印刷版ISSN:1248-9433
  • 电子版ISSN:1965-0906
  • 出版年度:2010
  • 卷号:51
  • 期号:2
  • 出版社:ATALA - Assoc Traitement Automatique Langues
  • 摘要:Les corpus parallèles sont la pierre angulaire de plusieurs technologies de traduction automatique et des efforts conséquents sont régulièrement portés afin d’en réunir de nouveaux. L’expérience montre que la stratégie visant à réduire l’intervention manuelle dans cet exercice n’est jamais la même d’un corpus à l’autre. Ce constat nous a amené à développer PARADOCS, un entremetteur de documents parallèles qui utilise les entités numériques des documents afin de les apparier. Un classificateur est entraîné à décider des documents parallèles et un moteur de recherche d’information est utilisé afin de réduire l’espace de recherche des paires de documents parallèles. Nous montrons l’efficacité de PARADOCS sur de nombreuses tâches avec de nombreuses paires de langues.
国家哲学社会科学文献中心版权所有