首页    期刊浏览 2024年10月04日 星期五
登录注册

文章基本信息

  • 标题:Automatic Anonymisation of a new Portuguese-English Parallel Corpus in the Legal-Financial Domain
  • 本地全文:下载
  • 作者:Eckhard Bick ; Anabela Barreiro
  • 期刊名称:Oslo Studies in Language
  • 印刷版ISSN:1890-9639
  • 出版年度:2015
  • 卷号:7
  • 期号:1
  • 语种:English
  • 出版社:University of Oslo
  • 摘要:Este artigo apresenta o processo de anonimização automática de entidades mencionadas num novo corpo paralelo pesquisável do domínio jurídico-financeiro para o par de línguas português-inglês. O corpo resulta de memórias de tradução utilizadas em tradução profissional. Contém cerca de 40.000 pares de frases alinhadas, ou seja, frases que são traduções umas das outras. A anotação das entidades mencionadas foi feita com regras especiais da Gramática de Restrições otimizadas para o domínio jurídico-financeiro, que permitiram alcançar uma abrangência balanceada em termos de precisão de quase 90% para as entidades mencionadas candidatas (pessoa, organização, endereço e identificadores pessoais) e uma abrangência consideravelmente superior com modificações heurísticas e otimizadas para a produção. O corpo destina-se a estudos de tradução e à linguística computacional (tradução automática estatística) e será publicamente pesquisável, permitindo ao seu utilizador procurar uma palavra ou expressão e devolvendo os resultados da pesquisa em contexto na língua da busca e na sua tradução.
国家哲学社会科学文献中心版权所有