首页    期刊浏览 2024年11月26日 星期二
登录注册

文章基本信息

  • 标题:Exploração de corpora para extração e descrição de léxico de especialidade
  • 本地全文:下载
  • 作者:Chiara Barbero ; Raquel Amaro
  • 期刊名称:Linha D'Água
  • 印刷版ISSN:0103-3638
  • 电子版ISSN:2236-4242
  • 出版年度:2020
  • 卷号:33
  • 期号:1
  • 页码:69-104
  • DOI:10.11606/issn.2236-4242.v33i1p69-104
  • 出版社:Universidade de São Paulo
  • 摘要:Resumo A exploração de corpora para a extração de léxico de especialidade é um método consensual e comum na construção de recursos lexicais. No entanto, as metodologias empregadas não são explicitamente discutidas, dificultando a comparação e a determinação de abordagens robustas. Para preencher essa lacuna, neste artigo apresentamos e discutimos uma metodologia detalhada para extração de léxico de especialidade a partir de corpora, conjugando abordagens linguísticas e estatísticas. O método proposto prevê tanto o uso de corpora de especialidade como de corpora monitores e inclui: i) análise de dados de frequência; ii) extração de concordâncias e colocações; iii) extração de informação de ordem textual, permitindo a extração de unidades lexicais atómicas e multipalavra e de relações semânticas relevantes. Desse modo, o objetivo da metodologia é a determinação de listas de potenciais unidades lexicais de especialidade e de informações relevantes para a sua descrição que permitam uma validação final rápida e eficiente, maximizando o valor informacional da interação com os especialistas.
  • 关键词:extração de léxico de especialidade; metodologia; corpora; concordâncias; colocações
国家哲学社会科学文献中心版权所有