首页    期刊浏览 2024年10月05日 星期六
登录注册

文章基本信息

  • 标题:Manual de anotação como recurso de Processamento de Linguagem Natural
  • 本地全文:下载
  • 作者:Magali Duran ; Maria das Graças Volpe Nunes ; Lucelene Lopes
  • 期刊名称:Domínios de Lingu@gem
  • 电子版ISSN:1980-5799
  • 出版年度:2022
  • 卷号:16
  • 期号:4
  • 页码:1608-1643
  • DOI:10.14393/DL52-v16n4a2022-13
  • 语种:English
  • 出版社:Universidade Federal de Uberlândia
  • 摘要:Com o avanço da área de Processamento de Linguagem Natural (PLN), corpora são recursos que têm tido um lugar de destaque. Mais do que subsidiar estudos linguísticos, eles constituem as bases para o treinamento de modelos de Aprendizagem de Máquina e para o desenvolvimento de aplicações computacionais de ponta. Particularmente, há grande necessidade de corpora anotados, porém sua geração requer outro recurso essencial, o manual de anotação, que instancia o modelo de anotação de interesse para a língua em questão e delineia as decisões de anotação que devem ser adotadas. Neste artigo, exploramos questões relacionadas ao desenvolvimento de manuais para a anotação de corpus em português brasileiro segundo o modelo internacional Universal Dependencies, amplamente adotado na área. Partimos da discussão da evolução do PLN e o uso de corpora, passamos pelas questões, recursos e ferramentas fundamentais relacionados à representação sintática, discutimos o modelo Universal Dependencies e apresentamos as principais decisões tomadas na instanciação de suas diretrizes no português brasileiro. Por questões práticas e de didática, dividimos o manual em duas partes: o Manual de Anotação de PoS tags (anotação morfossintática) e o Manual de Anotação Relações de Dependência. Ambos foram resultado do processo relatado neste artigo e estão disponíveis para livre acesso no site do projeto POeTiSA na Web.
国家哲学社会科学文献中心版权所有