首页    期刊浏览 2025年04月30日 星期三
登录注册

文章基本信息

  • 标题:Uma utilidade para o reconhecimento de topónimos em documentos medievais
  • 本地全文:下载
  • 作者:Xavier Canosa ; Pablo Gamallo ; Xavier Varela
  • 期刊名称:Linguamática
  • 电子版ISSN:1647-0818
  • 出版年度:2019
  • 卷号:11
  • 期号:1
  • 页码:3-15
  • DOI:10.21814/lm.11.1.291
  • 出版社:Universidade do Minho & Universidade de Vigo
  • 摘要:Este artigo apresenta o método de construção duma ferramenta para a anotação de entidades geográficas mencionadas em textos medievais. A nova ferramenta foi desenvolvida a partir dos módulos de língua contemporânea do LinguaKit, pacote multilingue de ferramentas de PLN. Uma coleção de corpora anotados manualmente serviu de recurso para elaborar uma lista de topónimos medievais (gazetteers) e observar padrões para a melhora e implementação de novas regras de reconhecimento dos nomes de lugar. Depois da lista de entidades geográficas, os ativadores contextuais (triggers) foram o recurso determinante na melhora da abrangência. Para o produto final, fizeram-se também ajustes menores na procura de recolher os elementos mais comuns do léxico e os contextos gramaticais das entidades geográficas mencionadas. Ainda que muito trabalho fica por fazer na elaboração de listas para entidades não geográficas, na construção dum modelo de língua medieval e um lexicon específico, o novo módulo pode ser utilizado para anotar textos e mostra uma melhora significativa a respeito dos módulos previamente existentes.
  • 关键词:entidades geográficas;deteção de topónimos;reconhecimento de entidades mencionadas
国家哲学社会科学文献中心版权所有