首页    期刊浏览 2024年11月27日 星期三
登录注册

文章基本信息

  • 标题:Método de normalização de sintagmas nominais na indexação automática
  • 本地全文:下载
  • 作者:Renato Fernandes Corrêa ; Victor Galvão Celerino
  • 期刊名称:Em Questão
  • 印刷版ISSN:1808-5245
  • 出版年度:2019
  • 卷号:25
  • 期号:1
  • 页码:321-344
  • DOI:10.19132/1808-5245251.321-344
  • 出版社:Universidade Federal do Rio Grande do Sul
  • 摘要:Propõe e avalia um método de normalização de sintagmas nominais em termos canônicos, que visa contribuir para a melhora qualitativa da indexação automática, evitando a dispersão terminológica e preservando as palavras-chave dos autores, presentes no interior dos sintagmas nominais. A pesquisa é exploratória e empírica, pautada em pesquisa bibliográfica e realização de um experimento em um corpus de artigos científicos da área de Ciência da Informação. O método proposto é constituído por regras e critérios de normalização que obedecem às restrições de preservação da estrutura válida do sintagma nominal e das palavras-chave. O método proposto é avaliado através da presença de termos do Tesauro Brasileiro em Ciência da Informação (TBCI) nos sintagmas nominais resultantes da aplicação das regras e critérios. O método consiste em duas etapas: a primeira é composta por 85 regras para minimizar os sintagmas nominais extensos; a segunda etapa é composta por sete critérios responsáveis por eliminar dos sintagmas nominais elementos gramaticais desnecessários em sua estrutura. Os resultados da avaliação indicam que o método de normalização permite o alcance de resultados positivos, mesmo com dois critérios da segunda etapa não apresentando resultados para o corpus utilizado. Conclui-se que a aplicação do método de normalização em sistema de indexação automática é viável e traz bons resultados.
  • 其他摘要:This work proposes and evaluates a method of standardisation of noun phrases in canonical terms. This procedure aims to contribute to the qualitative improvement of automatic indexing avoiding the terminological dispersion and preserving the keywords present within the noun phrases. The research is exploratory and empirical, based on bibliographic research and an experiment in a corpus composed of scientific articles in Information Science. The proposed standardisation method contains rules and criteria that follow the constraints of preserving the valid structure of the noun phrase and the keywords. The method evaluation consists of the analysis of the presence of terms of the Brazilian Thesaurus in Information Science (TBCI) in the noun phrases resulting from the application of the proposed rules and criteria. The method consists of two stages: the first consists of 85 rules to reduce the size of the noun phrases, and the second stage contains seven criteria responsible for eliminating unnecessary grammatical elements from the noun phrases. The results of the evaluation indicate that the proposed method allows the achievement of positive results, even with two criteria of the second stage not presenting results for the corpus. It concludes that the application of the method in automatic indexing system is feasible and brings good results.
  • 关键词:Indexação automática;Sintagmas nominais;Normalização de sintagmas nominais;Palavras-chave;Tesauro.;Automatic indexing;Noun phrases;Standardisation of noun phrases;Keywords;Thesaurus.
国家哲学社会科学文献中心版权所有