首页    期刊浏览 2024年11月30日 星期六
登录注册

文章基本信息

  • 标题:Seleção de sintagmas nominais na indexação automática
  • 本地全文:下载
  • 作者:Gustavo Diniz do Nascimento ; Renato Fernandes Correa
  • 期刊名称:Revista Brasileira de Cineantropometria e Desempenho Humano
  • 印刷版ISSN:1415-8426
  • 电子版ISSN:1980-0037
  • 出版年度:2019
  • 卷号:24
  • 期号:55
  • 页码:1-19
  • DOI:10.5007/1518-2924.2019.e57927
  • 出版社:Univ Federal De Santa Catarina
  • 摘要:O uso dos sintagmas nominais como instrumentos de organização da informação vem se mostrando uma alternativa promissora às palavras isoladas na construção dos sistemas de recuperação de informação. Nesse contexto, a indexação automática por sintagmas nominais minimiza alguns problemas encontrados na indexação baseada em palavras isoladas, como, por exemplo, a sinonímia e a polissemia. No entanto, é notório que nem todos os sintagmas nominais que se encontram em um documento são representativos do conteúdo desse documento, o que demonstra a necessidade de se selecionar os sintagmas nominais mais relevantes. Assim, o objetivo deste estudo consiste em sintetizar e classificar critérios de seleção de sintagmas nominais utilizados em metodologias de indexação automática por sintagmas nominais para textos escritos em língua portuguesa. A metodologia da pesquisa tem natureza exploratória, de cunho bibliográfico, e tem como método procedimental a análise de conteúdo. As metodologias de seleção de sintagmas nominais baseiam-se em critérios como: frequência absoluta de ocorrência, frequência normalizada de ocorrência, frequência inversa nos documentos, não ocorrência em lista de sintagmas nominais pouco significativos, na estrutura gramatical e no nível dos sintagmas nominais. Quanto ao escopo dos critérios, predominam em número os baseados em características do sintagma nominal (estrutura gramatical, nível, conteúdo lexical) e quanto a adoção predominam os baseados no conteúdo do documento e no conteúdo do corpus. A principal contribuição deste estudo consiste do panorama dos critérios de seleção de sintagmas nominais relevantes para textos em português..
  • 其他摘要:Objective: this study aims to synthetize and classify the noun phrases selection criteria present in methods for automatic indexing by noun phrases of texts written in Portuguese. Methods: The research methodology has an exploratory nature and bibliographic character, and has the content analysis as procedural method. The bases of the noun phrases selection methodologies are criteria as absolute frequency of occurrence, normalized frequency of occurrence, inverse document frequency, non-occurrence in list of stopwords, and the grammatical structure and level of noun phrases. Conclusions: As for the criteria scope, predominates in quantity those based on the noun phrases characteristics (grammatical structure, level, lexical content), in adoption predominates those based on the document content and the corpus content. Results: The main contribution of this work is the panoramic overview of the noun phrases selection criteria for texts written in the Portuguese idiom.
  • 关键词:Indexação automática;Sintagmas nominais;Seleção de sintagmas nominais;Língua portuguesa;Recuperação da informação
  • 其他关键词:Automatic indexing;Noun phrases;Noun phrase selection;Portuguese language;Information retrieval
国家哲学社会科学文献中心版权所有