首页    期刊浏览 2024年09月19日 星期四
登录注册

文章基本信息

  • 标题:Um método de sumarização automática de textos através de dados estatísticos e Processamento de Linguagem Natural
  • 本地全文:下载
  • 作者:Osvaldo de Souza ; Hamilton Rodrigues Tabosa ; Davi Martins de Oliveira
  • 期刊名称:Informação & Sociedade: Estudos
  • 印刷版ISSN:1809-4783
  • 出版年度:2017
  • 卷号:27
  • 期号:3
  • 页码:307
  • DOI:10.22478/ufpb.1809-4783.2017v27n3.32571
  • 出版社:Universidade Federal da Paraiba
  • 摘要:Este artigo discute a mediação da informação em relação à sumarização automática de textos, examina técnicas de processamento de linguagem natural (PLN), e analisa o uso de técnicas de processamento de texto baseadas em métodos estatísticos de ocorrência de palavras do português brasileiro. Contextualiza o termo sumarização à Ciência da Informação. Propõe e apresenta um método de produção automática de sumários de textos baseado em técnicas de PLN e métodos estatísticos de uso de palavras. Para cada uma dessas técnicas, analisa e exemplifica, e oportunamente, apresenta as equações que governam o uso de tais técnicas. Como resultados obtidos na pesquisa, destaca-se um inédito corpus anotado, composto por aproximadamente meio milhão de palavras do português brasileiro, além dos resultados médios obtidos com os testes empíricos da ferramenta de sumarização, que indicam uma redução da dimensionalidade, para textos com até 500 palavras, da ordem de 53%. A análise geral dos achados da pesquisa indica que os resultados são promissores quanto à capacidade de redução e a preservação do valor semântico dos textos.
  • 其他关键词:Automatic Text Summarization. Information Accessibility. Natural Language Processing. Information mediation. Accessibility
国家哲学社会科学文献中心版权所有