文章基本信息

标题：Avaliação do desempenho de um software de sumarização automática de textos
本地全文：下载
作者：Hamilton Rodrigues Tabosa ; Osvaldo de Souza ; José Carlos dos Santos Cândido 等
期刊名称：Informação & Informação
印刷版ISSN：1981-8920
出版年度：2020
卷号：25
期号：1
页码：189-210
DOI：10.5433/1981-8920.2020v25n1p189
出版社：Universidade Estadual de Londrina
摘要：Desde 2014 desenvolvemos uma pesquisa com o intuito de produzir um software (protótipo) que seria capaz de elaborar resumos automáticos de textos baseado em técnicas de Processamento de Linguagem Natural e estatísticas de frequência de palavras. Os primeiros testes empíricos da ferramenta geraram resultados que indicaram uma significativa redução da dimensionalidade dos textos, com considerável preservação do seu valor semântico. Neste artigo, apresentamos os resultados da continuidade do nosso trabalho investigative, a partir de uma avaliação humana da qualidade desses resumos a partir da realização de testes cegos. Um grupo de três bibliotecárias recebeu um bloco misto e não identificado de resumos - produzidos por humanos e os resumos automáticos feitos pelo software - e procedeu a uma avaliação, segundo os critérios de corretude gramatical, preservação das ideias centrais, coerência e legibilidade, extensão do resumo, se houve paráfrase ou cópia de fragmentos e, se houve introdução de ideias não contidas no texto original. Os resultados mostraram que em quatro, dos cinco critérios de avaliação adotados, houve equivalência qualitativa entre os resumos produzidos por humanos e os produzidos pelo software, o que parece representar um relativo sucesso, uma vez que o prototipo poderia substituir uma pessoa na atividade de resumir textos sem deixar a desejar, a não ser no quinto creitério de avaliação, referente à dimensão do resumo, em que o texto produzido pelo software foi apontado como extenso além do necessário.
关键词：Sumarização automática de textos; Acesso à informação; Processamento da linguagem natural; Mediação (Prática);