期刊名称:iSys - Revista Brasileira de Sistemas de Informação
印刷版ISSN:1984-2902
出版年度:2018
卷号:11
期号:2
语种:Portuguese
出版社:iSys - Revista Brasileira de Sistemas de Informação
摘要:Esse artigo consiste no estudo e desenvolvimento de um classificador de texto para a categorização automática de descrições de itens de produto em seus códigos da Nomenclatura Comum do Mercosul (NCM). O desenvolvimento desse classificador foi realizado utilizando aprendizado supervisionado em combinação com o algoritmo Naïve Bayes. Para treinamento do classificador foram utilizados dados de itens de notas fiscais ao consumidor pertencentes aos capítulos 22 e 90 do NCM. Os resultados evidenciaram, com o auxílio da abordagem de validação cruzada com 10-folds, a capacidade do modelo em classificar corretamente as instâncias. Para o conjunto de dados mais simples e considerado fácil, obteve-se uma acurácia de 98%, enquanto para os conjuntos médio e difícil, as acurácias obtidas foram de 90% e 83%, respectivamente.
关键词:Aprendizado supervisionado;Classificação de Texto;Algoritmo Naïve Bayes