文章基本信息

标题：Abordagem de um problema médico por meio do processo de KDD com ênfase à análise exploratória dos dados
其他标题：Study of a medical problem using KDD, with emphasis on exploratory data analysis
本地全文：下载
作者：Steiner, Maria Teresinha Arns ; Soma, Nei Yoshihiro ; Shimizu, Tamio 等
期刊名称：Gestão & Produção
印刷版ISSN：0104-530X
电子版ISSN：1806-9649
出版年度：2006
卷号：13
期号：2
页码：325-337
DOI：10.1590/S0104-530X2006000200013
语种：Portuguese
出版社：Universidade Federal de São Carlos
摘要：
A "Descoberta de Conhecimento em Bases de Dados" (Knowledge Discovery in Databases, KDD) é um processo composto de várias etapas, iniciando com a coleta de dados para o problema em pauta e finalizando com a interpretação e avaliação dos resultados obtidos. O presente trabalho objetiva mostrar a influência da análise exploratória dos dados no desempenho das técnicas de Mineração de Dados (Data Mining) quanto à classificação de novos padrões por meio da sua aplicação a um problema médico, além de comparar o desempenho delas entre si, visando obter a técnica com o maior percentual de acertos. Pelos resultados obtidos, pode-se concluir que a referida análise, se conduzida de forma adequada, pode trazer importantes melhorias nos desempenhos de quase todas as técnicas abordadas, tornando-se, assim, uma importante ferramenta para a otimização dos resultados finais. Para o problema em estudo, a técnica que envolve um modelo de Programação Linear e uma outra que envolve Redes Neurais foram as técnicas que apresentaram os menores percentuais de erros para os conjuntos de testes, apresentando capacidades de generalização satisfatórias.
其他摘要：
Knowledge Discovery in Databases - KDD - is a process that consists of several steps, beginning with the collection of data for the problem under analysis and ending with the interpretation and evaluation of the final results. This paper discusses the influence of exploratory data analysis on the performance of Data Mining techniques with respect to the classification of new patterns, based on its application to a medical problem, and compares the performance of these techniques in order to identify the one with the highest percentage of successes. The results of this study lead to the conclusion that, providing this analysis is done properly, it can significantly improve the performance of these techniques and serve as an important tool to optimize the end results. For the problem under study, the techniques involving a Linear Programming model and Neural Networks were the ones showing the lowest percentages of errors for the test sets, presenting good generalization capacities.
关键词：mineração de dados;processo KDD;análise exploratória dos dados
其他关键词：data mining;KDD process;exploratory data analysis