其他摘要:Este trabalho propõe a implementação de um sistema de classificação de websites como próprio ou impróprio, com base no seu conteúdo. Neste sistema os websites passam por um processo de preparação, no qual seu código fonte é padronizado e uniformizado, transformando as informações complexas presentes em cada website em informações mais simples. Isto permite uma redução no custo computacional da classificação e uma melhora no desempenho. Métodos estatísticos foram utilizados para selecionar as características mais relevantes de cada categoria. A partir desta seleção de características foram gerados vetores binários de entrada para o classificador. Como classificador empregou-se as Redes Neurais Artificiais MultiLayer Perceptron (MLP), cuja capacidade de generalização e adaptabilidade são características importantes para o problema em questão. Diferentes maneiras de preparação, métodos de seleção de características e configurações de rede foram experimentadas. Os resultados obtidos foram satisfatórios, com uma taxa de acerto superior a 95%.