摘要:Atualmente, há diversas ferramentas computacionais voltadas para identificação e reconhecimento de palavras em arquivos digitais, onde um grande problema tem sido o tratamento de ruídos (falhas de aquisição e erros ortográficos). Estas inconveniências fazem com que os algoritmos de reconhecimento apresentem resultados abaixo do esperado. Este trabalho implementa uma solução para o reconhecimento de palavras com maior qualidade, aplicando algoritmos de remoção de ruído e melhora de contraste, bem como a adoção de um léxico aliado ao módulo de reconhecimento dos caracteres. Os resultados obtidos a partir dos testes de validação e correção das palavras com problemas com taxas de aproveitamento dentro dos limites esperados.
关键词:OCR. Léxicos. Histogramas de Projeção. Correção ortográfica.