摘要:RESUMO Um sistema de recuperação de informação é um elemento mediador entre um estoque de informação e seus usuários. Sua eficácia depende do controle adequado da linguagem de representação dos itens de informações e das buscas de seus usuários. Este trabalho apresenta um modelo de recuperação de informação baseada em ontologia que usa a estrutura formal do modelo espaço vetorial. O vetor que representam um documento é criado durante o processo de indexação automático no qual uma ontologia fornece novos termos para enriquecer semanticamente essa representação. O vetor de busca é criado a partir de um processo de expansão de consulta, na qual novos termos são adicionados na expressão de busca inicialmente formulada pelo usuário a partir de inferências na ontologia. Usando o modelo proposto, foi desenvolvido um sistema denominado OntoSmart, cujos resultados preliminares apontam em uma melhoria significativa na precisão dos resultados de busca.
其他摘要:ABSTRACT Information retrieval system is a mediator element between a stock of information and its users. Its effectiveness depends on representation language of information items and requests of its users. This work presents an ontology-based information retrieval model which uses the formal structure of Vector Space Model. The vector that represent a document is created during the automatic indexing process, in which an ontology provide new terms in order to semantically enrich that representation. The search vector is created from a query expansion process, in which new terms are added in the search expression initially formulated by the user from inferences in the ontology. Using the proposed model, the OntoSmart system is being developed. Preliminary results show a significant improvement in the precision of search results.
关键词:Recuperação de Informação baseada em Ontologia;Modelo Espaço Vetorial;Indexação Automática;Expansão de consulta
其他关键词:Ontology-based Information Retrieval;Vector Space Model;Automatic Indexing;Query Expansion