出版社:Faculdade de Letras, Pontifícia Universidade Católica do Rio Grande do Sul
摘要:Neste artigo apresentamos a metodologia seguida para a construção de um sistema de pergunta-resposta sobre uma base de documentos em Português. Descrevemos o sistema que tem dois módulos distintos: análise prévia dos documentos (extracção de informação) e processamento das perguntas (recuperação de informação). O nosso sistema procura fazer um processamento, do corpus e da perguntas, suportado em teorias da linguística computacional: análise sintáctica (gramática de restrições), seguida da análise semântica usando a teoria da representação do discurso e finalmente a interpretação semântica/pragmática usando ontologia e inferência lógica. Apresentamos resultados da avaliação do seu desempenho que foi feita sobre dois conjuntos de documentos: textos de dois anos de jornais diários, o Público e a Folha de São Paulo (1994-1995); e um conjunto de documentos jurídicos: decisões do supremo Tribunal, tribunal da Relação e pareceres da Procuradoria Geral da República (cerca de 100.000 documentos).