文章基本信息

标题：Identificação e classificação de entidades mencionadas em galego
本地全文：下载
作者：Marcos Garcia ; Iria Gayo ; Isaac González López 等
期刊名称：Ilköğretim Online/Elementary Education Online
印刷版ISSN：1305-3515
电子版ISSN：1305-3515
出版年度：2012
卷号：4
语种：Galician
出版社：Öğretmen Eğitimi Akademisi
摘要：A identificação e a classificação semântica automáticas de entidades mencionadas são tarefas de especial relevância para variadas aplicações do processamento da língua natural, tais como a tradução automática, a extracção de informação ou os sistemas de resposta a perguntas. O presente artigo descreve a adaptação e implementação de diversas ferramentas de código aberto para a identificação e classificação dos seguintes tipos de entidades em galego: (i) datas, (ii) numerais, (iii) quantidades e (iv) nomes próprios. A análise dos três primeiros tipos de entidades realiza-se com o software FreeLing através de máquinas de estados finitos. Para a identificação de nomes próprios comparam-se duas estratégias: (i) a utilização de máquinas de estados finitos e (ii) métodos de aprendizagem automática. Finalmente, a classificação semântica dos nomes próprios é realizada com um sistema baseado em regras e recursos obtidos automaticamente. O artigo mostra um conjunto de avaliações para cada um dos módulos apresentados, disponibilizados com licenças livres.
关键词：Processamento da língua natural;reconhecimento de entidades mencionadas;galego;Natural language processing;named entity recognition and classification;Galician