首页    期刊浏览 2025年05月03日 星期六
登录注册

文章基本信息

  • 标题:SCAP-TT: Tagging and lemmatising Spanish tourism discourse, and beyond
  • 本地全文:下载
  • 作者:Patrick Goethals ; Els Lefever ; Lieve Macken
  • 期刊名称:Ibérica
  • 印刷版ISSN:1139-7241
  • 出版年度:2017
  • 期号:33
  • 页码:279-288
  • 语种:English
  • 出版社:Asociación Europea de Lenguas para Fines Específicos
  • 摘要:En esta nota de investigación describimos los primeros resultados de SCAP, el Spanish Corpus Annotation Project, aplicado al discurso turístico. Presentaremos y evaluaremos una nueva versión para el español del etiquetador TreeTagger (SCAPTT), diseñado específicamente para el etiquetado y la lematización de textos turísticos promocionales en español. Si bien SCAP-TT ha sido diseñado para el discurso especializado del turismo, mostraremos también resultados muy prometedores para la anotación de otros tipos de discursos, como ensayos y textos literarios.
  • 其他摘要:In this research note we report on the first results of SCAP, the Spanish Corpus Annotation Project, applied to tourism discourse. In particular, we present and assess a new TreeTagger parameter set for Spanish (SCAP-TT), which has been trained for the Part-of-Speech tagging (POS-tagging) and lemmatisation of Spanish promotional tourism texts. Although SCAP-TT has been trained for specialized tourism discourse, we also show promising results for the annotation of other text genres such as essays and literary texts.
  • 关键词:Etiquetado gramatical; lematización; español; TreeTagger; discurso turístico; SCAP-tur.
  • 其他关键词:POS-tagging; lemmatisation; Spanish; TreeTagger; tourism discourse; SCAP.
国家哲学社会科学文献中心版权所有