首页    期刊浏览 2025年07月18日 星期五
登录注册

文章基本信息

  • 标题:Investigating type-token regression and its potential for automated text discrimination = La investigación sobre la regresión de tipos y palabras y su capacidad para la clasificación automática de textos
  • 本地全文:下载
  • 作者:Pascual Cantos Gómez
  • 期刊名称:Cuadernos de Filología Inglesa
  • 印刷版ISSN:0213-5485
  • 出版年度:2000
  • 卷号:09
  • 期号:01
  • 页码:71-92
  • 出版社:Universidad de Murcia
  • 摘要:

    La motivación del presente artículo nace de la intuición de que la sola utilización de la densidad léxica de muestras textuales pertenecientes a diferentes idiomas, autores, dominios lingüísticos, etc., puede ser potencialmente válida para discriminar textos de forma automática. Con el fin de encontrar un índice de densidad léxica válido y fiable, hemos revisado y clarificado la relación matemática entre tipos (formas) y tokens (palabras), para construir modelos de regresión adecuados que nos permitan distinguir tipos de textos. Por añadidura, hemos hecho uso de modelos estadísticos multivariantes (análisis de conglomerados y análisis discriminante) con el fin de complementar y optimizar el modelo matemático de regresión para la densidad léxica (TYT)

国家哲学社会科学文献中心版权所有