文章基本信息

标题：Investigating type-token regression and its potential for automated text discrimination = La investigación sobre la regresión de tipos y palabras y su capacidad para la clasificación automática de textos
本地全文：下载
作者：Pascual Cantos Gómez
期刊名称：Cuadernos de Filología Inglesa
印刷版ISSN：0213-5485
出版年度：2000
卷号：09
期号：01
页码：71-92
出版社：Universidad de Murcia
摘要：
La motivación del presente artículo nace de la intuición de que la sola utilización de la densidad léxica de muestras textuales pertenecientes a diferentes idiomas, autores, dominios lingüísticos, etc., puede ser potencialmente válida para discriminar textos de forma automática. Con el fin de encontrar un índice de densidad léxica válido y fiable, hemos revisado y clarificado la relación matemática entre tipos (formas) y tokens (palabras), para construir modelos de regresión adecuados que nos permitan distinguir tipos de textos. Por añadidura, hemos hecho uso de modelos estadísticos multivariantes (análisis de conglomerados y análisis discriminante) con el fin de complementar y optimizar el modelo matemático de regresión para la densidad léxica (TYT)