摘要:Gracias al uso de medios informáticos, en la actualidad, existen diversas líneas de investigación dentro de la denominada Lingüística de Corpus que abordan la descripción de textos auténticos a partir de un conjunto de rasgos lingüísticos. La crítica que se ha realizado a estos estudios es que solo describen aspectos lingüísticos a nivel de la palabra que difícilmente logran tener un impacto en la descripción de los corpus a nivel textual. En este estudio, se revisan críticamente las distintas matrices de rasgos y las metodologías que se han aplicado tanto para el inglés como para el español con el objetivo de proponer una matriz que atienda a algunas de las críticas a los estudios anteriores. La propuesta total, en concreto, se basa en los siguientes componentes: los modos de organización del discurso (MOD), las secuencias o lexical bundles, el modelo de indexación de eventos y la teoría de la valoración. Además, se incluirá un componente asociado a categorías gramaticales y, por último, un componente derivado de un proyecto anterior (las dimensiones establecidas en el proyecto Fondecyt 1020786). Una parte de la matriz, basada en estos componentes, se aplica de modo exploratorio a un pequeño conjunto de textos de características diversas con el objetivo de comprobar su potencial descriptivo
其他摘要:Thanks to the use of computational means, there are different lines of research nowadays in the field of the so called corpus linguistics, which describe authentic texts from linguistic features. The criticism that has been made to such studies is founded on the fact that they only reach the word level with scarce impact on the textual level. In this work, we critically revised different feature matrices and methodologies that have been used for studying Spanish and English, in order to propose a matrix that can deal with part of the criticism made to previous researches. Concretely, the proposal is based on the following components: the organization modes of discourse, the sequences or lexical bundles, the Model of Event indexing and the Appraisal Theory. In addition, a component associated with grammatical categories, a component of syntactic units, and a component of statistics measures will be included. Finally we will also consider a component derived from a previous project (the dimensions established in the project Fondecyt 1020786). In order to verify its descriptive potential, the matrix, based on these components, is applied in an exploratory way to a small set of texts
关键词:Registros diversificados; matriz de rasgos; estudios multidimensionales;Diversified registers; feature matrix; multidimensional studies