期刊名称:The ESPecialist. Pesquisa em Línguas para Fins Específicos. Descrição, Ensino e Aprendizagem. ISSN 2318-7115
印刷版ISSN:2318-7115
出版年度:2003
卷号:24
期号:1
出版社:PUCSP
摘要:Este artigo trata da elaboração de um corpus de textos de Biologia organizado como um todo mas composto por diferentes sub-disciplinas. A compilação do corpus foi realizada levando-se em consideração os créditos atribuídos às diferentes sub-áreas nos estudos de Biologia na Universidade e também o impacto científico e social dos assuntos. Nosso corpus possui 2.500.00 palavras, sendo que uma porcentagem de 84% do total de textos é devotada a periódicos científicos e 16% a livros. Da mesma forma, 70% dos textos compilados são provenientes de fontes norte-americanas e 30% de fontes britânicas. Inicialmente, focalizamos os aspectos lexicais do corpus. Em primeiro lugar, demonstramos a utilidade do nosso corpus especializado em comparação com um corpus de inglês geral. Após compilar os textos, extraímos as 150 palavras mais freqüentes de cada arquivo. Conforme era esperado, as freqüências mais altas são aquelas correspondentes a formas gramaticais. Uma seleção dos termos técnicos e sub-técnicos presentes nesses arquivos revelou que a densidade lexical mais alta é encontrada nos livros. Da mesma forma, provamos que a organização que propusemos serve aos nossos propósitos, no que se refere aos termos lexicais.
其他摘要:This paper deals with the elaboration of a corpus of Biology texts designed as a whole but integrated by different sub-disciplines. The compilation of the corpus was carried out taking into account the credits that the different sub-areas are given in the University studies of Biology and also the scientific and social impact of the subjects. We have gathered a corpus of 2,500,000 words with a percentage of 84% of the total texts devoted to scientific journals and 16% to books. In the same way 70% of the texts compiled were from American sources and 30% from British ones. Initially we focused on the lexical aspects of the corpus. Firstly, we have shown the utility of our specialised Corpus as compared with a general English one. After compiling the texts we extracted the 150 most frequent words of each file. As expected, the highest frequencies are those corresponding to grammar forms. A selection of the technical and sub-technical terms in these files revealed that the highest lexical density is found in books. In the same way, we have proved that the design we have proposed serves its purposes, as far as the lexical terms are concerned.