摘要:Os currículos da Plataforma Lattes são uma vasta fonte de informação para a criação e análise de redes sociais de pesquisadores. Contudo, devido à quantidade de dados, ao preenchimento manual e ao uso de dados semiestruturados existem diversos desafios para a utilização desta fonte de dados. Este artigo apresenta um banco de dados produzido a partir da mineração de mais de um milhão de Currículos Lattes, destacando algumas características descritivas e relações entre os currículos e entre as grandes áreas de conhecimento, direções e desafios para a produção e análise de redes sociais a partir destes dados.
其他摘要:Curricula from the Lattes Platform are a vast source of information for the creation and analysis of researchers' social networks. However, due to the large amount of data, the manual filling-in, and the use of semi-structured data, there are several challenges in the use of Lattes as a source of data. This paper presents a database produced from the mining of more than one million Brazilian Lattes curricula. Moreover, it highlights some descriptive characteristics and relationships among these curricula and among the knowledge areas, directions and challenges to the production and analyzes of social networks generated from these data.
关键词:plataforma Lattes;rede social;rede de coautoria;mineração de dados