出版社:Faculdade de Letras, Pontifícia Universidade Católica do Rio Grande do Sul
摘要:O uso de pseudopalavras tem beneficiado estudos psicolinguísticos dedicados à aquisição e processamento da linguagem em seus diversos aspectos, incluindo o processamento da leitura e escrita. No entanto, em uma grande parte dos estudos que fazem uso de pseudopalavras, a combinação de fonemas em uma sequência geralmente é realizada com base na intuição dos pesquisadores, sem levar em conta as ocorrências estruturais mais frequentes na língua. Nesse sentido, o presente estudo visa contribuir para o desenvolvimento de procedimentos que possam auxiliar pesquisas que utilizam pseudopalavras em seus designs. Neste artigo, apresentamos uma ferramenta computacional desenvolvida com o objetivo específico de gerar pseudoverbos. O processo de criação da ferramenta envolveu a análise dos padrões estruturais dos 500 verbos mais frequentes do português do Brasil, empregando técnicas do PLN e mineração de dados para coletar e extrair padrões. O presente estudo contou com uma abordagem não supervisionada de aprendizado de máquina, uma vez que utilizou um algorítmo de agrupamento de dados (cluster) para extração dos padrões estruturais dos verbos.
关键词:Pseudopalavras;Pseudoverbos;Mineração de dados;Ferramenta computacional;Pseudo-words;Pseudo-verbs;Data mining;Computational tool