出版社:UNAM, Instituto de Investigaciones Bibliotecológicas y de la Información
摘要:Resumen: Las técnicas de aprendizaje de máquina continúan siendo muy utilizadas para la minería de texto. Para este artículo se realizó una revisión de literatura en periódicos científicos publicados en los años de 2010 y 2011, con el objetivo de identificar las principales formas de aprendizaje de máquina empleadas para la minería de texto. Se utilizó estadística descriptiva para organizar, resumir y analizar los datos encontrados, y se presentó una descripción resumida de las principales encontradas. En los artículos analizados se hallaron 13 aplicadas para la minería de texto, el 83% de los artículos mencionaban de 1 a 3 técnicas de aprendizaje de máquina, las principales usadas por los autores en los artículos estudiados fueron support vector machine (SVM), k-means (K-M), k-nearest neighbors (K-NN), naive bayes (NB), self-organizing maps (SOM). Los pares que aparecen con mayor frecuencia son SVM/NB, SVM/K-NN, SVM/decission tree.
其他摘要:Abstract: The machine learning techniques are still extensively used for text mining. In this paper, there was a literature review of scientific journals published in the years 2010 and 2011, with the aim of identifying the main machine learning techniques utilized for text mining. It was possible to use descriptive and statistical techniques to organize, summarize and analyze the found data, and also, there is a shortened description of the main techniques found. Thirteen learning techniques applied to text mining appeared in the articles analyzed and 83% of the papers mentioned from 1 to 3 machine learning techniques. The main techniques used by the authors in the papers studied were support vector machine (SVM), k-means (K-M), k-nearest neighbors (K-NN), naive bayes (NB), self-organizing maps (SOM). Pairs of techniques that appear most frequently are SVM/NB, SVM/K-NN, SVM/Decision Tree and NB/K-NN.
关键词:Aprendizaje de máquina;Minería de texto;Técnicas de aprendizaje de máquina