标题:Minería de datos sobre streams de redes sociales, una herramienta al servicio de la Bibliotecología = Data Mining Streams of Social Networks, A Tool to Improve The Library Services
摘要:Los sistemas de soporte al trabajo colaborativo son herramientas valiosas en contextos en los cuales se requiere la participación de un grupo de personas para llevar a cabo una determinada tarea. Uno de estos contextos es la Bibliotecología, Archivística y Documentación. Las interacciones entre los usuarios y profesionales de esta área, mediante el uso de herramientas tales como Twitter, Facebook, fuentes RSS y blogs, generan grandes flujos de datos (streams) no estructurados. Estos streams pueden ser estudiados para analizar aspectos tales como influencia, relaciones de cercanía, opinión y generación de recomendaciones, logrando de esta forma que las bibliotecas obtengan otros beneficios del uso de las tecnologías de información y comunicación. Desde la perspectiva de la minería de datos, el procesamiento de estos streams plantea importantes desafíos. El uso de algoritmos de minería en este contexto, implica que en estos se deban considerar aspectos como la adaptación a la alta velocidad en que llegan los datos, la diversidad de las fuentes de datos y su estructura, la variabilidad de los datos en el tiempo y el trabajo sin restricciones de memoria. Este artículo revisa el estado del arte en lo referente a algoritmos de minería de datos sobre streams originados en redes sociales, específicamente, Facebook y Twitter. Se presenta una revisión de las técnicas más representativas de clasificación y agrupamiento, y de cómo cada una de ellas aporta al descubrimiento de conocimiento en el área de la Bibliotecología. Para concluir se presentan algunos de los problemas que son objeto de investigación activa = The Groupware systems are a valuable source for disseminating information in contexts in which the participation of a group of people is required to perform a task. One such context is the Library, Archives and Documentation. The interactions among users and professionals in this area, who use tools such as Twitter, Facebook, RSS feeds and blogs, generate a large amount of unstructured data streams. They can be used to the problem of mining topic-specific influence, graph mining, opinion mining and recommender systems, thus achieving that libraries can obtain maximum benefit from the use of Information and Communication Technologies. From the perspective of data stream mining, the processing of these streams poses significant challenges. The algorithms must be adapted to problems such as: high arrival rate, memory requirements without restrictions, diverse sources of data and concept-drift. In this work, we explore the current state-of-the-art solutions of data stream mining originating from social networks, specifically, Facebook and Twitter. We present a review of the most representative algorithms and how they contribute to knowledge discovery in the area of librarianship. We conclude by presenting some of the problems that are the subject of active research.