摘要:El aumento de la información en la web y su empleo como fuente principal para la recuperación de información en Internet propicia que el uso de los sistemas de recuperación de información en la web (los motores de búsqueda), cobre mayor auge. Si bien estas herramientas realizan una labor encomiable, no resulta menos necesaria la tarea de evaluar su rendimiento y analizar la información que proporcionan. Nuestro estudio propone llevar a cabo un análisis de la similitud de los resultados ofrecidos por los principales motores de búsqueda. Para ello se ha construido un metabuscador que nos va a permitir realizar los experimentos de búsqueda y los cálculos de estos valores de una manera rápida e interactiva. Finalmente se intentará extraer un conjunto de conclusiones válidas de estos resultados, contrastándolas con datos obtenidos en otros trabajos y entre los mismos ofrecidos por nuestro experimento, que viene a demostrar el amplio grado de divergencia entre las respuestas de estos sistemas de recuperación de información, tratándose éste de un tema de relevante interés a la par que no definitivamente consensuado en su solución.
其他摘要:The huge increment of the available information on the web added to a progressive augment of its use as main source of data has caused that the utilization of information retrieval systems -IRS- in the web (also known as search engines), takes on a higher relevance. Even though these tools carry out an essential work, no less necessary is the task of evaluating them and studying the data that they provide us. This research proposes to analyze the main search engines of the market through a direct comparison of the URLs returned from a heterogeneous set of queries to intend to find out the current degree of similarity of the responses. For this purpose we have developed a metasearch engine which will let us make our search experiment and calculate the distances in a quick and interactive way. Finally, we will try to get valid conclusions of the results contrasting them with data from other researches and from our own experiment, what will demonstrate the high degree of divergence in the responses of the IRS.
关键词:Web search engines; information retrieval evaluation; information retrieval systems;Buscadores web; evaluación de la recuperación de información; sistemas de recuperación de información