首页    期刊浏览 2024年11月27日 星期三
登录注册

文章基本信息

  • 标题:Nuevos retos de la tecnología web crawler para la recuperación de información
  • 本地全文:下载
  • 作者:Manuel Blázquez Ochando
  • 期刊名称:Métodos de Información
  • 印刷版ISSN:1134-2838
  • 电子版ISSN:2173-1241
  • 出版年度:2014
  • 卷号:4
  • 期号:7
  • 页码:115-128
  • DOI:10.5557/IIMEI4-N7-115128
  • 出版社:Col·legi Oficial de Bibliotecaris i Documentalistes de la Comunitat Valenciana
  • 摘要:El web crawler constituye una parte importante de la cadena documental en la recuperación de información, dado que genera el corpus documental necesario sobre el que aplicar los distintos algoritmos de recuperación. Dada su relevancia, se analiza el papel que desempeñan, sus distintos enfoques, aportaciones significativas y estado de la técnica. Algunas de las conclusiones obtenidas, apuntan a la introducción del reconocimiento del marcado semántico en la web, al desarrollo de un web crawler más polivalente, capaz de interactuar con la web social y realizar campañas de comunicación.
  • 关键词:web crawler; recuperación de información; marcado semántico; Apache Nutch; Heritrix; WIRE; SocSciBot; Mbot
国家哲学社会科学文献中心版权所有