总结搜索引擎蜘蛛采集内容的过程

转载 VIP资源库 

     当一个未加载任何数据的空蜘蛛顺着互联网上的URL来到某个网站时,一般会按照如下流程进行工作。
     1.检查网页是不是有过更新。这个过程中蜘蛛会把网页的内容和服务器上的快照内容进行对比,如果不同,就抓取新的网页内容,将其带到搜索引擎的数据库,并更新原来的网页快照。
     2.如果是新网页,蜘蛛不但要抓取该网页的内容,还要将网页的URL带到搜索引擎的数据库。
     3.经过数据处理,将蜘蛛带回的数据建立新的网页索引,并按照与关键词的相关度排序。

历史上的今天:

下载说明:
1.资源失效补发和寻课请联系QQ:1312343067
2.购买本站资源即代表同意本站免责协议
3.提示:本站所收是分享服务费用,非资源的费用,购买后恕不退款。
4.特别声明本站资源部分来源于网络,如有侵权,请联系站长进行删除处理!为尊重作者版权,请购买原版作品,支持你喜欢的老师,谢谢!
本文地址:http://www.qdsem.com/1366/

发表评论

您必须 登录 才能发表留言!