黄色av免费观看_少妇久久久_久久黄色_伊人久久国产_日韩午夜激情_一本一道久久a久久精品综合

您當前的位置主頁 > SEO優化 > 瀏覽文章

搜索引擎蜘蛛的抓取策略

來源:SEO優化 2012-07-12

快速提升網站銷量,使用365webcall網站在線客服系統

這篇文章主要講解搜索引擎的蜘蛛爬蟲的工作原理,包括它的四種抓取策略。

首先呢,搜索引擎的蜘蛛抓取網頁是有著一定的規律,不會去隨便抓取網頁,并且呢,蜘蛛是通過超連接來抓取網頁的,我們剛剛說了,搜索引擎有四種抓取網頁的策略,下邊我們一一講解。

深度優先

所謂深度優先,就是蜘蛛在一個頁面中發現第一個超鏈接,然后爬取這個頁面,當爬到第二個頁面后,在第二個頁面發現的第一個超鏈接,然后再順著往下爬,如下圖:

深度優先,導致蜘蛛抓取的網頁的質量,越來越低,并且在傳遞網站權重上,也有著根本的問題。

寬度優先

在深度優先上,搜索引擎有著根本的問題,那么在之后,搜索引擎又推出了蜘蛛抓取的第二個策略,也就是寬度優先,寬度優先指的是,蜘蛛會先把這個頁面所有的鏈接都爬一次,然后在順著這些鏈接往下爬,如下圖:

但是寬度優先也存在著問題,那就是蜘蛛抓取的效率和質量問題。

先寬后深 – 權重優先

現在搜索引擎是寬度和深度優先的結合,蜘蛛在抓取一個網頁的時候,會先把這個頁面所有的鏈接都抓取一次,然后再根據這些ULR的權重來判定,那個URL的權重高,那么就采用深度優先,那個URL權重低,就采用寬度優先或者不抓取。

重訪抓取策略

重訪抓取策略,是最后的一個,搜索引擎蜘蛛在抓取完這個網頁之后,然后根據這個頁面的權重、包括它的更新頻率、更新質量、外鏈的數量等等來判定,那么對于權重高的頁面,蜘蛛會在相隔較短的時間段在回來重新抓取,比如新浪網,權重很高,搜索引擎蜘蛛都是按照秒來重新抓取的。而對于一些權重較低的頁面,比如長期不更新的頁面,那么蜘蛛會隔好長時間在來抓取一次,比如我們常常搜索的百度大更新,蜘蛛就是對于一些網頁權重較低的頁面進行一次全部的抓取,一般情況,百度大更新,一個月一次。

本文來源 / 轉載留下版權

感謝 史占強 的投稿

文章編輯: 365webcall網上客服工具(www.365webcall.com)

我的評論

登錄賬號: 密碼: 快速注冊 | 找回密碼

主站蜘蛛池模板: 欧美精品日日鲁夜夜添 | 国产亚洲精品久久久久婷婷瑜伽 | 国产精品中文在线 | 亚洲骚图 | 亚洲成人精品国产 | 美女视频黄视大全视频免费网址 | 日韩一级免费毛片 | 欧美一级高潮片免费的 | 黄色大片免费网站 | 亚洲成人精品视频 | 久久国产免费视频 | 国产一区二区精品91 | 久久一区二区三区av | 国产乱淫a∨片免费视频 | 污版视频在线观看 | 李宗瑞国产福利视频一区 | 国产精品视频免费在线观看 | 羞羞视频免费入口网站 | 一区在线视频观看 | 免费一级毛片电影 | 亚洲一区二区网址 | 伊久在线| 欧美黄色大片免费观看 | 午夜视频免费播放 | 国产一区二区三区撒尿在线 | 国产精品二区高清在线 | 成人一级视频在线观看 | 日本在线免费观看 | 久久精品一区二区三区国产主播 | 91成人久久 | 久久久久久久久久久久久国产精品 | 欧美高清一级片 | 日日干天天摸 | 美女网站黄在线观看 | av在线直播观看 | tube7xxx| 日本一级毛片在线播放 | 国产成人精品一区在线播放 | 91精品国产综合久久久动漫日韩 | 性欧美视频在线观看 | 一边吃奶一边摸下娇喘 |