對于(yu)SEO人員(yuan)(yuan)來(lai)說(shuo),百度官方的(de)工具往往是用(yong)(yong)來(lai)查看(kan)站點指標是否符合預期。其中,“抓(zhua)取診(zhen)(zhen)斷”是網(wang)絡管理(li)員(yuan)(yuan)經常使用(yong)(yong)的(de)工具。許(xu)多網(wang)站管理(li)員(yuan)(yuan)說(shuo),在網(wang)站上使用(yong)(yong)“抓(zhua)取診(zhen)(zhen)斷”時,經常會(hui)有(you)診(zhen)(zhen)斷失敗的(de)提(ti)示(shi),那么(me)問(wen)題是什么(me)呢?
Web爬行診(zhen)斷概述(shu)
百(bai)(bai)度(du)抓取診(zhen)斷工具,主要是(shi)從百(bai)(bai)度(du)蜘蛛的(de)(de)角度(du)來了解網站的(de)(de)內容,其結果(guo)反饋,代表著蜘蛛對(dui)網站內容的(de)(de)理解,通常對(dui)失敗的(de)(de)站點抓取診(zhen)斷,與(yu)百(bai)(bai)度(du)蜘蛛爬(pa)行有(you)直接關系(xi)。
網站“爬(pa)行診斷”失敗的(de)原因是什么?
1、禁止使用(yong)Robots.txt
如果你用機器人屏蔽百度爬行(xing)網站的Robots.txt目錄(lu),當你在(zai)那個目錄(lu)中(zhong)生成內容(rong)時(shi),百度很難對目錄(lu)下(xia)的內容(rong)進行(xing)抓取,而抓取診斷(duan)也會失敗報警。
2、網站(zhan)訪問速度(du)
很多(duo)站長說,在(zai)本地測試(shi)中,我的網(wang)站返(fan)回(hui)了HTTP狀態代碼200,但是爬行(xing)診斷已經顯示在(zai)爬行(xing)中,沒(mei)有反饋結果。
由于服(fu)務器線(xian)路的不(bu)同,百度蜘蛛抓(zhua)取(qu)速度可能會(hui)延遲太(tai)長,它(ta)會(hui)產(chan)生明(ming)顯的可訪問性,但會(hui)有抓(zhua)取(qu)診斷失敗(bai)。
當(dang)您(nin)遇到(dao)這個問(wen)題(ti)時,需要(yao)定期監(jian)控服務器的訪問(wen)速(su)度(du),優化網站的開放速(su)度(du)。
3、cdn緩存更(geng)新
我們知道cdn緩存更(geng)新需要時間(jian)(jian)。雖(sui)然您在(zai)管理平臺的(de)(de)后臺實(shi)時在(zai)線更(geng)新,但由于不同服務提供商的(de)(de)技術(shu)不對(dui)稱,往(wang)往(wang)會產生一定的(de)(de)時間(jian)(jian)延遲。
這將不可避免地(di)導致網(wang)站爬(pa)行失(shi)敗。
4、帶跳躍的(de)抓取診斷
如果你更(geng)新舊內容和(he)修改網(wang)站,并使(shi)用301或302進(jin)行跳轉,由于配置錯誤(wu),重定向次數(shu)太多,這也會導致百度爬行失敗。
5、DNS緩存服(fu)務
由于(yu)存(cun)在(zai)DNS緩(huan)存(cun),當您在(zai)本地查(cha)詢URL時,可以正常訪問(wen)它們,但除去(qu)上(shang)面提到的全部問(wen)題,爬行診(zhen)斷仍然(ran)失敗,因此您需要更新本地DNS緩(huan)存(cun),或使用(yong)代(dai)理IP,可以非常順利地訪問(wen)檢(jian)閱站點。
網(wang)站“爬(pa)行診斷”常見問題:
對于百(bai)度抓(zhua)取診斷工(gong)具,搜索(suo)引擎優化(hua)顧問被問到的問題最多:百(bai)度抓(zhua)取診斷幫助包(bao)括哪些?
從目前許(xu)多(duo)SEO工作人員的(de)反饋結果來(lai)看(kan),沒有(you)合(he)理(li)的(de)數據作為(wei)支持,這可(ke)以(yi)證明抓取診斷工具有(you)利(li)于百(bai)度收(shou)錄,但可(ke)能對百(bai)度快照更新有(you)一定的(de)影響。