2015年5月25日,百度站長平臺發布公告,宣布全面放開對HTTPS站點的收錄,HTTPS站點不再需要做任何額外工作即可被百度抓收。采用了本文之前建議的HTTPS站點可以關閉HTTP版,或者將HTTP頁面跳轉到對應的HTTPS頁面。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
百(bai)度搜索(suo)(suo)引擎目(mu)前不主動抓取HTTPS網(wang)頁(ye)(ye),導致大部分HTTPS網(wang)頁(ye)(ye)無(wu)法收(shou)錄(lu)。但是如(ru)果網(wang)站一定要使用HTTPS加密(mi)協議的話(hua)該如(ru)何做(zuo)到對百(bai)度搜索(suo)(suo)引擎友好呢。其實很簡單:
1,為需(xu)要被百度搜索引擎收錄的(de)HTTPS頁面制作HTTP可訪問(wen)版。
2,通過user-agent判斷來訪者,將Baiduspider定向到HTTP頁面,普通用戶通過百度搜索引擎訪問該頁面時,通過301重定向至相應的HTTPS頁面。如圖所示,上圖為百度收錄的HTTP版本,下圖為用戶點擊后會自動跳入HTTPS版本。
3,HTTP版(ban)本不(bu)是(shi)只為首頁(ye)(ye)(ye)制(zhi)作(zuo),其它重要(yao)(yao)頁(ye)(ye)(ye)面也需要(yao)(yao)制(zhi)作(zuo)HTTP版(ban)本,且互相鏈(lian)接,切(qie)不(bu)要(yao)(yao)出現這種情(qing)(qing)況:首頁(ye)(ye)(ye)HTTP頁(ye)(ye)(ye)面上的鏈(lian)接依然鏈(lian)向HTTPS頁(ye)(ye)(ye)面,導致(zhi)Baiduspider無(wu)法繼續(xu)抓(zhua)取——我們曾經遇到(dao)這種情(qing)(qing)況,導致(zhi)整個(ge)網點我們只能收錄(lu)一個(ge)首頁(ye)(ye)(ye)。
如下面這個做法就(jiu)是錯誤的://www.abc.com/ 鏈(lian)向//www.adc.com/bbs/
4,可(ke)以(yi)將部分(fen)不需(xu)要加密(mi)的(de)內(nei)容(rong),如(ru)(ru)資(zi)訊(xun)等使用二(er)級(ji)域名承(cheng)載(zai)。比如(ru)(ru)支付寶站點,核(he)心加密(mi)內(nei)容(rong)放在HTTPS上,可(ke)以(yi)讓Baiduspider直接抓(zhua)取(qu)的(de)內(nei)容(rong)都放置在二(er)級(ji)域名上。