首先,我們需要(yao)了解(jie)搜索捕獲(huo)(huo)系(xi)統(tong)的工作(zuo)原理(li)。根據工作(zuo)原理(li),今天的編輯簡要(yao)介(jie)紹了如何建立一個符合搜索引擎捕獲(huo)(huo)系(xi)統(tong)習慣的網站。
蜘蛛(zhu)(zhu)抓取相當于遍歷網絡的(de)(de)(de)(de)有(you)向圖(tu),所以一個結(jie)構(gou)簡單清晰的(de)(de)(de)(de)網站(zhan)一定是它的(de)(de)(de)(de)核心,并盡量保證蜘蛛(zhu)(zhu)的(de)(de)(de)(de)可讀(du)性。
(1)樹形結(jie)構為“首頁頻道詳情頁”;
(2)最小化了從(cong)平面(mian)主頁到細節(jie)頁的層次,便于抓取,并能很好地傳遞權(quan)重。
(3)mesh保證每個頁(ye)面至少有一個文本鏈(lian)接(jie)點,使網站盡可能全面地被捕(bu)獲,內(nei)鏈(lian)的構建也能對排序起到(dao)積極的作用(yong)。
(4)導(dao)航為每個頁(ye)面添加一個導(dao)航,方便用(yong)戶了解路徑。
(5)相信很多站長(chang)對子域和目錄的選擇有疑問。我們認為(wei),當內(nei)容較少(shao),相關性強時,建議(yi)以目錄的形(xing)式實現(xian),有利(li)于(yu)權重(zhong)的繼承和收(shou)斂;當內(nei)部容量較大,與主(zhu)站相關性稍差(cha)時,建議(yi)以子域的形(xing)式實現(xian)。
(1)在一個很好的(de)網站中,相同的(de)內容(rong)頁(ye)只對應一個的(de)URL。太多(duo)的(de)url會(hui)分散頁(ye)面的(de)權重(zhong),目標(biao)url有可(ke)能(neng)被(bei)系統過(guo)濾掉;
(2)動態(tai)參數(shu)盡量少,URL盡量短。
(3)美學可以讓用戶(hu)和機器通過URL判斷頁面(mian)內(nei)容的主旨;
我(wo)們推薦以(yi)下(xia)幾種形式的(de)URL:URL應該盡可能簡(jian)短易讀,以(yi)便用(yong)戶能夠快(kuai)速理解,例(li)如使(shi)用(yong)拼音作為目錄名;相同的(de)內容(rong)在系統中只生成與之對應的(de)唯一(yi)URL,刪除無(wu)意義的(de)參數;如果無(wu)法保證URL的(de)唯一(yi)性(xing),請嘗(chang)試使(shi)不(bu)同形式的(de)url301到目標url;防止用(yong)戶錯(cuo)誤地將首選域301輸入(ru)到主域。
(1)不要忽略那些不幸的(de)機(ji)器人文件。默認情況下,系統中的(de)一些機(ji)器人被禁(jin)用的(de)搜索引擎捕獲(huo)。網站建立后,及時檢查(cha)并(bing)編寫相應的(de)機(ji)器人文件,在網站日常維護過程(cheng)中注意定期檢查(cha);
(2)建立(li)網站站點地(di)圖文件(jian)和死鏈文件(jian),并通過百度站長平臺及時提交;
(3)部分電子商(shang)(shang)務網(wang)站存在區域跳躍(yue)問題。建議制(zhi)作一個統一的(de)(de)頁(ye)面(mian)(mian)來標記頁(ye)面(mian)(mian)中是否有(you)(you)(you)貨物。如果(guo)此區域沒有(you)(you)(you)商(shang)(shang)品,將返(fan)回無效頁(ye)面(mian)(mian)。由于蜘蛛的(de)(de)出口有(you)(you)(you)限,正常(chang)頁(ye)面(mian)(mian)將不(bu)包括在內(nei)。
(4)合理利用網站(zhan)管理員平臺提(ti)供的機器人、網站(zhan)地圖、索引量、抓取壓力、死鏈提(ti)交、網站(zhan)改(gai)版等工(gong)具。對(dui)于百度最(zui)難的圖片優化,怎么辦?