對(dui)于每(mei)一(yi)(yi)個站(zhan)長而言,最關鍵的某過于搜索(suo)引(yin)(yin)擎能夠(gou)正常(chang)收錄,一(yi)(yi)旦網(wang)站(zhan)不(bu)能正常(chang)收錄一(yi)(yi)切都是(shi)癡心妄想。為什(shen)么會出現收錄困難(nan)?這(zhe)是(shi)因為搜索(suo)引(yin)(yin)擎機(ji)器人是(shi)一(yi)(yi)個很(hen)簡單的軟件程序,它本身對(dui)站(zhan)點(dian)并(bing)沒有任何的理解(jie)能力(li),只是(shi)通(tong)過一(yi)(yi)些固有的標準來(lai)評判(pan)站(zhan)點(dian)的好(hao)壞,一(yi)(yi)旦站(zhan)點(dian)在寫(xie)法上出現了錯誤(wu),搜索(suo)引(yin)(yin)擎將無法對(dui)站(zhan)點(dian)進(jin)行采集。
5 個常見的導致收錄困難的原因
原因一(yi):站(zhan)點的(de)robots.txt文件(jian)已損壞或者在(zai)書寫的(de)時(shi)候(hou)出(chu)現(xian)錯誤(例(li)如出(chu)現(xian)錯別字(zi))
如果(guo)搜索引擎機(ji)器人錯誤的(de)理解了您(nin)(nin)的(de)robots.txt文(wen)件(jian),它(ta)們可能(neng)會完全無視你的(de)網頁。對(dui)于這(zhe)個問題,解決(jue)的(de)辦(ban)法是仔細檢(jian)查(cha)您(nin)(nin)的(de)robots.txt文(wen)件(jian),并確保(bao)您(nin)(nin)網頁上的(de)的(de)參數是正確的(de)。
原因二:網址(zhi)(zhi)中包含太多(duo)的變(bian)數網址(zhi)(zhi)
網(wang)(wang)址中包含太多的(de)變(bian)數可能(neng)(neng)(neng)(neng)會造成搜索(suo)引(yin)擎機器(qi)人搜索(suo)困難。如果您(nin)的(de)URL 包含變(bian)數太多,搜索(suo)引(yin)擎漫(man)游(you)器(qi)可能(neng)(neng)(neng)(neng)會忽視您(nin)的(de)網(wang)(wang)頁(ye)。對(dui)于這個(ge)問題一些(xie)比較(jiao)熟(shu)悉網(wang)(wang)站(zhan)建設的(de)人可能(neng)(neng)(neng)(neng)會想到動態網(wang)(wang)頁(ye),的(de)確就是這個(ge)問題,動態生成的(de)網(wang)(wang)頁(ye)(括 ASP、PHP)可能(neng)(neng)(neng)(neng)導致抓取工(gong)具(ju)無法收錄(lu),解決辦法,使(shi)用靜態頁(ye)面。
原因三:在您的網址中(zhong)使用(yong)了會話ID
許多(duo)搜索引擎不去收錄那(nei)些包含(han)會話ID的網頁,因為(wei)它們可導致(zhi)內容的重
復。如(ru)果可能(neng)的話(hua),避免會(hui)話(hua)ID出現在您的網址,而使用s 存儲會(hui)話(hua)ID。
原因四:您的(de)網頁(ye)中包含太多(duo)的(de)代碼
網(wang)(wang)頁中包含(han)了(le)Java代(dai)(dai)碼(ma)、CSS的(de)代(dai)(dai)碼(ma)以及其他(ta)腳(jiao)本代(dai)(dai)碼(ma)。這些代(dai)(dai)碼(ma)與內容沒有(you)直接的(de)聯系(xi),訪問您網(wang)(wang)頁并選擇“查看源文件 ”或“查看HTML 源”,如果您很難對網(wang)(wang)站(zhan)上的(de)實際內容進行更(geng)改,那么通常情況(kuang)下(xia)搜索引(yin)擎收(shou)錄起來也很困(kun)難。
原因五 :網站導航
大(da)多數(shu)搜(sou)索引擎的機器人不能解析Java 或DHTML 菜單(dan),當然Flash以及(ji)Ajax 菜單(dan)效果更差。