過去一年,搜索引擎,或者擴大至互聯網行業,最熱門的話題無疑是人工智能。過去 10 幾年,SEO技術和方法其實沒什么大變化,這些年來我第一次覺得,不久的將來,SEO將被人工智能徹底改變。
上篇關于用戶訪(fang)問數(shu)據是否影響排名的(de)帖子(zi)里(li)提到,到目前為止(zhi),搜索引擎工程師多(duo)次(ci)否(fou)認排(pai)名算法(fa)中使用了(le)他們自己(ji)的(de)網站流量統計數據。可能的(de)原因包括:
噪聲太大,太容易作弊(bi)。看(kan)看(kan)以前(qian)做(zuo)(zuo)點擊器,現在做(zuo)(zuo)百度快排的有(you)多(duo)少,就(jiu)知(zhi)道作弊(bi)的市場有(you)多(duo)大了。不僅給(gei)自己刷,還有(you)給(gei)競爭對(dui)手刷的,把跳出(chu)率刷高。
不同場景,用戶(hu)行為方式不同。跳(tiao)出率高(gao),不一定代表頁面(mian)質(zhi)量不高(gao)。
有的網站沒有用搜索引擎的統計服(fu)務,怎么給這些網站排名?
但我們(men)又真實地觀察到用戶(hu)訪問數(shu)據確實影響(xiang)了頁面(mian)排(pai)名,這(zhe)是(shi)不是(shi)有矛盾(dun)呢(ni)?人工智(zhi)能也許就是(shi)答案。
去年寫了AlphaGo、深度學習與(yu)SEO后,在(zai)網上看到有人(ren)說我在(zai)胡(hu)扯,別看到個新名詞就往SEO扯。不(bu)知道一年后,是不(bu)是還有人(ren)覺得人(ren)工智能將影(ying)響、改變SEO的(de)想法(fa)是胡(hu)扯。
先看(kan)看(kan)過去(qu)幾年人(ren)工智能領域值得(de)注意、又和搜索有(you)關的幾件事(shi):
2011 年,吳恩達創建(jian)了Google Brain,一個超大規(gui)模的(de)人工(gong)(gong)神經(jing)網絡。可能是最(zui)早的(de)Google人工(gong)(gong)智能項(xiang)目。
2014 年(nian) 5 月(yue)(yue),吳恩達加入百度,任首席(xi)科學家,主要負責的肯定也(ye)是AI。 2017 年(nian) 3 月(yue)(yue) 20 號,吳恩達辭職。這個(ge)和(he)人工(gong)智能本身應(ying)該無關,和(he)新老板有(you)關,看下面。
2015 年,Google上(shang)線深(shen)度學習為基礎的(de)算(suan)法RankBrain,并且聲稱RankBrain是第(di)三(san)大排名(ming)因(yin)素。(前兩大排名(ming)因(yin)素是內容和鏈(lian)接)RankBrain主要用于找到與用戶查詢詞不完全匹配(因(yin)而傳統排名(ming)算(suan)法不太有效)、但(dan)其實(shi)很好回答了用戶查詢的(de)那些頁面。記(ji)住這句有點拗口的(de)話(hua),因(yin)為百度有與此類(lei)似的(de)算(suan)法,而且比(bi)Google更早使用,下次再寫。
2015 年 10 月,AlphaGo以5: 0 戰勝歐洲(zhou)圍(wei)棋(qi)冠軍樊麾。這條消息 2016 年 1 月才出來。
2016 年 3 月,AlphaGo以4: 1 勝李(li)世石。李(li)世石贏的那一盤可(ke)能是人(ren)類(lei)戰勝AI的最后一局棋。
2016 年 12 月 29 號到 2017 年初的(de)(de)短短幾(ji)天內,以Master為用(yong)戶名的(de)(de)AlphaGo在(zai)弈城、野(ye)狐(hu)網絡(luo)平臺上(shang),快棋60: 0 狂勝中(zhong)日(ri)韓(han)幾(ji)乎所(suo)有(you)人類最(zui)高手,包(bao)括柯潔、聶衛平、古力、常(chang)昊、樸廷桓、井山裕太…..平了一局,是因(yin)為網絡(luo)斷線。
2017 年 1 月,原微軟全球副總(zong)裁(cai)陸(lu)奇(qi)加(jia)入百度,任總(zong)裁(cai)。李彥宏在歡(huan)迎詞里特(te)意提到(dao)“同(tong)時,陸(lu)奇(qi)還是(shi)人工智能領域(yu)世界級的技(ji)術(shu)權威。……百度已經決定將人工智能列(lie)為公司未來十年最(zui)重要的戰略方(fang)向……陸(lu)奇(qi)的加(jia)盟(meng)將極大地確保(bao)這(zhe)一戰略得以(yi)順利實現”。
2016 年 9 月(yue)以來,Google陸續上線各(ge)語種的(de)采用深度學(xue)習方法的(de)谷歌翻譯(yi)。本來我(wo)也沒太注意這個新聞,偶(ou)然用了一下(xia)Google翻譯(yi),水準(zhun)之高,大大出乎我(wo)的(de)想象。
人(ren)(ren)工智能領域領頭的(de)公司,剛好都是(shi)(shi)搜索引擎,是(shi)(shi)碰巧?Google研發AlphaGo只(zhi)是(shi)(shi)為了下(xia)棋?只(zhi)是(shi)(shi)為了無人(ren)(ren)汽車?百度人(ren)(ren)工智能團隊現在發展到了 1300 人(ren)(ren),挖(wa)吳恩(en)達,挖(wa)陸(lu)奇,是(shi)(shi)為了組團參加(jia)最(zui)強大腦?
即使(shi)沒有(you)RankBrain這種(zhong)確定(ding)使(shi)用(yong)(yong)人工(gong)智(zhi)能的算法,我們(men)也(ye)(ye)能猜(cai)到,搜(sou)(sou)索引擎花(hua)這么大精力研究人工(gong)智(zhi)能,肯定(ding)不止是在外圍或新業(ye)(ye)務上使(shi)用(yong)(yong),他們(men)沒理由不把(ba)人工(gong)智(zhi)能用(yong)(yong)在自己的核心業(ye)(ye)務,也(ye)(ye)就是搜(sou)(sou)索上。
仔細思考一下就知道,AlphaGo下圍棋與搜索排名要解決(jue)的(de)問(wen)題看似誰(shui)也不挨誰(shui),但其本質(zhi)是(shi)非常(chang)相像的(de),是(shi)可以用同(tong)一種方式解決(jue)的(de):
AlphaGo通過學習無數盤棋(qi),其中有人類(lei)的歷史棋(qi)局(ju),更多的是AlphaGo自我對局(ju),累積(ji)海量數據,面對某(mou)一盤面時做出判斷(duan):下(xia)一手,子下(xia)在哪里勝率比較高?
搜(sou)索引擎(qing)排名算(suan)法通過學習質量(liang)評估員給出的(de)數據(ju)、搜(sou)索用戶點(dian)擊訪問數據(ju)等,面(mian)(mian)對(dui)某一個頁面(mian)(mian)時做(zuo)出判斷:這(zhe)個頁面(mian)(mian)是(shi)高質量(liang)還是(shi)低質量(liang)的(de)?這(zhe)個頁面(mian)(mian)作弊了(le)嗎?這(zhe)個頁面(mian)(mian)與查詢詞相關(guan)還是(shi)不相關(guan)?
傳統(tong)搜(sou)索算(suan)法要回答上面問題時,需要工程(cheng)師根據常識、工程(cheng)知識、情懷、用戶反饋等情況,選出(chu)排名(ming)因(yin)素(su),調整排名(ming)因(yin)素(su)的(de)(de)權重,按既定的(de)(de)公式計算(suan)出(chu)答案。人工智能為基(ji)礎(chu)的(de)(de)算(suan)法不需要工程(cheng)師告(gao)訴(su)它使用什么(me)排名(ming)因(yin)素(su),而是自己去學習,自己琢磨用哪些(xie)排名(ming)因(yin)素(su),各占(zhan)多少權重。人工智能考慮的(de)(de)因(yin)素(su)很可能是會令人類覺得莫名(ming)其妙的(de)(de)。
吳(wu)軍老師(shi)(shi)在(zai)《智(zhi)能(neng)(neng)時(shi)代(dai)》中說過一(yi)句話,可以特別貼切地用于理解這種(zhong)情形:在(zai)智(zhi)能(neng)(neng)時(shi)代(dai),可以在(zai)大數(shu)據中直(zhi)接找到答案(an),雖然可能(neng)(neng)不(bu)知道(dao)(dao)原(yuan)(yuan)因(大意(yi))。傳(chuan)統搜索算(suan)法,工(gong)程(cheng)師(shi)(shi)要知道(dao)(dao)原(yuan)(yuan)因,才能(neng)(neng)寫(xie)算(suan)法。人工(gong)智(zhi)能(neng)(neng)直(zhi)接從數(shu)據中找答案(an),雖然工(gong)程(cheng)師(shi)(shi)都不(bu)知道(dao)(dao)原(yuan)(yuan)因。
人工智能的(de)最大(da)缺點,對人來說(shuo)的(de)缺點,它對人來說(shuo)是(shi)個(ge)(ge)黑盒(he)子(zi),工程師也(ye)不知道(dao)它是(shi)怎么算的(de),根據什(shen)么算的(de)。結(jie)果正確時(shi),一(yi)切都挺(ting)好,但結(jie)果不大(da)對頭時(shi),工程師也(ye)不知道(dao)為什(shen)么錯了(le),還不好debug。也(ye)許由于這個(ge)(ge)原因,搜(sou)索(suo)引擎(qing)算法(fa)的(de)核(he)心現在還沒被(bei)人工智能取(qu)代,搜(sou)索(suo)引擎(qing)需(xu)要(yao)很謹慎(shen),不然會錯得自己(ji)都不知道(dao)為什(shen)么錯。
回到(dao)最前(qian)面的(de)問(wen)(wen)題,用戶點(dian)擊、訪(fang)問(wen)(wen)等(deng)行為是否是排名因素?是的(de)話,怎樣解決噪聲(sheng)、作弊問(wen)(wen)題?沒(mei)有用搜索(suo)引擎統計(ji)服務(wu)的(de)網(wang)站,無(wu)法確(que)切知道(dao)訪(fang)問(wen)(wen)深(shen)度(du)、停留時間等(deng),這又怎么辦?
可(ke)(ke)以設想一(yi)下,算法(fa)可(ke)(ke)能(neng)(neng)(neng)不(bu)把用(yong)戶訪問(wen)(wen)數據作為(wei)直接排名(ming)因(yin)素,但可(ke)(ke)以作為(wei)某種(zhong)驗證和質(zhi)量控制(zhi)方式,比如在傳統排名(ming)算法(fa)計算出相關頁面(mian)(mian)后,人(ren)(ren)工智能(neng)(neng)(neng)算法(fa)挑出與已(yi)知作弊頁面(mian)(mian)有相同訪問(wen)(wen)特征和其(qi)它特征的(de)頁面(mian)(mian),降低其(qi)排名(ming)或者干脆不(bu)返回。這里(li)要記(ji)得(de)(de)人(ren)(ren)工智能(neng)(neng)(neng)潛在的(de)驚人(ren)(ren)的(de)準確率。記(ji)得(de)(de)去年中Google就(jiu)說過,AlphaGo當(dang)時大致(zhi)(zhi)相當(dang)于人(ren)(ren)類 13 段(duan)棋手,年底(di)的(de)棋局似乎驗證了這很可(ke)(ke)能(neng)(neng)(neng)不(bu)是吹牛(niu)。柯潔和聶(nie)衛平等人(ren)(ren)與Master對局后都表達過大致(zhi)(zhi)這么(me)個意(yi)思:看了AlphaGo/Master的(de)棋,覺得(de)(de)人(ren)(ren)類一(yi)些對圍棋的(de)認識很可(ke)(ke)能(neng)(neng)(neng)是錯(cuo)的(de)。
這(zhe)種判(pan)斷的驚(jing)人準確性,也許以后對黑帽SEO是個(ge)無法挽回(hui)的打擊。如果搜索(suo)引擎算法判(pan)斷一個(ge)頁面是否作(zuo)弊(bi)時(shi),具有 13 段棋手(shou)、遠遠超出人類的水平和準確率,那么(me)我們凡(fan)人該怎么(me)作(zuo)弊(bi)?
與此類似(si),如果網(wang)(wang)站沒有使用搜索引擎的(de)流量(liang)統(tong)計服務,人工智(zhi)能(neng)可(ke)能(neng)會判斷,這(zhe)個網(wang)(wang)站A具(ju)(ju)有特(te)(te)征(zheng)(zheng)x, y, z…,另(ling)一堆(dui)使用了自己統(tong)計服務的(de)網(wang)(wang)站同樣具(ju)(ju)有特(te)(te)征(zheng)(zheng)x, y, z…..,預估(gu)網(wang)(wang)站A的(de)訪問深度、停(ting)留(liu)時間等和那些已(yi)知網(wang)(wang)站相同。這(zhe)里,特(te)(te)征(zheng)(zheng)x, y, z……是(shi)(shi)什(shen)么,是(shi)(shi)人工智(zhi)能(neng)自己學習出來的(de),很(hen)可(ke)能(neng)有人類意想不到、覺得(de)毫無關系的(de)東西。而基于人工智(zhi)能(neng)的(de)駭人能(neng)力,結論(lun)很(hen)可(ke)能(neng)是(shi)(shi)正(zheng)確(que)的(de)。
人工智能對SEO的(de)關鍵詞研究、頁(ye)面文案寫作、網(wang)站結構(gou)等方面都會產生顛覆(fu)式的(de)影響(xiang)。這篇只是開了個頭(tou),以后再繼(ji)續討論。