過(guo)去一年(nian),搜索引(yin)擎,或(huo)者擴大(da)至互聯網(wang)行(xing)業(ye),最熱門的話(hua)題無疑是人(ren)工(gong)智能(neng)。過(guo)去 10 幾(ji)年(nian),SEO技術和方法(fa)其實沒什(shen)么大(da)變化,這些年(nian)來(lai)我第一次覺得,不久的將來(lai),SEO將被人(ren)工(gong)智能(neng)徹底改變。
上篇關(guan)于的帖(tie)子(zi)里提到,到目前為止,搜索引(yin)擎工程(cheng)師多次否認(ren)排名算(suan)法(fa)中使用(yong)了他們自(zi)己的網站流量統(tong)計數據。可(ke)能的原因(yin)包括:
- 噪聲太大,太容易作弊。看看以前做點擊器,現在做百度快排的有多少,就知道作弊的市場有多大了。不僅給自己刷,還有給競爭對手刷的,把跳出率刷高。
- 不同場景,用戶行為方式不同。跳出率高,不一定代表頁面質量不高。
- 有的網站沒有用搜索引擎的統計服務,怎么給這些網站排名?
但(dan)我(wo)們又真實地觀(guan)察到用戶(hu)訪問數據確實影響了頁(ye)面排名(ming),這是(shi)不是(shi)有矛(mao)盾呢?人工智能也許就(jiu)是(shi)答案(an)。
去年(nian)(nian)寫了AlphaGo、深度(du)學習(xi)與SEO后,在網上看(kan)到(dao)有人(ren)說我(wo)在胡(hu)扯(che),別看(kan)到(dao)個(ge)新(xin)名詞就(jiu)往SEO扯(che)。不(bu)知道(dao)一年(nian)(nian)后,是不(bu)是還有人(ren)覺得人(ren)工智能將影響、改變SEO的想法是胡(hu)扯(che)。
人工智能近期發展
先看看過去幾(ji)年人工智能(neng)領域值得注(zhu)意、又和搜索(suo)有關的幾(ji)件事:
- 2011 年,吳恩達創建了Google Brain,一個超大規模的人工神經網絡。可能是最早的Google人工智能項目。
- 2014 年 5 月,吳恩達加入百度,任首席科學家,主要負責的肯定也是AI。 2017 年 3 月 20 號,吳恩達辭職。這個和人工智能本身應該無關,和新老板有關,看下面。
- 2015 年,Google上線深度學習為基礎的算法RankBrain,并且聲稱RankBrain是第三大排名因素。(前兩大排名因素是內容和鏈接)RankBrain主要用于找到與用戶查詢詞不完全匹配(因而傳統排名算法不太有效)、但其實很好回答了用戶查詢的那些頁面。記住這句有點拗口的話,因為百度有與此類似的算法,而且比Google更早使用,下次再寫。
- 2015 年 10 月,AlphaGo以5: 0 戰勝歐洲圍棋冠軍樊麾。這條消息 2016 年 1 月才出來。
- 2016 年 3 月,AlphaGo以4: 1 勝李世石。李世石贏的那一盤可能是人類戰勝AI的最后一局棋。
- 2016 年 12 月 29 號到 2017 年初的短短幾天內,以Master為用戶名的AlphaGo在弈城、野狐網絡平臺上,快棋60: 0 狂勝中日韓幾乎所有人類最高手,包括柯潔、聶衛平、古力、常昊、樸廷桓、井山裕太…..平了一局,是因為網絡斷線。
- 2017 年 1 月,原微軟全球副總裁陸奇加入百度,任總裁。李彥宏在歡迎詞里特意提到“同時,陸奇還是人工智能領域世界級的技術權威。……百度已經決定將人工智能列為公司未來十年最重要的戰略方向……陸奇的加盟將極大地確保這一戰略得以順利實現”。
- 2016 年 9 月以來,Google陸續上線各語種的采用深度學習方法的谷歌翻譯。本來我也沒太注意這個新聞,偶然用了一下Google翻譯,水準之高,大大出乎我的想象。
人(ren)工(gong)智能(neng)領域領頭的(de)公司,剛好都是搜索(suo)引(yin)擎,是碰巧?Google研發AlphaGo只(zhi)是為(wei)了(le)(le)下棋?只(zhi)是為(wei)了(le)(le)無人(ren)汽(qi)車(che)?百度人(ren)工(gong)智能(neng)團(tuan)隊現在發展到了(le)(le) 1300 人(ren),挖(wa)(wa)吳(wu)恩(en)達,挖(wa)(wa)陸奇,是為(wei)了(le)(le)組團(tuan)參加最強大腦(nao)?
人工智能用于搜索
即使沒(mei)有(you)RankBrain這種確定使用人(ren)工智(zhi)能的(de)算法,我們(men)也能猜到,搜索(suo)引擎花這么大精(jing)力研究人(ren)工智(zhi)能,肯定不止是在(zai)外圍或新業務上(shang)使用,他們(men)沒(mei)理(li)由不把(ba)人(ren)工智(zhi)能用在(zai)自己(ji)的(de)核心業務,也就(jiu)是搜索(suo)上(shang)。
仔細思考一下就知道,AlphaGo下圍棋(qi)與搜索排(pai)名要解決的問題看似誰(shui)也(ye)不挨誰(shui),但其(qi)本質是非常相像的,是可以用同一種(zhong)方式解決的:
- AlphaGo通過學習無數盤棋,其中有人類的歷史棋局,更多的是AlphaGo自我對局,累積海量數據,面對某一盤面時做出判斷:下一手,子下在哪里勝率比較高?
- 搜索引擎排名算法通過學習質量評估員給出的數據、搜索用戶點擊訪問數據等,面對某一個頁面時做出判斷:這個頁面是高質量還是低質量的?這個頁面作弊了嗎?這個頁面與查詢詞相關還是不相關?
傳統搜索(suo)算(suan)法要回答(da)上面問(wen)題時,需(xu)要工程師(shi)根據(ju)常(chang)識、工程知識、情懷、用戶(hu)反饋等(deng)情況,選出(chu)排名(ming)因(yin)素(su),調整(zheng)排名(ming)因(yin)素(su)的權(quan)重(zhong),按既(ji)定(ding)的公式計算(suan)出(chu)答(da)案。人工智(zhi)(zhi)能為基(ji)礎的算(suan)法不需(xu)要工程師(shi)告(gao)訴它使用什(shen)么排名(ming)因(yin)素(su),而是(shi)自己去學習,自己琢磨(mo)用哪(na)些排名(ming)因(yin)素(su),各占多(duo)少權(quan)重(zhong)。人工智(zhi)(zhi)能考慮(lv)的因(yin)素(su)很可(ke)能是(shi)會令人類(lei)覺(jue)得莫名(ming)其妙(miao)的。
吳軍老(lao)師(shi)在(zai)《智能時代》中(zhong)說過一句話,可(ke)以特別(bie)貼切地用于(yu)理解(jie)這種(zhong)情形:在(zai)智能時代,可(ke)以在(zai)大數據中(zhong)直(zhi)接找到答案,雖然(ran)可(ke)能不(bu)知道原(yuan)因(大意)。傳(chuan)統(tong)搜索算(suan)法,工(gong)程(cheng)師(shi)要知道原(yuan)因,才能寫(xie)算(suan)法。人工(gong)智能直(zhi)接從數據中(zhong)找答案,雖然(ran)工(gong)程(cheng)師(shi)都不(bu)知道原(yuan)因。
人工(gong)(gong)智能的最大缺點,對人來(lai)說(shuo)的缺點,它(ta)對人來(lai)說(shuo)是個(ge)黑(hei)盒子,工(gong)(gong)程師也(ye)不知(zhi)道它(ta)是怎么(me)算的,根據什(shen)么(me)算的。結果正確時,一切都(dou)挺(ting)好,但結果不大對頭時,工(gong)(gong)程師也(ye)不知(zhi)道為什(shen)么(me)錯(cuo)了(le),還(huan)(huan)不好debug。也(ye)許由于這個(ge)原因(yin),搜(sou)索引擎(qing)算法的核心現在還(huan)(huan)沒被(bei)人工(gong)(gong)智能取代,搜(sou)索引擎(qing)需要(yao)很謹(jin)慎(shen),不然(ran)會錯(cuo)得自己都(dou)不知(zhi)道為什(shen)么(me)錯(cuo)。
人工智能怎樣影響SEO?
回(hui)到最前面的(de)(de)問(wen)題,用戶點擊、訪問(wen)等行為是否是排(pai)名(ming)因(yin)素?是的(de)(de)話,怎(zen)樣解決(jue)噪聲(sheng)、作弊問(wen)題?沒有(you)用搜索引擎統計(ji)服務的(de)(de)網站,無法確切知道訪問(wen)深度、停留時間等,這又(you)怎(zen)么辦(ban)?
可以設想一(yi)下(xia),算法(fa)可能(neng)不(bu)把用戶訪問(wen)數據(ju)作(zuo)為直接排(pai)(pai)名(ming)(ming)因素,但可以作(zuo)為某(mou)種驗證和(he)(he)質量控制方式,比如(ru)在(zai)傳統排(pai)(pai)名(ming)(ming)算法(fa)計算出相(xiang)關(guan)頁面后,人(ren)(ren)工(gong)智(zhi)能(neng)算法(fa)挑出與(yu)已知作(zuo)弊頁面有相(xiang)同訪問(wen)特(te)征和(he)(he)其它(ta)特(te)征的頁面,降低(di)其排(pai)(pai)名(ming)(ming)或者干脆不(bu)返回。這里要記得(de)人(ren)(ren)工(gong)智(zhi)能(neng)潛在(zai)的驚人(ren)(ren)的準(zhun)確(que)率。記得(de)去年中Google就(jiu)說過,AlphaGo當(dang)時大(da)致相(xiang)當(dang)于人(ren)(ren)類 13 段(duan)棋(qi)手(shou),年底的棋(qi)局(ju)似乎驗證了這很(hen)可能(neng)不(bu)是(shi)吹牛(niu)。柯潔和(he)(he)聶衛(wei)平等人(ren)(ren)與(yu)Master對局(ju)后都(dou)表達過大(da)致這么個意(yi)思:看(kan)了AlphaGo/Master的棋(qi),覺(jue)得(de)人(ren)(ren)類一(yi)些對圍棋(qi)的認識很(hen)可能(neng)是(shi)錯的。
這種判斷(duan)的(de)驚人(ren)(ren)準確性(xing),也許以后對黑(hei)帽SEO是(shi)個無法挽回的(de)打擊。如果(guo)搜索引擎算(suan)法判斷(duan)一個頁(ye)面是(shi)否(fou)作弊(bi)(bi)時,具有 13 段(duan)棋手(shou)、遠遠超出(chu)人(ren)(ren)類的(de)水(shui)平和準確率,那么(me)我們(men)凡(fan)人(ren)(ren)該(gai)怎么(me)作弊(bi)(bi)?
與此類似,如果(guo)網站(zhan)沒有使(shi)用(yong)搜索引(yin)擎(qing)的(de)(de)流量統計服(fu)務,人(ren)工智能可能會判斷(duan),這個(ge)網站(zhan)A具有特征x, y, z…,另一堆使(shi)用(yong)了自己統計服(fu)務的(de)(de)網站(zhan)同(tong)樣具有特征x, y, z…..,預估網站(zhan)A的(de)(de)訪問深度、停留時(shi)間等和那些已知網站(zhan)相同(tong)。這里,特征x, y, z……是什么,是人(ren)工智能自己學習出(chu)來的(de)(de),很可能有人(ren)類意想不到、覺得毫無關系的(de)(de)東西。而基于人(ren)工智能的(de)(de)駭(hai)人(ren)能力(li),結(jie)論很可能是正確的(de)(de)。
人工智能對SEO的關鍵詞研究(jiu)、頁(ye)面文案(an)寫(xie)作(zuo)、網站(zhan)結構等方面都會產(chan)生顛(dian)覆式的影響。這篇(pian)只是開了(le)個(ge)頭(tou),以后(hou)再繼(ji)續討論(lun)。
