午夜91福利视频,午夜成人在线观看,午夜在线视频免费观看,午夜福利短视频,精品午夜成人免费视频APP

幫助

硬貨-如何用風控拯救下架的小紅書

2019-11-13 15:56 運營文檔
從內容風(feng)控和平(ping)臺(tai)治理的(de)角(jiao)度來談談行業當前的(de)現狀與困境。

01

 

這兩(liang)天互聯網圈最大的熱門事(shi)件(jian)是,小紅書下架了(le)。

 

7月29日晚間(jian),各(ge)大安卓應(ying)用市場的(de)小紅書APP暫時不提(ti)供下(xia)載(zai)。

 

作為國(guo)民級種草APP,小(xiao)紅書的下架既是意料之外(wai),也是情理之中。

 

意料之(zhi)外在于,小紅書本身只是一個主打消(xiao)費的(de)內容社區,本身不具(ju)有攻擊(ji)性。

 

情理(li)之中在于,小紅書是(shi)C2C模式,筆記內(nei)(nei)容可以(yi)隨意發(fa)布,任何人用任何方法都(dou)可以(yi)發(fa)布任何內(nei)(nei)容。

 

正常人可(ke)以(yi)(yi)(yi),微商(shang)可(ke)以(yi)(yi)(yi),特殊工作者可(ke)以(yi)(yi)(yi),黑產也可(ke)以(yi)(yi)(yi)。

 

對于一(yi)切C2C的(de)(de)工(gong)具類平臺產品,只要能發布內容,其實內容失控的(de)(de)風(feng)險(xian)都是存在的(de)(de),不僅是小紅書(shu)。

 

之前的(de)即刻,Soul,乃至網易云音樂(le),都存(cun)在內容失(shi)控的(de)情(qing)況,話題(ti)廣場,論壇,評(ping)論區,用戶(hu)昵稱,甚至私人對話,只要可(ke)以錄入文(wen)字(zi)圖片和語音的(de)地方(fang),就存(cun)在著失(shi)控的(de)風險(xian)。

 

 畢竟產品是(shi)簡(jian)單的(de),人(ren)性(xing)是(shi)復雜的(de)。

 

平臺治理和內容安全(quan)也(ye)歸屬于(yu)大(da)風(feng)控的范疇(chou),作為(wei)一名風(feng)控從業者,在(zai)這方面(mian),我有(you)一些實戰經驗。

 

這篇文章,我打(da)算從內(nei)容風控和平臺治理的角度(du)來談談行業當前的現狀與(yu)困境。

 

 內(nei)容失控,對于所有(you)電商和社(she)區類(lei)產品而言,都是致命(ming)的(de)。

 

尤其在互聯(lian)網文明越來越重要的今天(tian)。

 

02

 

 

小紅(hong)書作(zuo)為C2C的工具類平臺,用戶是可以(yi)自己上傳(chuan)圖片和筆記的。

 

同時小紅書又是Top的種草平臺(tai),用戶逛(guang)小紅書就是買東西的。

 

自由的(de)(de)規則(ze)配合精準的(de)(de)潛在消費(fei)者(zhe),二者(zhe)一(yi)(yi)結(jie)合,就成了一(yi)(yi)塊超(chao)級美(mei)妙的(de)(de)流量蛋糕,肥的(de)(de)流油。

 

于是各種違禁黑產,色情交易,非法醫美,就都來了。

 

在下架(jia)前,小紅書通過一些關鍵(jian)詞索引,可以獲得(de)各種神(shen)奇的服務,當然(ran)現(xian)在已經開始大規模屏蔽(bi)。

 

例如粉毒和非(fei)法(fa)醫美(mei);比(bi)基尼和特殊服務;增高減肥和黑五類保健品;銀行卡電話卡和黑產資料(liao)。

 

這些筆記的(de)(de)(de)特點都是打著攻(gong)略分享的(de)(de)(de)名義,往賣家的(de)(de)(de)私人微信號上導流,然后用話(hua)術誘(you)導成交。

 

這種自發(fa)性的(de)C2C傳播,也(ye)是小紅(hong)書產(chan)品本身的(de)最大(da)特點。

 

很多不(bu)法商(shang)家(jia)在利(li)用小紅書這個平臺(tai),大發橫財。

 

小紅書作為平臺方,有(you)苦難言。

 

03

 

我(wo)不想去討論小紅(hong)書作為(wei)平臺(tai)有沒有責任,畢竟(jing)內容是用戶自發的,這塊我(wo)不夠專業。

 

我(wo)想(xiang)討論(lun)的是,用什么方法可以(yi)有效(xiao)治(zhi)理(li)掉這些垃(la)圾內容,小(xiao)紅書的風控和平臺治(zhi)理(li)們也在(zai)頭疼這件事情。

 

作為風控同行,我(wo)想提一(yi)些建議(yi),這(zhe)些源自我(wo)的一(yi)些實戰經驗,希(xi)望能對他們以及讀者(zhe)有(you)所幫助。

 

OK,小(xiao)紅書(shu)當前(qian)面臨的(de)(de)(de)核心問題是(shi),C端用戶上傳的(de)(de)(de)內(nei)容具(ju)有很(hen)大(da)的(de)(de)(de)不可(ke)控性(xing),里面可(ke)能夾(jia)雜了(le)大(da)量的(de)(de)(de)違法(fa)違禁內(nei)容,需(xu)要有效識別這些(xie)人,然后針對性(xing)屏蔽和封號,在(zai)保(bao)證正常用戶體驗的(de)(de)(de)前(qian)提(ti)下,降低內(nei)容風險(xian)。

 

當然,不管是(shi)降低內(nei)容(rong)風險(xian),還是(shi)保(bao)證用戶體驗,其核心目的都是(shi)要(yao)保(bao)證企業的商(shang)業利益最大(da)化,這是(shi)大(da)前提,風控要(yao)為業務服務。

 

所以(yi)一切手段最(zui)終都要(yao)平衡誤殺率(lv)和ROI。

 

那么(me),我們(men)開始(shi)。

 

04

 

關于違規(gui)內容屏蔽,目前(qian)業內主要使(shi)用的是外(wai)采詞庫(ku)以及內部(bu)維護一套動態詞庫(ku)。

 

所謂外采(cai)詞(ci)庫(ku)就是有專門的供(gong)應商會(hui)做(zuo)涉及敏(min)感領域的詞(ci),支持(chi)API的形(xing)式直接(jie)調(diao)用(yong),可以嵌(qian)入(ru)到(dao)用(yong)戶(hu)昵稱錄入(ru),文本(ben)上傳(chuan)(chuan),用(yong)戶(hu)私信等模塊,只要上傳(chuan)(chuan)文本(ben),都會(hui)進行一次詞(ci)庫(ku)過濾(lv),把一些(xie)違禁的詞(ci)給抓出來。

 

優點(dian)(dian)是(shi)(shi)快速上線(xian),缺點(dian)(dian)是(shi)(shi)詞(ci)庫是(shi)(shi)暗箱狀態(屬于供應(ying)商(shang)),并且業務(wu)關鍵數據容(rong)(rong)易(yi)泄露(lu)(API調(diao)用(yong)的入參容(rong)(rong)易(yi)被(bei)供應(ying)商(shang)拿走商(shang)用(yong))。

 

我知道小紅(hong)書的(de)(de)供應商是(shi)(shi)(shi)哪家,我也測試過很(hen)(hen)多家,只能(neng)說通(tong)用詞(ci)(ci)庫(ku)(ku)是(shi)(shi)(shi)沒法依據(ju)實際業務場景(jing)來做(zuo)精準打擊的(de)(de),建議小紅(hong)書自建詞(ci)(ci)庫(ku)(ku),如果(guo)沒有(you)現成(cheng)可配置(zhi)的(de)(de)詞(ci)(ci)庫(ku)(ku)框架,可以使用腳本的(de)(de)方式來讓(rang)研發維護一套詞(ci)(ci)庫(ku)(ku),當然最好還(huan)是(shi)(shi)(shi)做(zuo)成(cheng)可配置(zhi)的(de)(de),畢竟用腳本的(de)(de)話,詞(ci)(ci)多了很(hen)(hen)容易崩潰,不是(shi)(shi)(shi)長久之計。

 

有(you)了(le)這(zhe)一套(tao)東西后,需要一套(tao)應用(yong)策(ce)略,包含敏感(gan)(gan)詞收(shou)集策(ce)略,敏感(gan)(gan)詞應用(yong)策(ce)略,敏感(gan)(gan)詞處置策(ce)略。

 

 所謂敏感詞收集策略,要解決的(de)是如(ru)何獲取(qu)到(dao)有效的(de)敏感詞。

 

很多人工智能公司(si)吹捧所謂自然語義識別,用機(ji)器(qi)學(xue)習做,在這里是(shi)不好用的,我要提醒一下小紅書,不要迷信機(ji)器(qi)學(xue)習。

 

因為漢語是博(bo)大精(jing)深(shen)的,使用諧(xie)音(yin)字,變體(ti)字,火星文,以及中(zhong)間夾雜(za)各種(zhong)特殊符號和空格的模式,很容易就能繞過(guo)機器。

 

就微信這(zhe)個詞,可以變種成V信,VX,威(wei),VV,你懂得,威(wei)X信等等等等,機器學習做不到這(zhe)么精準的打擊(ji),但人的識(shi)別配合SQL以及Python代碼,可以實現。

 

在這里,建議使用(yong)實時數(shu)據庫(ku),配專門的(de)數(shu)據分析師來(lai)做詞語收集。

 

數據分析師可以通(tong)過一些基礎的違規信息,來(lai)進(jin)一步(bu)人工延伸出索引規則,例如微 ` 信12345,就可以提取出某(mou)些關鍵字(用(yong)微這個字來(lai)做(zuo)索引),某(mou)些特(te)殊符(fu)號,甚至(zhi)某(mou)些符(fu)號+數字的特(te)征來(lai)抓。

 

 一個(ge)熟練的風(feng)控數據分析師,一天抓出上(shang)萬有效敏感詞不(bu)是問題。

 

所謂敏感詞應用(yong)策(ce)略,要解決的問題是這些敏感詞用(yong)于哪些領域。

 

當你有了一個(ge)敏感詞(ci)庫時(shi),你需要(yao)對(dui)每一個(ge)詞(ci)進行打標(biao)簽,例如殺人這個(ge)詞(ci)是A類標(biao)簽,吃奶這個(ge)詞(ci)是B類標(biao)簽,不同(tong)(tong)的(de)業務(wu)場景以(yi)及電商品(pin)類,要(yao)使(shi)用完全(quan)不同(tong)(tong)的(de)標(biao)簽。

 

例如牛奶類的(de)筆記,用吃奶這個詞就會誤傷(shang)很大。

 

 這(zhe)里需要做的是,給(gei)每一(yi)個場景的業務(wu)都打上(shang)標(biao)簽,然(ran)后依據標(biao)簽來使用(yong)敏感詞庫中的詞類目。

 

例如口(kou)紅類筆記要用ABC標簽的詞(ci)。

 

例如旗袍(pao)類的筆記要用(yong)CDF標簽的詞等等。

 

至于如何拆解品類打標和敏感(gan)詞,這個就不展開了,展開必是長篇大(da)論。

 

所(suo)謂敏(min)感(gan)詞(ci)處置(zhi)策略,要(yao)解決的問(wen)題是內(nei)容命(ming)中(zhong)了敏(min)感(gan)詞(ci)之(zhi)后,要(yao)如何處置(zhi)這些內(nei)容。

 

這里(li)其實也牽涉對(dui)敏感(gan)詞(ci)的打標,主要是設置敏感(gan)詞(ci)處置權重(zhong)。

 

例如黃(huang)恐暴類的敏感詞(ci),標簽(qian)對應的處置手(shou)段應該是直接屏蔽+封號或(huo)者直接禁(jin)止發布。

 

例如疑似推(tui)廣微信號的標簽(qian),對應(ying)的處置手段應(ying)該是屏蔽+禁(jin)言(yan),或者禁(jin)止發布。

 

 例如命中了(le)一些權(quan)重較弱的敏感詞或者敏感字,對應的處置手(shou)段應該是轉(zhuan)人工審核,再發布。

 

當然這里(li)只是舉幾(ji)個簡單的例子,敏感(gan)詞(ci)的應用方法還有很(hen)多,不(bu)過這個方向是目前比較成熟(shu)的模(mo)式。

 

除卻(que)敏感詞之外(wai),小紅書的(de)筆記中還含(han)有(you)大量的(de)圖片類內容(rong),這些圖片類內容(rong)目前(qian)主要的(de)問題有(you)2個。

 

第一個是黃(huang)恐暴類(lei)圖片,圖片本身有(you)問題。

 

第二個是圖(tu)(tu)片(pian)本身沒問題,但(dan)是圖(tu)(tu)片(pian)里面(mian)的(de)東西(xi)有問題,例(li)如圖(tu)(tu)片(pian)里面(mian)就有VX:12345等字跡或者水(shui)印。

 

對(dui)于前者,建(jian)議直接購買現成(cheng)的(de)(de)圖片識別服(fu)務,阿里騰訊都有成(cheng)熟的(de)(de)服(fu)務。

 

對于(yu)后者,可以使用OCR把圖片轉成文字(zi),然(ran)后使用敏(min)感詞策略來進(jin)行(xing)處理。

 

以上(shang)是對于(yu)內容本身的風控思路(lu),需(xu)要注(zhu)意的是,這(zhe)個(ge)需(xu)要投入(ru)大量(liang)的資源(yuan),尤其(qi)是人(ren)工審(shen)核(he)資源(yuan),今日頭條就(jiu)有數(shu)千人(ren)專(zhuan)門做內容審(shen)核(he),對于(yu)內容電商來說,這(zhe)個(ge)不能省。

 

而且內容攻防應該是動態的(de),不存在一勞(lao)永逸的(de)事情(qing),需(xu)要做好持(chi)久戰的(de)準(zhun)備,漢語(yu)就是這么博大(da)精(jing)深。

 

05

 

 

內容風控很重要,但(dan)其實只是表層,而(er)且永遠難(nan)以做到窮舉,真(zhen)的一刀切(qie)下去,會誤傷(shang)大量的正常用(yong)戶(hu),這(zhe)對于用(yong)戶(hu)體驗和(he)公司的商業價值而(er)言都是損失。

 

 比(bi)內容風(feng)控更重要的,是底層(ceng)風(feng)控,從用戶注冊到發生第一次行(xing)為(例如發布筆記或(huo)(huo)者(zhe)給某個筆記點(dian)贊或(huo)(huo)者(zhe)評(ping)論或(huo)(huo)者(zhe)分享),都需要做更深入(ru)的風(feng)險管理。

 

除了(le)要管(guan)別人發(fa)了(le)什(shen)么內(nei)容,同樣還(huan)要管(guan)是哪些(xie)(xie)【人】發(fa)了(le)這些(xie)(xie)內(nei)容。

 

通過敏感詞體系,可以對大量(liang)的內容筆(bi)(bi)記(ji)來進行標簽,分(fen)類出正常筆(bi)(bi)記(ji),可疑(yi)筆(bi)(bi)記(ji),搗(dao)亂筆(bi)(bi)記(ji),沙雕筆(bi)(bi)記(ji)等(deng)等(deng)等(deng)等(deng)等(deng),這些統(tong)稱為(wei)Y。

 

風控策略的基礎邏輯是(shi)F(x)=Y,X是(shi)指(zhi)特征,F是(shi)指(zhi)算法(fa)or策略,Y是(shi)指(zhi)效果。

 

當你有了Y之(zhi)后(hou),就(jiu)等于知道(dao)了答案。

 

然后(hou)去找這(zhe)些異(yi)常的筆記,都是誰發布的,這(zhe)些發布的賬(zhang)號(hao)的特征(X)是什(shen)么。

 

一般常見的賬號(hao)特征有(you)(you)數百個維度(du),例如注(zhu)冊時間,年齡(ling),性別(bie),發布時間,常用標簽,ip地(di)(di)址,設備號(hao)(imac,imei,device id),手(shou)機號(hao),性別(bie),歸屬地(di)(di),APP來(lai)源(華(hua)為市場,小米市場,APP Store),登錄模式(APP,小程序,H5),手(shou)機型號(hao),GPS地(di)(di)址,LBS區域,用戶注(zhu)冊來(lai)源(自來(lai)水,A活動(dong)推(tui)廣,市場投放轉(zhuan)化,CPA),歷史行為(點贊數,關注(zhu)人),瀏覽行為,等(deng)等(deng)等(deng)等(deng)等(deng),這些(xie)信息有(you)(you)的來(lai)自于(yu)APP埋點,有(you)(you)的來(lai)自于(yu)依據原(yuan)有(you)(you)特征推(tui)算出的衍生特征。

 

特征工程是風控的核心(xin)之(zhi)一(yi),重(zhong)要性不亞于策略應用,好的數據(ju)是一(yi)切的基(ji)礎。

 

通過敏感(gan)詞(ci)找(zhao)到Y,然后利用Y來反推命中的(de)X,然后得出應(ying)用策略-F。

 

案(an)例1,假(jia)如小紅(hong)書發(fa)(fa)現某個(ge)整容類的異(yi)常筆記,大部分發(fa)(fa)布(bu)者和點贊者的IP都是相同的或者都是同一個(ge)號段(duan)的,那么完全可以設(she)置策略屏蔽(bi)這(zhe)個(ge)IP段(duan)發(fa)(fa)這(zhe)個(ge)類型的筆記。

 

案例2,假如小紅書發(fa)現某些有問(wen)題的筆記(ji),都指向同一個微(wei)信號,那么就把發(fa)布過這(zhe)個微(wei)信號的賬號全都封了,連(lian)誤殺都沒有。

 

案例3,假如(ru)小紅書發現某些有問(wen)題的(de)筆(bi)記(ji),大部分(fen)發布者和點贊者都是(shi)24小時(shi)內(nei)注冊的(de),那么完(wan)全(quan)可以設置注冊時(shi)間XXX時(shi)間內(nei),不允許(xu)在XX領域發筆(bi)記(ji)。

 

 類似的(de)規則(ze),在(zai)成熟(shu)的(de)平(ping)臺(tai)治理中,會有數十(shi)萬條,我做過(guo)設計和(he)維護。

 

這一切的規則,都要做(zuo)成動態可(ke)配置(zhi)的,做(zuo)成決(jue)策(ce)引(yin)擎的模式,風(feng)控只(zhi)需要拖(tuo)拉(la)拽這些標(biao)簽(qian),然(ran)后自己寫比對符和閾值,再(zai)配置(zhi)處置(zhi)手段,就可(ke)以(yi)生效。

 

例如一條(tiao)規則,禁止注冊時間在24小時內(nei)的女性用戶發布比基尼(ni)筆記。

 

拆解(jie)起(qi)來(lai)就是。

 

注冊(ce)時間<24小時,

 

且(qie) 性別(bie)標簽=女,

 

且筆(bi)記標簽(qian)=比基尼

 

則,禁止發布,

 

且(qie),彈出(chu)文案【半佛仙人你(ni)別比比了】。

 

把這些做(zuo)成是否的標簽,可以自由配置,快速上線。

 

06

 

夾(jia)雜敏感詞策略和(he)決策引擎中(zhong)間,還應該有(you)一(yi)層(ceng)基于【賬戶(hu)】維(wei)度的(de)用戶(hu)關(guan)系網絡以及實時監(jian)控和(he)干預機制,用圖(tu)挖掘來做。

 

所謂關(guan)系(xi)網絡(luo),是(shi)指不同賬戶間的(de)關(guan)系(xi),由點和線組成。

 

例(li)如A賬戶(hu)給B賬戶(hu)的筆記點贊或(huo)者評價,就(jiu)會形成一條關系。

 

反應在網絡中就是A點(dian)和B點(dian)之(zhi)間出現了一條關系線(xian)(A點(dian)贊/評論(lun)B)。

 

再(zai)例如A賬戶(hu)和C賬戶(hu)同時給B賬戶(hu)的(de)筆記(ji)點(dian)贊或者評價,就會(hui)形成多條關系線。

 

反應(ying)在網絡中就是A點到(dao)B點(點贊(zan)串聯),C點到(dao)B點(點贊(zan)串聯),A點到(dao)C點(都給B點過贊(zan))。

 

關系網絡(luo),是對于批量作弊賬戶的大殺器。

 

在(zai)實(shi)際業務(wu)中,通過設置點和線的(de)規(gui)則,可以有效攔截批量異常(chang)行為。

 

例如在同(tong)(tong)一個時(shi)間,出現了(le)大量有關(guan)聯的賬戶(hu)(相同(tong)(tong)IP,相同(tong)(tong)操作頻率,相同(tong)(tong)GPS等(deng)),與某幾個筆記或者(zhe)賬戶(hu)出現了(le)可疑關(guan)聯(批量點贊),就可以(yi)進行攔截。

 

例(li)如在近10分鐘內,整個的流量池出現了(le)波(bo)動異常(chang)(分均用戶點贊數(shu)超過了(le)平(ping)均值XX倍),則可以觸發警(jing)報,把溢出流量關聯的內容進行屏蔽(bi)等(deng)(deng)等(deng)(deng)等(deng)(deng)。

 

關系網絡更多是橫向的(de)對比(bi)以及大盤的(de)監控,涉及賬(zhang)戶(hu)管控,不僅要(yao)看橫向,更要(yao)看縱向。

 

所(suo)謂(wei)橫向,是指同(tong)一(yi)個時間里,賬戶A和賬戶BCDEF是否(fou)有相同(tong)的(de)行(xing)為或者異常(chang)的(de)關聯,所(suo)有人放在(zai)一(yi)起來比不同(tong)。

 

所謂縱向(xiang),是(shi)指(zhi)同一個(ge)賬戶,在不同的時間里(li),進(jin)行了(le)怎樣的操作。

 

例如A賬戶,過去六個月都(dou)是(shi)給一些(xie)正(zheng)常(chang)的筆記(ji)點贊,瀏覽(lan)和評(ping)論都(dou)很正(zheng)常(chang),但是(shi)近(jin)3天,在(zai)密(mi)集(ji)的跟一些(xie)異常(chang)的筆記(ji)產(chan)生互動和分享。

 

這就是賬戶(hu)出(chu)現了問題,與之前的操(cao)作不同,需要對賬戶(hu)發出(chu)警告,要么(me)屏(ping)蔽功能,要么(me)要求實名。

 

橫(heng)向(xiang)是用(yong)其他(ta)用(yong)戶的特征(zheng)比對(dui)一個用(yong)戶,縱向(xiang)是指用(yong)戶過去的特征(zheng)比對(dui)當前的行為(wei)。

 

縱橫之術是對抗黑(hei)產養號(hao)與(yu)批(pi)量作(zuo)弊的屠龍術。

 

07

 

敏(min)感詞策(ce)略和(he)(he)決策(ce)引擎外,還需(xu)要(yao)做的是賬戶準入和(he)(he)APP加(jia)固。

 

所謂(wei)賬戶(hu)準入體系,是指在用(yong)戶(hu)注冊階段就攔截掉大量黑產(chan)用(yong)戶(hu)。

 

大量發布垃圾筆記和違(wei)禁筆記的(de)賬號,往往都是接碼(ma)平臺批量注冊了,不是很多人想到一堆人拿著(zhu)幾百個(ge)手機(ji)在操作,微商很賺錢的(de)好嗎,不會干這(zhe)種low事。

 

 這就(jiu)代表著,這些注冊(ce)手機號(hao)(hao)本身,就(jiu)有足(zu)夠多的(de)問題(ti),因為黑產們拿手機號(hao)(hao)也有成本,往(wang)往(wang)會多次利用。

 

這個手機號(hao)在(zai)小紅書(shu)耍流氓之(zhi)前,可能已經在(zai)其他平臺被教育過了。

 

一般在注冊階段(duan),建議對(dui)手(shou)機號(hao)加(jia)一層(ceng)準入(ru)規則,常(chang)規的(de)手(shou)段(duan)是禁(jin)止小號(hao)和(he)虛擬號(hao)注冊,進一步的(de)手(shou)段(duan)就是采購(gou)阿里(li)云和(he)騰(teng)訊天(tian)御的(de)注冊反(fan)欺詐評分,輸(shu)入(ru)一個手(shou)機號(hao)+注冊IP,可(ke)以返給一個評分,分數(shu)高于(yu)XXX分的(de)時候,拒絕用戶注冊,或者(zhe)強制要求(qiu)實名(人臉或者(zhe)銀行卡)。

 

阿里有最(zui)全的(de)(de)電商黑(hei)產(chan)庫(ku),騰訊有最(zui)全的(de)(de)社交黑(hei)產(chan)庫(ku),網易有最(zui)全的(de)(de)游戲黑(hei)產(chan)庫(ku),都(dou)是(shi)T+0實時更新的(de)(de),土豪一些的(de)(de)公司可以(yi)都(dou)用,其他自(zi)便。

 

反正只要(yao)風控(kong)能(neng)根據異(yi)常筆記抓到注冊(ce)賬戶手機(ji)號(hao)就行,拿這些去測各家的數據準確度與(yu)誤(wu)殺率(lv),并不(bu)困難。

 

這個操作在業內叫做加盾,有(you)這一層(ceng)盾,基本上可以擋掉市場上9成5的黑產(chan)(chan),大多數黑產(chan)(chan)是沒(mei)有(you)能(neng)力繞盾的,因為資金不(bu)(bu)夠雄厚,手(shou)機卡更新速度上不(bu)(bu)去。

 

賬戶準入體系外(wai),還需要的就是APP加固(gu)。

 

所(suo)謂(wei)APP加固,是指對于APP本身的代碼(ma),接(jie)口做封裝和動(dong)態加密,攔截接(jie)口直接(jie)寫(xie)入內容(rong),代碼(ma)破解,沙(sha)盒(he),GPS更改等一系列攻擊行為,簡(jian)單理(li)解為是反外掛也可以。

 

很(hen)多APP對于用戶的錄入內(nei)容其實都是(shi)有限制的,很(hen)多APP甚至不允許用戶錄入內(nei)容,只能選(xuan)擇幾個特定的標簽。

 

但是黑產(chan)在(zai)進行違規(gui)內容滲透的時候(hou),往(wang)往(wang)不(bu)是手動填寫的,而是直接反(fan)編譯本地APP代碼,攔截接口(kou)的動態(tai)信息,然后調用接口(kou)錄入。

 

例(li)如正常(chang)人肯定打不出一些(xie)特殊符號(hao),但(dan)是(shi)通(tong)過接口用機(ji)器寫入(ru),想寫什(shen)么,就(jiu)寫什(shen)么。

 

小紅(hong)書社區中的(de)大量明晃(huang)晃(huang)的(de)違規內容,很(hen)有可能(neng)是由于接口被攻破,遭遇(yu)大量的(de)機(ji)器寫入,這個(ge)在黑產攻防(fang)中很(hen)常(chang)見。

 

通過機器大(da)量灌入垃(la)圾內容(rong)導致競爭(zheng)對手(shou)出現問題,在業(ye)內并不稀奇。

 

所以在賬(zhang)號準入外,也要主(zhu)要APP本身的加固措施。

 

08

 

 

敏感詞過濾,決策(ce)引擎,加盾,APP加固,這(zhe)4套(tao)都做好(需要(yao)坐很(hen)久很(hen)久,這(zhe)是一(yi)個很(hen)大的工程),是不是就高(gao)枕無憂了?

 

不是的,作為內容社區,小紅書還需(xu)要更重要的一套機制,就是用戶內容舉(ju)報機制。

 

只(zhi)靠小(xiao)紅書自己(ji),累死他們也不可能擋掉一切的垃圾內(nei)容,而且使用(yong)策略也好,規則也好,閾(yu)值設置(zhi)比較寬松的話,總有漏網之魚。

 

閾(yu)值設(she)置(zhi)過于嚴格的話,總(zong)會(hui)有(you)被誤(wu)(wu)殺的用戶,被誤(wu)(wu)殺的用戶還會(hui)去(qu)各個論壇(tan)和(he)網絡(luo)媒體發聲,去(qu)譴責小紅書(shu)。

 

在這(zhe)個(ge)好事不出門,壞事傳千里的年代(dai),這(zhe)種負面信息對于(yu)小紅(hong)書(shu)也是一種傷害。

 

而(er)小紅(hong)書最大的特點(dian)就是用戶(hu)自發的參與度高(gao)(gao),所以一套完善的用戶(hu)舉報機制是非(fei)常高(gao)(gao)效的平臺行為(wei)。

 

這套機(ji)制不是(shi)加(jia)一個(ge)所(suo)謂的按鈕點擊這么簡單,用(yong)戶看到的可能(neng)就是(shi)一個(ge)舉(ju)報按鈕。

 

但小紅書需要做的是針對整(zheng)個舉(ju)報(bao)(bao)設(she)計完(wan)整(zheng)的SOP(標(biao)(biao)準作業流(liu)程(cheng)),如何判(pan)定舉(ju)報(bao)(bao)是否(fou)有效,不同舉(ju)報(bao)(bao)內(nei)容的確認(ren)標(biao)(biao)準以及處(chu)罰標(biao)(biao)準,舉(ju)報(bao)(bao)應在什么時間(jian)內(nei)生效,應該(gai)給與舉(ju)報(bao)(bao)用戶怎樣的獎(jiang)勵與支持增(zeng)加積極性(xing)等等等等,這(zhe)也是一個浩大的工程(cheng)。

 

但對于內容社(she)區(qu)而言,用戶自發舉(ju)報(bao)是非常好用的東西。

 

09

 

 

以上內容只是(shi)基(ji)礎的平臺治理體(ti)系(xi),具體(ti)的落地方案,執(zhi)行計劃,原始(shi)變(bian)量及(ji)閾值切分等等,受限于保密協議(yi)和飯碗的原因,我不方便講(jiang)更(geng)多,但足夠(gou)給風控同行做參考了。

 

而(er)且(qie)這些基礎體系,在實際操作中,還面臨(lin)著諸多實務性的難題(ti)以(yi)及場(chang)景契(qi)合(he)的問題(ti),很多問題(ti)都不是簡(jian)單(dan)的風控問題(ti),需要(yao)整個公(gong)司的戰(zhan)略和定位(wei)一起跟(gen)上。

 

 例如(ru)在做特征工程的時候,很(hen)多數(shu)(shu)據(ju)要求(qiu)實時性,數(shu)(shu)倉部門如(ru)何(he)滿足(zu)數(shu)(shu)據(ju)完整性?

 

例(li)如做策略的(de)時候,需(xu)要大量的(de)標準數(shu)據,數(shu)據產品怎么依據業務需(xu)求(qiu)設計表結構以及數(shu)據清(qing)洗?

 

例如評估策略效果(guo)的時候,風控(kong)產品如何設計分流(liu)灰(hui)度來做冠軍挑戰者(ABtest)實現效益(yi)最(zui)大化(hua)?

 

這樣的(de)問題還有很(hen)多,其中很(hen)多都是(shi)牽(qian)一(yi)發而動全身,公司(si)的(de)資源是(shi)有限的(de),公司(si)里也不(bu)是(shi)只有風控,大(da)家要靠著(zhu)業務和營銷吃(chi)飯的(de)。

 

這些(xie)問題(ti),需(xu)要整個(ge)公(gong)司從上而(er)下認識到這個(ge)風險(xian),整體考量(liang)業務和風控的(de)平衡(heng),爭取公(gong)司利益的(de)最大(da)化。

 

在這個互聯網文明大趨勢的浪潮下,內容風控將是很多公司的命門,而(er)諸多先(xian)行者早就靠自(zi)己(ji)的積累吃盡了(le)早期野蠻生(sheng)長的紅利,同(tong)時樹立(li)起了(le)極強的風控壁壘。

 

這些(xie)壁壘需要(yao)大(da)量的(de)時間和(he)資源投入,不(bu)是(shi)一朝一夕就有的(de),全部(bu)都(dou)是(shi)非賣(mai)品。

 

這對于后來者而言,是非(fei)常難(nan)的一件事。

 

但熬過這一劫,就是羽化登(deng)仙。

 

之所(suo)以我(wo)(wo)今(jin)天對小(xiao)紅書說(shuo)了這么多,并不是(shi)我(wo)(wo)喜(xi)歡小(xiao)紅書。

 

 而是(shi)我覺(jue)得,一個活在巨頭陰影下的互聯網(wang)江湖(hu),有點太寂寞了。


相關推薦

工作日 8:30-12:00 14:30-18:00
周六及部(bu)分節假(jia)日提供值班服(fu)務

易(yi)小優
轉人工 ×