AI時代,互聯(lián)網(wǎng)情色江湖的攻防戰(zhàn)

有人的地方就有江湖。有互聯(lián)網(wǎng)的地方就有色流大軍。人工智能時代,在這場用色情變現(xiàn)與用人工智能抵御變現(xiàn)的博弈戰(zhàn)中,誰更勝一籌?

  貪嗔癡、奢淫逸、黃賭毒,人有七情六欲。每一類情欲都是巨大的風(fēng)口,加以利用便是千億級的產(chǎn)業(yè)。游戲、音樂、夜場滿足人們對犬馬聲色的渴求;電影、書籍、報刊滿足人們對窺視的好奇;門戶、直播、微信的出現(xiàn),更是滋生了巨大的色情產(chǎn)業(yè)江湖。

  暗流涌動:進軍互聯(lián)網(wǎng)+情色

  互聯(lián)網(wǎng)的颶風(fēng),正以摧枯拉朽之勢改變或顛覆著傳統(tǒng)商業(yè)模式。如出行、醫(yī)療、零售、金融等領(lǐng)域,而地下色情產(chǎn)業(yè)更是利用互聯(lián)網(wǎng)開辟出賣淫之外的新戰(zhàn)場——色情直播、一夜情等。

  戰(zhàn)場有了,玩家如何入局?色流產(chǎn)業(yè)鏈應(yīng)運而生。這些“戰(zhàn)場”都處于隱蔽地帶,需要一批專員接送玩家,于是催生出了一批引路人,這些人組成了色流大軍——專門在網(wǎng)上發(fā)布色情信息,以吸引流量,從而變現(xiàn)。

  而另一撥人為營造綠色網(wǎng)絡(luò)環(huán)境,需不斷封殺發(fā)布情色信息的色流大軍。1978年,第一封互聯(lián)網(wǎng)垃圾郵件的出現(xiàn),打響了雙方攻防大戰(zhàn)的第一槍。

  到2008年,戰(zhàn)斗已打了近三十年,戰(zhàn)場從網(wǎng)易、新浪等門戶網(wǎng)站、打到百度貼吧、騰訊QQ、微信等。顯然,線上色情信息傳播渠道,基本集中在當(dāng)下各大門戶網(wǎng)站和社交平臺。因為,只有最火爆的產(chǎn)品,才能吸引更火爆的色情流量。

  2008年的博客,獨領(lǐng)風(fēng)騷,傲視互聯(lián)網(wǎng)群雄。此時,一群躲在暗處的人正對著博客虎視眈眈,朱小虎(化名),正是這群人中的一個。

  初中畢業(yè)的朱小虎,工作兩年,那年他待業(yè)在家,整日沉浸網(wǎng)游《真三國無雙》之中。兩個月后的一天深夜,他的QQ收到了一個消息,是他一個在城市打工的初中同學(xué)發(fā)來的——問他是否有意一起干大事——足不出戶月入上萬。有這樣的工作,他自然高興加入。

  當(dāng)時色流大軍正處于文本信息時代,朱小虎的工作主要是注冊帳號、在網(wǎng)易博客等各大互聯(lián)網(wǎng)陣地復(fù)制粘貼曖昧消息,并留下QQ號碼,達到引流目的,根據(jù)每個QQ號吸引人數(shù)的多少進行提成。

  很快色流大軍和網(wǎng)易內(nèi)容安全部展開了攻防拉鋸戰(zhàn)。同年,現(xiàn)任網(wǎng)易云安全(易盾)CTO朱浩齊加入網(wǎng)易,負責(zé)網(wǎng)易博客內(nèi)容安全。

  網(wǎng)易云安全(易盾)CTO朱浩齊告訴Xtecher,對于這類色情文本信息處理,從技術(shù)層面相對容易,只需通過抓取關(guān)鍵詞、查詢同一時段留言帳號的IP是否相同,通過長期監(jiān)測帳號行為,系統(tǒng)基本就可過濾大部分色情等垃圾信息。

  正如朱小虎表示,剛?cè)胄心菚?,沒什么經(jīng)驗,沒有什么好辦法回避網(wǎng)站安全檢測的慧眼,發(fā)出的消息第二天可能就被刪除,吸引不到流量。但以朱小虎為代表的黃色信息傳播者會就此收手嗎?

  地下組織:銳不可當(dāng)?shù)纳鞔筌?/p>

  隨著技術(shù)的變革,色流大軍開始組織化,團伙化,分工與合作明確,上下游產(chǎn)業(yè)鏈日漸成熟。

  在朋友的指導(dǎo)下,朱小虎逐漸學(xué)會了文本上的變種,通過諧音、異形字、敏感詞之間加入亂碼等形式來騙過系統(tǒng)審查?!澳莻€時候被刪得沒那么快了,收入也高了一點,有不同項目來找我們?!?/p>

  朱小虎說的“項目”指的是他們的客戶,這些客戶有的是賭場,有的是發(fā)票公司,更多的是色情組織。

圖片1.png

  (消息自動發(fā)送軟件)

  通常色情組織負責(zé)人會給他們幾個QQ、微信帳號,讓他們將客戶吸引到這些帳號里,每個色流客戶價格從幾毛到幾元不等。這條色流產(chǎn)業(yè)鏈已經(jīng)逐漸形成規(guī)?;?。

  朱浩齊告訴Xtecher,當(dāng)有人提出尋找潛在色情客戶的需求后,一些團隊打著“互聯(lián)網(wǎng)營銷推廣”的名義承接業(yè)務(wù)。之后,團隊分析訂單技術(shù)難度。要想吸引更多潛在用戶,需要在熱門產(chǎn)品下曝光。但這些產(chǎn)品帳號注冊需要驗證碼甚至短信驗證,如果全部自己操作無疑會加大投入成本,于是他們開始找尋下家合作。

  在這條色流產(chǎn)業(yè)鏈上,有的黑產(chǎn)負責(zé)注冊大量帳號,這些帳號幾天登陸一次,發(fā)貼、回復(fù),其行為和普通用戶沒有區(qū)別,屬于色流產(chǎn)業(yè)中的高端帳號。一旦等到客戶出現(xiàn),便批量將帳號賣出。

  朱浩齊表示對于這些帳號,網(wǎng)易云安全(易盾)會將其列入灰名單,待其有違規(guī)舉動,立即封殺。

  此外,有的黑產(chǎn)提供IP資源,研發(fā)自動評論工具,利用病毒控制大量肉雞,只需將帳號和IP輸入工具內(nèi),便會自動切換帳號和IP進行評論發(fā)布。

  有的黑產(chǎn)研發(fā)驗證碼、短信驗證打碼平臺,只需將驗證碼的圖片通過API發(fā)送到平臺,就能得到正確的驗證碼結(jié)果。

  黑色產(chǎn)業(yè)鏈的形成,使得色流大軍從當(dāng)年的散兵游勇,升級到了正規(guī)軍兵團,其戰(zhàn)斗力不可同日而語。色流大軍開始攻城略地,所到之處,色情信息遍地,各大門戶、論壇苦不堪言。新浪、網(wǎng)易博客,QQ空間等產(chǎn)品都曾遭受色流大軍的攻擊。也正是這個節(jié)點,網(wǎng)易迎來了歷史上最強勁的一次攻擊。

  攻與防:道一尺魔一丈

  “哪個地方最火爆,我們就去哪里發(fā)帖,不管是門戶還是游戲網(wǎng)站。新浪,網(wǎng)易,一些樓鳳論壇,英雄聯(lián)盟這些地方我們都發(fā)?!敝煨』⒈硎?,哪里屌絲多,他們就去哪里,“老司機論壇才有轉(zhuǎn)化率”,相比一些文學(xué)論壇他們就發(fā)的少——“這些地方的人,精得很,轉(zhuǎn)化率太低?!?/p>

  形成產(chǎn)業(yè)鏈后,最高時朱小虎可日進萬元。他只需專注利用工具發(fā)帖,得到足夠多的流量后,自然有人給他報酬?!案叩臅r候一天有近萬人加我?!薄@是朱小虎攻城略地的戰(zhàn)果。按每人一元計算,如果流量全部被收購,朱小虎的一天收入不菲。

  近萬的流量如何生成?有一部分就是從各大博客轉(zhuǎn)換而來的。當(dāng)時的黑產(chǎn)大軍進行了技術(shù)升級,不再僅限于文字攻擊。

  朱小虎有著用色情信息攻擊博客群的實戰(zhàn)經(jīng)驗。2009年的一個夜里,他收到了消息,當(dāng)天夜里他需要和團隊一起攻城略地。離出擊的時間越來越近,QQ頭像閃動,打開對話框跳出兩個字——出擊!

  無法確定是否在同一天,同樣在2009年的一個夜晚,朱浩齊接到值班人員的告急電話——博客正被大量色流信息攻擊。

  養(yǎng)號千日,用號一時,這一回色流大軍使用了許多平日里“表現(xiàn)良好,無不良記錄”的帳號,并且通過發(fā)布大量大尺度卻不違規(guī)的美女照片,吸引網(wǎng)友點擊他們的帳號,并在帳號主頁里留下并不違規(guī)的交友信息與QQ號。

  此舉騙過了系統(tǒng),很快大量情色信息充斥到了網(wǎng)易博客。值班人員發(fā)現(xiàn)后立刻通知朱浩齊,查明原因后,網(wǎng)易緊急調(diào)動幾百人開始對這些大尺度照片進行人工刪除,奮戰(zhàn)終日,方才控制住局勢。

  網(wǎng)易云安全(易盾)CTO朱浩齊告訴Xtecher,當(dāng)時參與刪帖的同事都戲稱那是公司發(fā)放的“福利”。

  此后色流大軍的攻擊方式日益多樣化,攻擊力度亦與日俱增。許多色流從業(yè)者偽裝成用戶,打電話到網(wǎng)易安全部,套問自己的帳號通過什么手段被封殺,繼而改變策略繼續(xù)攻擊。朱浩齊告訴Xtecher,2008至2009年博客類產(chǎn)品飛速增長,一年間網(wǎng)易博客估計刪除垃圾信息數(shù)十億條,封禁垃圾用戶上千萬。

圖片2.png

  【2015年網(wǎng)易清理的垃圾信息,資料來自網(wǎng)易云安全(易盾)】

  朱浩齊表示,數(shù)據(jù)顯示,這背后的攻擊,多數(shù)來自一線城市的郊區(qū)地帶。在這些地方,能便捷獲得各類硬件、軟件等技術(shù)支持。

  垃圾黑產(chǎn)的團伙化以及追逐流量而進行的攻擊,成了網(wǎng)易成立專業(yè)內(nèi)容安全部門的觸發(fā)點。

  人工智能:力挽狂瀾

  隨著互聯(lián)網(wǎng)產(chǎn)品日趨多樣化,色情信息的傳播路徑和形式越發(fā)“高級”。比如,視頻直播的出現(xiàn)讓色流大軍在熱門直播平臺的各個角落里散布垃圾內(nèi)容:彈幕,評論,昵稱,頭像,簽名,用戶資料,甚至直接參與違法直播表演。

  這令鑒黃人員苦不堪言。他們24小時輪流值守,查看直播間是否有色流彈幕、有無大尺度露點等,以阻止色情信息的傳播,甚至有的男性鑒黃人員因為長期觀看大尺度照片、視頻,到家缺乏精力,被女友責(zé)難。

  顯然,繼續(xù)用傳統(tǒng)的人力手腕來阻止色流信息的傳播,已經(jīng)變得勢單力薄了。色流大軍的猖狂不絕,迫使網(wǎng)易在2009年開始提升對黃色信息的狙擊能力,研發(fā)更先進的算法。當(dāng)時網(wǎng)易已將膚色識別,紋理識別等應(yīng)用到反色流領(lǐng)域,但膚色識別同樣存在缺點——系統(tǒng)將黃色樹葉、黃色的沙子當(dāng)做了色情圖片予以屏蔽。

  隨后,網(wǎng)易嘗試使用非機器學(xué)習(xí)領(lǐng)域的算法與模型,但基于當(dāng)時的算法、硬件等生態(tài)環(huán)境的不夠成熟,最后試驗出的效果總無法滿足實際操作情況。

  顯然,此時的網(wǎng)易仍舊處在被動的防御狀態(tài),直到人工智能的出現(xiàn)。

  2012網(wǎng)易開始組建內(nèi)容安全部門,即網(wǎng)易云安全(易盾),并進一步嘗試人工智能在內(nèi)容安全領(lǐng)域的應(yīng)用。而色流大軍早已將垃圾信息進行各種的演繹,試圖騙過系統(tǒng)識別。

圖片3.png

  (色情消息變種圖)

  道高一尺,魔高一丈。其中以最后兩條較為隱蔽,傳統(tǒng)文本失效后,色流大軍發(fā)布了各種Unicode符號替換文本內(nèi)容,如圖中汽車,并修改帳號昵稱,更在頭像中留下微信號碼,以傳播色情信息。如果加上IP,帳號等不停變化,抓取難度便大幅提升。甚至,某些色流大軍使出了凌波微步,傳統(tǒng)檢測方式單獨處理昵稱或者評論時,都可能失效。

  對此,網(wǎng)易云安全(易盾)設(shè)計開發(fā)了“所見即所得”的過濾系統(tǒng),盡可能真實地還原產(chǎn)品數(shù)據(jù)展示形式,將昵稱和評論內(nèi)容一起做語義分析,也會將頭像圖片經(jīng)過機器識別后跟評論內(nèi)容一起審核。

  隨著語義理解、圖像識別等智能文本、圖像鑒黃登場,大批鑒黃人員被從中解放了出來。除了網(wǎng)易云安全(易盾),更有達觀數(shù)據(jù)、極限元等科技公司披堅執(zhí)銳,以阻止色流信息的傳播。

  搏殺之利器:文本、語言、圖像

  2015年下半年,達觀數(shù)據(jù)CEO陳運文離開閱文集團(騰訊閱讀和盛大文學(xué)合并),創(chuàng)辦“達觀數(shù)據(jù)”。同年年底“達觀”完成1000萬元天使輪融資,2017年獲5000萬元融資,專注提供大數(shù)據(jù)技術(shù)服務(wù),其中一項業(yè)務(wù)是:文本處理功能。該功能可以自動提取關(guān)鍵詞、打標簽、文本內(nèi)容檢測、分類等。

  陳運文告訴Xtecher,在文本信息層面,他們通過生成對抗網(wǎng)絡(luò),可以刪除過濾色流信息。

  “通過人工智能防御系統(tǒng),在實戰(zhàn)中不斷升級,將最新出現(xiàn)的各類色流變種信息,整合到模型中,繼而達到系統(tǒng)自我識別預(yù)判的目的,能將色流信息的各種變形變換,中間跳字等變種識別出來,加以屏蔽?!彼M一步解釋“達觀數(shù)據(jù)”絞殺不良信息的本事。

  陳運文做出了一個直觀的比喻,“我們做的就是抗生素,當(dāng)然病毒會不斷變異,我們不斷升級抗生素的殺菌能力,有點像打疫苗?!?/p>

  有了人工智能做出的疫苗系統(tǒng),下次色流病菌入侵的時候,就將被自動免疫?!爱?dāng)然以上針對的只是文本層面的色流信息,而對于圖像層面的色流信息,就需要用到圖像識別。”原因是,圖片中的色流信息千變?nèi)f化,在圖片識別上,色流工作者會更多采用非常規(guī)字體貼到圖片上,比如將普通字體變形、加入藝術(shù)字等,加大了人工智能識別難度。

  顯然,清除帶有黃色信息的圖片需要從技術(shù)層面強化。

  對此,另一家專注智能語音、計算機視覺等領(lǐng)域的人工智能技術(shù)公司----“極限元”在圖像識別鑒黃領(lǐng)域也有自己的建樹。極限元聯(lián)合創(chuàng)始人馬驥告訴Xtecher,對于色流圖片中的字符內(nèi)容、二維碼等信息,主要通過對字符、二維碼的檢測、定位,來識別其中的內(nèi)容信息。另一方面,通過深度學(xué)習(xí)技術(shù),基于大量圖片數(shù)據(jù),訓(xùn)練圖像視頻識別模型,用以識別圖片及視頻中的涉黃內(nèi)容。

  馬驥表示,目前直播平臺涉黃圖像檢測的準確率高達99%以上,誤報率低于1%,需要客服進行人工復(fù)核的比例不超過3%。人工復(fù)核后的數(shù)據(jù)會被收集起來進行迭代訓(xùn)練,這樣可以不斷提升識別的準確率。

圖片4.png

  (極限元在線直播音視頻敏感信息檢測圖)

  而除了使用文字和圖片繼續(xù)色情引流之外,色情傳播的形式更向動態(tài)化演進。比如,女主播還會通過語音播報微信號碼,讓觀看直播的男性添加微信,此類引流手段甚為快捷,兩個小時即可引來五六百的流量,然后通過視頻軟件“開車”。觀眾只需發(fā)送幾十元的紅包,即可“上車”觀看女主播線上舉辦的閉門大尺度直播盛宴。許多女主播,一晚收入數(shù)千、上萬,月入十余萬。

  為此,除了文本和圖像方面對色情信息的識別,各大人工智能技術(shù)平臺更將智能語音應(yīng)用到了直播領(lǐng)域。極限元通過深度學(xué)習(xí)技術(shù),識別和分析出語音中的信息內(nèi)容,從而判斷出語音內(nèi)容中是否含有敏感信息。使得在文本和圖像外讓反色流多一個觀察維度。此外,極限元還擁有智能語音、聲紋、圖像識別等一系列人工智能技術(shù),已和國家網(wǎng)信辦、公安部、搜狗、奇虎360等機構(gòu)合作。

  而網(wǎng)易云安全(易盾)更是專門為直播行業(yè)打造智能鑒黃系統(tǒng),代替鑒黃師,解決視頻鑒黃、互動過濾,將用戶簽名、頭像等都納入審核管理。

  百戰(zhàn)不殆:新時代的色流大軍

  基于圖像識別技術(shù)的視頻涉黃檢測,準確率可以達到99%以上,通過對人工智能的應(yīng)用,極大地將人在對抗色流大軍的繁瑣工作中解放出來,然而即便如此,這場戰(zhàn)斗仍舊沒有打完。

  原因是,目前人工智能在色流抵御的某些環(huán)節(jié)技術(shù)能力仍薄弱。比如對于新增的色流傳播形式和途徑缺乏了解,等待人工標注數(shù)據(jù),學(xué)習(xí)建模后有一定滯后性。

  正如極限元馬驥所言,“人是懂得暗示的,除了顯而易見的敏感關(guān)鍵詞,還不斷使用大量隱晦的關(guān)聯(lián)詞語。” 比如,色流大軍經(jīng)常肆無忌憚地出現(xiàn)在LOL游戲、直播中,用軟件自動發(fā)布內(nèi)含隱晦色情信息和聯(lián)系方式的彈幕,繼而得到流量。

  此外,除了在開放性的論壇、門戶網(wǎng)站、直播間等平臺發(fā)布色流信息外,色流大軍更是將戰(zhàn)斗力轉(zhuǎn)移到微信等封閉式產(chǎn)品中。

圖片5.png

  (群控手機)

  打開微信附近的人,隨意可見各類嫵媚女性,常有美女主動打招呼,相聊甚歡,但背后,控制這個美女帳號的,可能是一個猥瑣大叔。

  當(dāng)一個帳號添加足夠人數(shù)后,會被賣給各類情色會所、化妝品公司、理財機構(gòu)等。朱小虎表示,這些機構(gòu)買下微信帳號后,通過朋友圈展示產(chǎn)品、情色資源等,以達到流量變現(xiàn)的目的,而這其中以色情流量轉(zhuǎn)換率最高。

  因為微信聊天內(nèi)容屬于隱私,目前似乎還難以監(jiān)管,所以龐大的色流大軍不斷涌入,渴望分一杯羹。

  隨著互聯(lián)網(wǎng)傳播媒介的不斷變化,色流大軍亦緊隨時代步伐,不放過任何可利用的產(chǎn)品與漏洞。

  雖然人工智能技術(shù)被應(yīng)用于反色流,但網(wǎng)易云安全(易盾)CTO朱浩齊表示,色流信息并沒有因此而減少,反而隨著科技的進步色流攻擊越來越多。

  色流產(chǎn)業(yè)有多大的規(guī)模,目前難以預(yù)測,騰訊、新浪、網(wǎng)易等各家數(shù)據(jù)都是封閉的,難以以一家數(shù)據(jù)預(yù)測產(chǎn)業(yè)鏈規(guī)模。

  從傳統(tǒng)互聯(lián)網(wǎng)博客,到移動互聯(lián)網(wǎng)的微信、直播等,隨著互聯(lián)網(wǎng)技術(shù)和產(chǎn)品形態(tài)的演進,帶寬的增加、群控設(shè)備的研發(fā)等,色流大軍發(fā)布垃圾消息的門檻越來越低,垃圾信息會有更多演繹。

  而色流大軍難以一舉殲滅,產(chǎn)業(yè)的背后,站著一支龐大的技術(shù)力量。朱浩齊告訴Xtecher,許多黑客為了證明自己,會率先研發(fā)最新工具,以攻破各大網(wǎng)站的反垃圾系統(tǒng)。甚至各大網(wǎng)站的反垃圾技術(shù)還落后于黑客開發(fā)的攻擊系統(tǒng)。

  黑產(chǎn)大軍躲在暗處,打一槍換一炮,四處游擊,防不勝防。從第一封垃圾郵件打響的第一槍,到如今數(shù)十年過去,這條地下黑色產(chǎn)業(yè)鏈非但沒有被根治,反而愈演愈烈。

  正所謂, 有人的地方就有江湖。有互聯(lián)網(wǎng)的地方就有色流大軍。伴隨著互聯(lián)網(wǎng)產(chǎn)品的層出不窮,也將有技術(shù)升級的色流大軍投身其中。這場人工智能時代的掃黃戰(zhàn)仍將繼續(xù)……

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-05-27
AI時代,互聯(lián)網(wǎng)情色江湖的攻防戰(zhàn)
有人的地方就有江湖。有互聯(lián)網(wǎng)的地方就有色流大軍。人工智能時代,在這場用色情變現(xiàn)與用人工智能抵御變現(xiàn)的博弈戰(zhàn)中,誰更勝一籌?

長按掃碼 閱讀全文