TechWeb 文/席安如
萬物皆有鄙視鏈。
據(jù)說在有些互聯(lián)網(wǎng)公司面試的時候,面試官都喜歡問候選人一個問題,“你平時活躍在哪個技術(shù)社區(qū)”?如果答案是GitHub或者StackOverflow,那就是一個加分項(xiàng);如果答案是CSDN,那么很可能成為減分項(xiàng),甚至是不被錄用的判斷依據(jù)之一。
CSDN是中國最大的程序員社區(qū)。在其2023年發(fā)布的新聞稿中,它聲稱自己“擁有超過4500萬注冊用戶”和“6000多萬篇文章”。
讓CSDN在一些面試官眼中成為減分項(xiàng)的關(guān)鍵,正是來自這6000多萬篇文章——它們構(gòu)成了中文互聯(lián)網(wǎng)上極為龐大的內(nèi)容農(nóng)場之一,更關(guān)鍵的是,它帶了一個很不好的頭,稀土掘金、簡書等內(nèi)容平臺也開始主動或被動效仿。
電影院里,一旦前排的人站起來了,后面的觀眾就不得不跟著站起來,才能看得見屏幕。
CSDN就是那個第一個站起來的。
第一代內(nèi)容農(nóng)場:自己做內(nèi)容,外面找流量
內(nèi)容農(nóng)場并非新生事物,而是伴隨著搜索引擎的發(fā)展而出現(xiàn)的“寄生物”。
早在2009年,美國一家名叫Demand Media的內(nèi)容農(nóng)場公司老板就對《連線》雜志(Wired)放出豪言,聲稱要“每個月產(chǎn)出100萬篇文章,相當(dāng)于每年制造四個維基百科”。第二年,也就是2010年,雅虎斥資9000萬美元(約合人民幣6億)收購了另一家同類公司 Associated Content。
要知道,同年美團(tuán)剛從紅杉拿到了1200萬美元的A輪融資,而當(dāng)時如日中天的百度2009年的營收也不足45億元人民幣。內(nèi)容農(nóng)場受“資本家”的青睞程度由此可見一斑。
原因非常簡單,內(nèi)容農(nóng)場同時滿足了“開源”和“節(jié)流”的需求。一方面,從搜索引擎帶來的滾滾流量,為這些網(wǎng)站產(chǎn)生了不少的廣告收入,這也是互聯(lián)網(wǎng)公司最主要的收入來源之一;另一方面,據(jù)說當(dāng)時內(nèi)容農(nóng)場為每篇文章開出的稿費(fèi)僅為3.5美元,遠(yuǎn)低于付給人工撰寫稿件的20美元左右的稿費(fèi)標(biāo)準(zhǔn)。
與這些美國公司不同的是,CSDN成為內(nèi)容農(nóng)場或許并非有意為之,而是歷史發(fā)展之巧合。
海量內(nèi)容只是內(nèi)容農(nóng)場成功的必要條件之一,基本上花錢和堆人頭就能辦到,但是另一個必要條件——獲取流量的門檻就要高許多。在那個年代,人們搜索互聯(lián)網(wǎng)上的內(nèi)容主要依賴的還是搜索引擎。通過技術(shù)手段,讓搜索引擎抓取到頁面,并且將它盡量排到搜索結(jié)果列表的前面,這個技術(shù)叫做“搜索引擎優(yōu)化”,簡稱為SEO。
作為一個技術(shù)社區(qū),CSDN的SEO技術(shù)顯然是足夠強(qiáng)的。至于內(nèi)容的來源,它并沒有像美國人那樣發(fā)稿費(fèi)雇人來寫。當(dāng)時,很多國內(nèi)的技術(shù)牛人喜歡在CSDN博客上發(fā)布文章來分享經(jīng)驗(yàn)和技術(shù),這些文章增加了CSDN的權(quán)重;與此同時,越來越多的后來者和新手也開通了CSDN博客,但是他們更習(xí)慣將它作為學(xué)習(xí)筆記來使用,于是產(chǎn)生了大量的內(nèi)容類似甚至完全相同的文章。
當(dāng)文章數(shù)量達(dá)到某個級別并突破閾值后,搜索引擎終于被攻占了。
十幾年來,搜索引擎對內(nèi)容農(nóng)場的態(tài)度基本上是持否定的,畢竟類似上圖這樣的搜索結(jié)果非常影響用戶體驗(yàn)。不過從實(shí)際情況來看,自從2010年百度最大的競爭對手退出中國市場之后,穩(wěn)坐國內(nèi)搜索引擎頭把交椅的百度,并沒有從根本上——也就是從技術(shù)和規(guī)則上去解決這個問題,相反的,一大批類似的網(wǎng)站如雨后春筍般出現(xiàn)。
現(xiàn)在,你在百度搜索技術(shù)問題的話,除了CSDN之外,首屏出現(xiàn)的大概率還會有博客園、稀土掘金、簡書……以及耳熟能詳?shù)哪菐准以朴嬎銖S商的“技術(shù)社區(qū)”,他們將大量過期的、重復(fù)的技術(shù)文檔復(fù)制來復(fù)制去,一邊浪費(fèi)著自己的服務(wù)器和帶寬,一邊浪費(fèi)著用戶的時間。
面對這個局面,大部分程序員還是選擇了接受,否則CSDN也不會有4500萬用戶了。
第二代內(nèi)容農(nóng)場:搬別人的內(nèi)容,養(yǎng)自己的流量
當(dāng)智能手機(jī)開始普及,手機(jī)流量開始管飽,人們使用互聯(lián)網(wǎng)的方式變了。買東西會在電商APP中搜索,看視頻會在視頻APP中搜索,看小說會在閱讀APP中搜索……瀏覽器和搜索引擎不再成為必經(jīng)之路。
那些新入行的程序員們,也不再是看著CSDN們的博客學(xué)習(xí),B站成了它們的新歡。雖然依然有很多程序員在把博客當(dāng)筆記,但是從搜索到的內(nèi)容來看,明顯是比之前少了。
在這種流量池各自為政的情況之下,新的內(nèi)容農(nóng)場出現(xiàn)了。不過這一次,他們不再自己生產(chǎn)內(nèi)容,而是通過技術(shù)手段,將別人創(chuàng)作的內(nèi)容進(jìn)行二次加工來產(chǎn)生大量內(nèi)容,然后再以此獲得更多的平臺推薦。到了短視頻全面普及之后,這種跡象更加明顯。
與前一個時代不同的是,這種形式的內(nèi)容農(nóng)場,不但更容易得到平臺的支持,用戶對之也更容易接受,因?yàn)槭∪チ俗约核阉鞯穆闊?。所以,除了部分原?chuàng)作者的吐槽之外,倒是鮮見有用戶對此有怨言。
AIGC時代:自己編內(nèi)容,自己有流量
OpenAI一聲炮響,拉著全球網(wǎng)民進(jìn)入了AIGC新時代。
前面說過,形成內(nèi)容農(nóng)場有兩個必要條件:一是內(nèi)容,二是流量。到了AIGC時代,一分鐘內(nèi)可以生成數(shù)篇內(nèi)容類似但又不完全相同的文章,內(nèi)容的數(shù)量和質(zhì)量都遠(yuǎn)超之前。這些AI生成的內(nèi)容迅速出現(xiàn)在微信公眾號、小紅書、知乎之類的內(nèi)容平臺,不過此時仍然處于上一個時代的范疇,AI只負(fù)責(zé)生產(chǎn)內(nèi)容。
直到今年五月,有用戶在使用字節(jié)跳動旗下對話式AI產(chǎn)品“豆包”時發(fā)現(xiàn),其答案的參考來源竟然來自豆包自身生成的內(nèi)容,至此,AI時代的內(nèi)容農(nóng)場初具雛形。
也就是說,如果你日常將對話式AI當(dāng)作與互聯(lián)網(wǎng)交互的入口的話,那么看到的答案完全有可能也是來自AI自身,而這些AI生成的答案中,本身又可能存在不準(zhǔn)確甚至荒謬之處,比如之前廣為流傳的“小帥與小美”(很多電影解說短視頻給男女主角取的名字)就曾被AI當(dāng)作參考答案。
雖然此次“事故”被迅速修復(fù),但是幾乎所有對話式AI都具備這個能力,而且此次被用戶發(fā)現(xiàn),是因?yàn)椤岸拱笔褂米杂械挠蛎╠oubao.com)來生成靜態(tài)頁面,如果使用的是一個看起來和字節(jié)跳動沒有任何關(guān)系的域名的話,那么很可能永遠(yuǎn)都不會被用戶發(fā)現(xiàn)。
立法層面,目前的相關(guān)的法律法規(guī)主要針對的是“有害內(nèi)容”,對于這種低質(zhì)但無害的內(nèi)容并沒有明確約束,所以似乎只能靠廠商的自我約束了。
廠商的確在行動,不過這些行動更多的是在“交互入口”處建立壁壘。比如百度的搜索引擎,將自己的AI“文心一言”生成的答案排在了最上面,這屬于“用魔法打敗魔法”;知乎的AI“知乎直答”也是給自己的數(shù)據(jù)更高權(quán)重。
唯一值得慶幸的是,當(dāng)下對話式AI還沒有成為人們與互聯(lián)網(wǎng)交互的主流,人們還有時間來完善這個體系,避免AI內(nèi)容農(nóng)場的大規(guī)模出現(xiàn)。
我們可以怎么辦?
第一代內(nèi)容農(nóng)場時代,程序員們尚且可以通過各種技術(shù)手段——比如使用瀏覽器插件uBlacklist在搜索結(jié)果中排除指定的網(wǎng)站——來規(guī)避內(nèi)容農(nóng)場出現(xiàn)在搜索引擎的結(jié)果中,或者干脆使用工具來阻斷對這些網(wǎng)站的訪問,但是普通人無能為力。
第二代內(nèi)容農(nóng)場時代,只有少部分人會選擇去屏蔽那些搬運(yùn)者,大部分人都選擇了接受投喂。
面對即將到來的AI內(nèi)容農(nóng)場,人們可以怎么辦?你又會怎么辦?(席安如)
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )