">

AI制造網(wǎng)絡(luò)垃圾:舊互聯(lián)網(wǎng)正在消亡,新網(wǎng)絡(luò)艱難中誕生

網(wǎng)易科技報(bào)道6月27日消息,最近幾個(gè)月,種種跡象表明,互聯(lián)網(wǎng)的風(fēng)向已經(jīng)變了。

谷歌搜索試圖取消經(jīng)典的10個(gè)藍(lán)色鏈接頁(yè)面、推特被聊天機(jī)器人占領(lǐng)、亞馬遜和TikTok變得垃圾化。各大在線媒體也在不斷縮減人員,而招聘“人工智能編輯”的廣告要求每周產(chǎn)出200至250篇文章。電商網(wǎng)站Etsy上充斥著“AI生產(chǎn)的廢品”。聊天機(jī)器人正參與其中,造成了大量的信息誤導(dǎo)。LinkedIn正在利用AI來(lái)吸引疲憊的用戶,Snapchat和Instagram正希望機(jī)器人在你的朋友不在的時(shí)候與你交流。Reddit用戶正在抗議,Stack Overflow版主發(fā)起罷工。互聯(lián)網(wǎng)檔案館(Internet Archive) 正在與數(shù)據(jù)爬蟲(chóng)作斗爭(zhēng),而“AI正在破壞維基百科”。

舊互聯(lián)網(wǎng)正在消亡,而新互聯(lián)網(wǎng)正在艱難地誕生。

互聯(lián)網(wǎng)一直在消亡,這一點(diǎn)毫不意外。多年以來(lái),應(yīng)用程序一直在奪取網(wǎng)站的流量,而算法則使得人們的注意力時(shí)間越來(lái)越短。但在2023年,網(wǎng)絡(luò)再次面臨消亡的威脅,人工智能成為新的催化劑。

人工智能超越了互聯(lián)網(wǎng)的規(guī)模能力

多年前,網(wǎng)絡(luò)曾經(jīng)是個(gè)人創(chuàng)造內(nèi)容的地方。人們制作主頁(yè)、論壇和郵件列表,并從中賺取一些小錢。然后,公司認(rèn)為他們可以做得更好,創(chuàng)建了功能豐富的平臺(tái),向所有人開(kāi)放。他們提供了一個(gè)盒子,我們用文字和圖片填充,其他人來(lái)瀏覽。這些公司都在追求規(guī)模效應(yīng),因?yàn)橹灰凶銐蚨嗟娜司奂谝黄?,通常就有賺錢的機(jī)會(huì)。但人工智能改變了這一切。

人工智能系統(tǒng)(特別是生成式模型)憑借更多的資金和計(jì)算能力,可以輕松擴(kuò)大規(guī)模。它們能夠生成大量的文本、圖像,甚至音樂(lè)和視頻。它們的產(chǎn)出可能超過(guò)我們所依賴的新聞、信息和娛樂(lè)平臺(tái)。然而,這些系統(tǒng)的質(zhì)量通常很差,它們是以一種寄生在當(dāng)前網(wǎng)絡(luò)上的方式構(gòu)建的。

這些模型依賴于上一個(gè)網(wǎng)絡(luò)時(shí)代的數(shù)據(jù)進(jìn)行訓(xùn)練,無(wú)法完美地重建這些數(shù)據(jù)。公司從開(kāi)放的網(wǎng)絡(luò)中抓取信息,將其提煉成機(jī)器生成的內(nèi)容,成本低廉但可靠性不高。然后,這些產(chǎn)品與之前的平臺(tái)競(jìng)爭(zhēng)用戶的注意力。網(wǎng)站和用戶正在關(guān)注這些變化,試圖決定如何適應(yīng)新的趨勢(shì)。

近幾個(gè)月來(lái),Reddit、維基百科、Stack Overflow和谷歌等受歡迎的網(wǎng)站上的討論和實(shí)驗(yàn)揭示了人工智能系統(tǒng)帶來(lái)的壓力。

Reddit宣布大幅提高訪問(wèn)其API的費(fèi)用,版主們進(jìn)行抗議。Reddit高管表示,這是對(duì)人工智能公司抓取其數(shù)據(jù)的回應(yīng)。Reddit創(chuàng)始人兼首席執(zhí)行官史蒂夫·霍夫曼(Steve Huffman)稱:“Reddit的數(shù)據(jù)庫(kù)非常有價(jià)值,我們不需要將這些價(jià)值全部免費(fèi)奉獻(xiàn)給全球最大的幾家公司?!贝送?,Reddit試圖在今年晚些時(shí)候進(jìn)行IPO之前從該平臺(tái)榨取更多收入。Reddit的舉動(dòng)表明,數(shù)據(jù)抓取對(duì)當(dāng)前網(wǎng)絡(luò)既是威脅又是機(jī)遇,并促使公司重新考慮平臺(tái)的開(kāi)放性。

維基百科對(duì)數(shù)據(jù)抓取非常熟悉,谷歌長(zhǎng)期以來(lái)一直使用其信息支持“知識(shí)面板”。近年來(lái),這家搜索巨頭開(kāi)始為這些信息付費(fèi)。但維基百科的版主們正在討論如何使用功能強(qiáng)大的新人工智能語(yǔ)言模型為網(wǎng)站撰寫(xiě)文章。他們敏銳地意識(shí)到與這些系統(tǒng)相關(guān)的問(wèn)題,這些系統(tǒng)可能會(huì)編造誤導(dǎo)性信息,但他們不得不承認(rèn)它們?cè)谒俣群头秶矫婢哂忻黠@優(yōu)勢(shì)。在線社區(qū)教授、《你應(yīng)該相信維基百科嗎?》(Should You Believe Wikipedia?)一書(shū)的作者艾米·布魯克曼(Amy Bruckman)表示:“我不認(rèn)為將人工智能生成的內(nèi)容作為初稿有什么錯(cuò),但每一點(diǎn)都必須經(jīng)過(guò)核實(shí)?!?/p>

ChatGPT生成的答案錯(cuò)誤率很高

Stack Overflow提供了一個(gè)類似但更極端的例子。像Reddit一樣,Stack Overflow版主也在罷工,他們同樣擔(dān)心機(jī)器生成內(nèi)容的質(zhì)量。當(dāng)ChatGPT去年上線時(shí),Stack Overflow成為第一個(gè)禁止其輸出的主要平臺(tái)。版主們當(dāng)時(shí)寫(xiě)道:“盡管ChatGPT生成的答案錯(cuò)誤率很高,但它們通??雌饋?lái)可能是正確的,而且答案很容易生成?!庇捎谂判蚪Y(jié)果需要花費(fèi)太多時(shí)間,版主們決定完全禁止它。

然而,Stack Overflow的管理層另有打算。此后,該公司通過(guò)增加阻止用戶發(fā)布人工智能內(nèi)容所需的證據(jù),從根本上扭轉(zhuǎn)了這一禁令,并宣布希望利用這項(xiàng)技術(shù)。與Reddit類似,Stack Overflow計(jì)劃向那些自己構(gòu)建人工智能工具并收集數(shù)據(jù)的公司收費(fèi),可能是為了與它們競(jìng)爭(zhēng)。Stack Overflow與版主們的爭(zhēng)執(zhí)在于網(wǎng)站的標(biāo)準(zhǔn)以及誰(shuí)來(lái)執(zhí)行這些標(biāo)準(zhǔn)。版主們認(rèn)為人工智能的輸出不可信,但高管們認(rèn)為值得冒險(xiǎn)。

然而,與谷歌正在發(fā)生的變化相比,這些困難都顯得微不足道。谷歌搜索為現(xiàn)代網(wǎng)絡(luò)經(jīng)濟(jì)提供了保障,將注意力和收入分散到大部分互聯(lián)網(wǎng)上。隨著B(niǎo)ing AI和ChatGPT作為替代搜索引擎變得越來(lái)越流行,谷歌開(kāi)始采取行動(dòng),并試驗(yàn)用人工智能生成的摘要取代傳統(tǒng)的10個(gè)藍(lán)色鏈接。如果谷歌繼續(xù)實(shí)施這一計(jì)劃,將迎來(lái)巨大的變革。

科技網(wǎng)站Tom’s Hardware的總編輯阿夫拉姆·皮爾奇(Avram Piltch)在一篇關(guān)于谷歌人工智能搜索測(cè)試版的文章中強(qiáng)調(diào)了其中的某些問(wèn)題。皮爾奇稱,谷歌的新系統(tǒng)實(shí)質(zhì)上是一個(gè)“抄襲引擎”。它的人工智能生成摘要經(jīng)常逐字逐句地從網(wǎng)站上復(fù)制文本,但將這些內(nèi)容放在源鏈接上方,導(dǎo)致它們?nèi)狈α髁俊H绻@種新的搜索模式成為常態(tài),它可能會(huì)損害整個(gè)網(wǎng)絡(luò)。收入拮據(jù)的網(wǎng)站可能會(huì)被擠出市場(chǎng),而谷歌自己也將耗盡可供重新打包的人工生成內(nèi)容。

人工智能領(lǐng)域的變化(基于他人的工作生成廉價(jià)的內(nèi)容)正在推動(dòng)這種變化,如果谷歌繼續(xù)當(dāng)前的人工智能搜索體驗(yàn),其影響將很難預(yù)測(cè)。這可能破壞我們目前認(rèn)為有用的網(wǎng)絡(luò),從產(chǎn)品評(píng)論到食譜博客、業(yè)余愛(ài)好者主頁(yè)、新聞媒體和維基。網(wǎng)站可以通過(guò)封鎖入口和收費(fèi)來(lái)保護(hù)自己,但這也將對(duì)網(wǎng)絡(luò)經(jīng)濟(jì)進(jìn)行巨大重組。最終,谷歌可能會(huì)殺死為其創(chuàng)造價(jià)值的生態(tài)系統(tǒng),或者以不可逆轉(zhuǎn)的方式改變它,以至于自己的生存也受到威脅。

然而,如果讓人工智能掌控局面,并開(kāi)始向大眾提供信息,會(huì)發(fā)生什么?會(huì)有什么不同嗎?

目前的證據(jù)表明,它會(huì)降低網(wǎng)絡(luò)的總體質(zhì)量。正如皮爾奇在他的評(píng)論中所指出的那樣,盡管人工智能有重新組合文本的能力,但最終創(chuàng)造底層數(shù)據(jù)的是人類,無(wú)論是核實(shí)事實(shí)的記者,還是遇到電池問(wèn)題的Reddit用戶,他們樂(lè)意分享解決問(wèn)題的方法。相比之下,人工智能語(yǔ)言模型和聊天機(jī)器人生成的信息往往是不正確的。更棘手的是,當(dāng)它們出錯(cuò)時(shí),很難發(fā)現(xiàn)這些錯(cuò)誤。

舉個(gè)例子,今年早些時(shí)候,筆者研究人工智能代理時(shí)發(fā)現(xiàn)了一個(gè)問(wèn)題。這類系統(tǒng)使用像ChatGPT這樣的語(yǔ)言模型,與網(wǎng)絡(luò)服務(wù)連接,代表用戶訂購(gòu)雜貨或預(yù)訂航班。推特上有很多人都在稱贊這項(xiàng)技術(shù)的潛力,于是筆者想象了一個(gè)場(chǎng)景:一家防水鞋公司想要進(jìn)行一些市場(chǎng)調(diào)研,于是便求助AutoGPT(一個(gè)建立在OpenAI語(yǔ)言模型之上的系統(tǒng)),來(lái)生成一份關(guān)于潛在競(jìng)爭(zhēng)對(duì)手的報(bào)告。

生成的內(nèi)容基本上是可預(yù)測(cè)的。它列出了五家公司,并列出了它們產(chǎn)品的優(yōu)點(diǎn)和缺點(diǎn)。AutoGPT寫(xiě)道:“(某某品牌)是一家出色的戶外裝備和鞋類品牌”、“他們的防水鞋有多種樣式”、“他們?cè)谑袌?chǎng)上的價(jià)格具有競(jìng)爭(zhēng)力”。你可能會(huì)認(rèn)為這些內(nèi)容太過(guò)陳腐,幾乎沒(méi)有用處(你說(shuō)得沒(méi)錯(cuò)),但是這些信息也是有微妙錯(cuò)誤的。

人工智能生成內(nèi)容往往隱含錯(cuò)誤

為了檢查報(bào)告內(nèi)容,筆者請(qǐng)Reddit上著名版主克里斯(Chris)進(jìn)行了核對(duì)??死锼贡硎?,這份報(bào)告基本上是憑空捏造的。他說(shuō):“盡管內(nèi)容很多,但沒(méi)有真正的價(jià)值?!彼鼪](méi)有提到一些重要因素,比如男女鞋的區(qū)別或所用的面料類型。它錯(cuò)誤地將網(wǎng)絡(luò)曝光率更高的品牌列為更有價(jià)值的品牌??死锼贡硎荆偟膩?lái)說(shuō),這份報(bào)告不專業(yè),大部分都是猜測(cè)?!叭绻腥藛?wèn)我同樣的問(wèn)題,我會(huì)給出完全不同的答案,”他說(shuō)。“接受人工智能的建議,很可能會(huì)導(dǎo)致腳受傷?!?/p>

這與Stack Overflow版主們的抱怨相似,他們認(rèn)為人工智能生成的錯(cuò)誤信息是隱蔽的,因?yàn)橥ǔ2蝗菀装l(fā)現(xiàn)。人工智能系統(tǒng)給出的報(bào)告看起來(lái)很好,但沒(méi)有基于現(xiàn)實(shí)世界的經(jīng)驗(yàn),所以需要時(shí)間和專業(yè)知識(shí)進(jìn)行分析。如果機(jī)器生成的內(nèi)容取代了人類的創(chuàng)作,我們將很難(甚至不可能)完全描繪出這種損害。是的,人類也會(huì)創(chuàng)造大量錯(cuò)誤信息,但如果人工智能系統(tǒng)扼殺了目前人類專業(yè)知識(shí)蓬勃發(fā)展的平臺(tái),那么糾正我們集體錯(cuò)誤的機(jī)會(huì)就會(huì)減少。

人工智能對(duì)網(wǎng)絡(luò)的影響無(wú)法簡(jiǎn)單概括。即使在上述幾個(gè)例子中,也有許多不同的機(jī)制在起作用。在某些情況下,人工智能的威脅似乎被用來(lái)為其他原因所期望的改變辯護(hù)(比如Reddit),而在其他情況下,人工智能是創(chuàng)造網(wǎng)站價(jià)值的人和運(yùn)營(yíng)網(wǎng)站的人之間斗爭(zhēng)的武器(比如Stack Overflow)。在其他領(lǐng)域,人工智能填滿盒子的能力也產(chǎn)生了不同的影響,從試圖讓人工智能參與的社交網(wǎng)絡(luò),到人工智能生成的垃圾與其他商品競(jìng)爭(zhēng)的購(gòu)物網(wǎng)站。

在每一種情況下,人工智能的擴(kuò)展能力都改變了平臺(tái)。許多最成功的網(wǎng)站都是利用規(guī)模優(yōu)勢(shì)的網(wǎng)站,它們要么增加社交聯(lián)系或產(chǎn)品選擇,要么對(duì)構(gòu)成互聯(lián)網(wǎng)本身的大量信息進(jìn)行分類。但這種規(guī)模依賴于大量的人類來(lái)創(chuàng)造潛在價(jià)值,而在大規(guī)模生產(chǎn)方面,人類無(wú)法擊敗人工智能。

機(jī)器學(xué)習(xí)領(lǐng)域有一篇著名的文章,名為《痛苦的教訓(xùn)》(theBitter Lesson)。指出,幾十年的研究證明,改進(jìn)人工智能系統(tǒng)的最佳方式不是試圖設(shè)計(jì)智能,而是簡(jiǎn)單地投入更多的計(jì)算機(jī)能力和數(shù)據(jù)。這是一個(gè)痛苦的教訓(xùn),因?yàn)樗砻鳈C(jī)器規(guī)模勝過(guò)人類管理。同樣的道理也適用于網(wǎng)絡(luò)。

但這一定是壞事嗎?如果我們所知道的網(wǎng)絡(luò)在面對(duì)人工豐裕時(shí)發(fā)生了變化,結(jié)果會(huì)如何?有些人會(huì)說(shuō),這就是世界運(yùn)行的方式,他們指出,網(wǎng)絡(luò)本身也扼殺了它之前的東西,而且往往是向好的方向發(fā)展。例如,印刷版百科全書(shū)幾乎絕跡了,但我更喜歡維基百科的廣度和可訪問(wèn)性,而不是大英百科全書(shū)的分量和保證。對(duì)于與人工智能生成內(nèi)容相關(guān)的所有問(wèn)題,也有很多方法可以改進(jìn)它,比如改進(jìn)引用功能、增加人類監(jiān)督等。此外,即使網(wǎng)絡(luò)上充斥著人工智能垃圾,也可能被證明是有益的,可以刺激資金更充足的平臺(tái)發(fā)展。例如,如果谷歌在搜索中總是提供垃圾結(jié)果,你可能更傾向于為你信任的資源付費(fèi),并直接訪問(wèn)它們。

事實(shí)上,人工智能目前引發(fā)的變化只是網(wǎng)絡(luò)歷史上長(zhǎng)期斗爭(zhēng)中的最新進(jìn)展。從本質(zhì)上講,這是一場(chǎng)關(guān)于信息的戰(zhàn)爭(zhēng),關(guān)于誰(shuí)在制造信息,你如何獲取信息,以及誰(shuí)得到報(bào)酬。但是,僅僅因?yàn)檫@場(chǎng)戰(zhàn)斗是熟悉的,并不意味著它不重要,也不能保證接下來(lái)的系統(tǒng)會(huì)比我們現(xiàn)在的系統(tǒng)更好。新的網(wǎng)絡(luò)正艱難地誕生,而我們現(xiàn)在所做出的決定將決定它的發(fā)展方式。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-06-27
AI制造網(wǎng)絡(luò)垃圾:舊互聯(lián)網(wǎng)正在消亡,新網(wǎng)絡(luò)艱難中誕生
AI制造網(wǎng)絡(luò)垃圾:舊互聯(lián)網(wǎng)正在消亡,新網(wǎng)絡(luò)艱難中誕生,互聯(lián)網(wǎng),人工智能,谷歌,維基,ai"/>

長(zhǎng)按掃碼 閱讀全文