銳評 | 騰訊打擊、字節(jié)出售的數(shù)字人,要靠AI逆天改命

文 / VRAR星球 多弗朗明哥

前些年風(fēng)風(fēng)火火的數(shù)字人行業(yè)在今年算是降溫了,先是字節(jié)跳動出售虛擬偶像團體A-SOUL給樂華娛樂,接下來是騰訊微信視頻號新規(guī)擬限制數(shù)字人帶貨,那么問題來了,數(shù)字人行業(yè)還能雄起嗎?本期的銳評,我們就此展開討論。

大廠反應(yīng)不一

對于數(shù)字人,互聯(lián)網(wǎng)大廠的反應(yīng)不盡相同,大致分為三派:

首先是重拳出擊,以騰訊為代表。騰訊近日對《視頻號櫥窗達人“發(fā)布低質(zhì)量內(nèi)容”實施細則》進行了修訂,最新方案顯示:

“使用插件、AI 等工具生成虛擬形象進行直播”“提供、售賣、教學(xué)或展示平臺不提倡傳播的內(nèi)容:如講解和售賣虛擬人代播軟件”等涉及虛擬人/數(shù)字人直播,將被視頻號明確列入低質(zhì)量內(nèi)容,并進行違規(guī)處理。

雖然騰訊目前打擊的是數(shù)字人直播,并不涉及數(shù)字人有關(guān)的視頻內(nèi)容,但是考慮到微信月活躍用戶數(shù)突破13億,是一個重要的變現(xiàn)平臺,這限制數(shù)字人直播,對相關(guān)的行業(yè)來說,無疑就是晴天霹靂。

接下來是草草收場,以字節(jié)跳動為代表。今年4月19日,樂華娛樂發(fā)布公告,宣布以3000萬人民幣的價格收購字節(jié)跳動朝夕光年旗下的虛擬偶像團體A-SOUL和枝江娛樂藝人,其中與A-SOUL相關(guān)的技術(shù)、知識產(chǎn)權(quán)(包括代碼和版權(quán))、設(shè)備和域名,交由樂華娛樂董事長杜華兄弟杜江的公司尼斯未來(Nice Future)負責(zé)運營。

從此字節(jié)跳動就與A-SOUL之類的數(shù)字人再無瓜葛。字節(jié)跳動之所以選擇退場,主要是數(shù)字人太燒錢了。瑞銀報告指出,高級數(shù)字人的先期投入成本平均為3000萬元。A-SOUL的單曲制作成本約200萬元,一場線下演唱會成本約2000萬元。即便SM這樣經(jīng)紀公司,偶像培養(yǎng)成本不過折合人民幣100萬元。

除了燒錢,變現(xiàn)難也是一大問題。不同于真人,數(shù)字人無法參與到收益更高的影視綜領(lǐng)域,其在品牌推廣方面也會受到不小的限制。例如,走國風(fēng)形象的數(shù)字人Ling在小紅書上的第一次帶貨推廣,就遭到了小紅書平臺用戶的群嘲,一大原因是其面部皮膚狀態(tài)和顏色與真人存在一定差距,這讓其帶貨的彩妝上臉后顯色的真實性大打折扣。

最后是大力支持,以京東為代表。今年4月16日下午6點18分,以京東創(chuàng)始人、董事局主席劉強東為形象的“采銷東哥”同時亮相京東家電家居、京東超市采銷直播間。

根據(jù)京東超市披露,采銷東哥數(shù)字人上播30分鐘,直播間觀看人數(shù)破千萬;僅40分鐘內(nèi),直播間觀看人數(shù)超過1300萬,創(chuàng)造京東超市采銷直播間開播以來,觀看人數(shù)的最高峰;近1小時觀看量超2000萬,直播時段用戶平均停留時長達到日常均值的5.6倍。在40分鐘內(nèi),直播間整體訂單量破10萬。

京東方面稱,相比真人主播,京東數(shù)字人的成本不到1/10,最快兩小時開播,且可以24小時不間斷直播。目前京東數(shù)字人已服務(wù)超4000家品牌商。

不管是騰訊、字節(jié)跳動,還是京東,它們對待數(shù)字人的態(tài)度可謂是千差萬別,很難判斷誰對誰錯。

從筆者的認知來看,今年跟數(shù)字人有關(guān)的新聞與融資動態(tài)要比往年少很多。

AI讓數(shù)字人更加實用

目前的數(shù)字人的主要缺點就是“沒有靈魂”,只有人的外表,卻沒有人的主觀能動性,不夠智能,具體來說就是“三無人員”:

一、無情感:雖然數(shù)字人可以模仿人類的行為,但它們無法真正理解和表達情感。這使得它們在需要人際交往和情感交流的場合中無法替代人類。

二、無創(chuàng)新:數(shù)字人的行為和決策完全取決于編程,它們無法像人類那樣進行創(chuàng)新和創(chuàng)造。這使得它們在某些需要創(chuàng)新和創(chuàng)造力的領(lǐng)域中無法替代人類。

三、無離線:數(shù)字人的運行完全依賴于計算機和網(wǎng)絡(luò)技術(shù),一旦這些技術(shù)出現(xiàn)問題,數(shù)字人就不能正常工作。

即便數(shù)字人可以使用真人驅(qū)動,使其變得有情感與有創(chuàng)新,可是那就違背了使用數(shù)字人解放人類生產(chǎn)力的初衷。隨著AI的發(fā)展,數(shù)字人無情感、無創(chuàng)新的問題就能夠迎刃而解。

以AI大模型ChatGPT為例,它的推出使得數(shù)字人具備了更高的表現(xiàn)力和交互能力,擺脫了"只會念稿、不能交互"的尷尬局面。這一突破不僅賦予了數(shù)字人以"靈魂",還顯著提升了其感知能力、思維能力和內(nèi)容輸出能力,使其在思想、語言和行為上更接近于人類,更智能化。

這種進展主要得益于ChatGPT強大的語言生成能力和多樣的應(yīng)用場景。ChatGPT不僅可以回答各種問題,還能夠?qū)憚”?、?chuàng)作小說、編寫說明書,甚至提供代碼糾錯。在這一過程中,它展現(xiàn)出了非常高的"情商",能夠進行多輪對話,回復(fù)流暢自然。

今年4月份,天娛數(shù)科旗下的虛擬數(shù)字人“朏朏”就完成了AI大模型ChatGPT的接入,并完成直播首秀,不僅能夠?qū)崟r響應(yīng)顧客的提問,還能根據(jù)不同問題進行自主回答。

有了AI加持的數(shù)字人,將變得更加實用,不再是“三無人員”。

寫在最后

2022年,IDC發(fā)布《中國AI數(shù)字人市場現(xiàn)狀與機會分析》報告,內(nèi)容指出,IDC將數(shù)字人分為五個等級,其中L1~L3為初級,該階段的數(shù)字人初步具備人的外形,但還只能做簡單的交互決策,目前我國的數(shù)字人發(fā)展正處在這一階段。

L4為中級階段,此時的數(shù)字人在AI的加持下,初步具備一定的問題處理能力,遇到少數(shù)特殊情況,需要人的接管,這是目前的數(shù)字人下一階段的發(fā)展目標或者方向。

L5為高級階段或者是究極階段,這個階段的數(shù)字人憑借強大的AI能力可以接管大多數(shù)場景,做到自主決策,且還支持更多模態(tài)的實時交互。

當(dāng)數(shù)字人發(fā)展到L4、L5階段,也許騰訊就不會打擊數(shù)字人、字節(jié)跳動也會重新進入數(shù)字人行業(yè)了。

【VRAR星球原創(chuàng)稿件,未經(jīng)許可禁止轉(zhuǎn)載】

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-06-25
銳評 | 騰訊打擊、字節(jié)出售的數(shù)字人,要靠AI逆天改命
數(shù)字人行業(yè)還能雄起嗎?本期的銳評,我們就此展開討論。

長按掃碼 閱讀全文