海信聚好看AR/VR事業(yè)部總經(jīng)理吳連朋:虛擬空間及數(shù)字人交互技術(shù)應(yīng)用趨勢

FBEC未來商業(yè)生態(tài)鏈接大會于2023年2月24日在深圳福田大中華喜來登酒店盛大召開,本次大會由廣東省游戲產(chǎn)業(yè)協(xié)會、深圳市互聯(lián)網(wǎng)文化市場協(xié)會指導(dǎo),陀螺科技主辦。

大會以“勇毅前行·逐光而上”為主題,以具有行業(yè)前瞻洞察的“探索者”為視角,逐“光”之旅為主線,聚焦元宇宙、XR、游戲、電競、數(shù)字營銷等前沿行業(yè),全方位呈現(xiàn)科技前沿成果,探討時代與商業(yè)議題,謀劃新科技、新商業(yè)、新模式未來價值,與時代同行者共赴劇變革新下的勇毅逐光之道!

FBEC主會場C:相信的力量——FBEC全球元宇宙CEO峰會由武漢東湖新技術(shù)開發(fā)區(qū)管理委員會與陀螺科技聯(lián)合主辦,邀請到海信集團(tuán)聚好看科技股份有限公司AR/VR事業(yè)部總經(jīng)理吳連朋帶來主題為“虛擬空間及數(shù)字人交互的技術(shù)應(yīng)用趨勢”的精彩演講。吳連朋認(rèn)為,如果我們繞開數(shù)字人的發(fā)展,談元宇宙就是沒有意義的。

虛擬空間及數(shù)字人交互技術(shù)應(yīng)用趨勢.jpg

以下為演講實錄:

大家下午好!

很開心有機(jī)會能跟大家進(jìn)行分享交流,前面的嘉賓從不同的業(yè)務(wù)領(lǐng)域進(jìn)行了分享,我會從元宇宙的基礎(chǔ)“人+場”的應(yīng)用方向,也就是數(shù)字人+虛擬空間的技術(shù)方向進(jìn)行切入,在這個過程中,希望也能把海信集團(tuán)聚好看的思考和正在做的事情介紹給大家。

我們是海信旗下的一家互聯(lián)網(wǎng)公司,這是云服務(wù)板塊,從下往上有企業(yè)級的、基礎(chǔ)的PaaS云平臺,目前包括國家電網(wǎng)、中大型企業(yè)數(shù)字化轉(zhuǎn)型里做私有云的PaaS平臺的切換。除此之外,還有通用互聯(lián)網(wǎng)架構(gòu)下所需要的PaaS云的部分,以及音視頻的解決方案,是面向移動互聯(lián)網(wǎng)基礎(chǔ)能力的構(gòu)建。

2016年的時候,在集團(tuán)戰(zhàn)略的部署下,我們開始承擔(dān)XR板塊,其中包括眼鏡的探索方向。

2020年,我們發(fā)布了國內(nèi)首個雙8K直播的VR云平臺,這是基于VR的視頻處理、編解碼處理以及傳輸分發(fā)的云平臺,包括本次大會的VR視頻直播也是我們平臺的產(chǎn)品來提供,這是比較成熟的應(yīng)用方向。

在此基礎(chǔ)上,2019、2020、2021年,我們不斷探索XR領(lǐng)域跟硬件結(jié)合、跟應(yīng)用結(jié)合的新的解決方案。我們的路線,是從數(shù)字虛擬人的引擎開始,再到基于人+虛擬空間的元宇宙的互動活動平臺的應(yīng)用。

現(xiàn)在大家都談數(shù)字人,為什么大家都在談、也還有人去做呢?這個問題我們從2019年就開始思考了。目前數(shù)字人的引擎沒有成為通用能力的情況下,一個企業(yè)想要做好XR領(lǐng)域的應(yīng)用和解決方案,是無法繞過一些基礎(chǔ)核心技術(shù)的積累和突破的。

說元宇宙,首先會說到數(shù)字人,說得最多的也是數(shù)字人。其實在五年前、十年前,虛擬仿真的技術(shù),包括游戲的應(yīng)用就已經(jīng)非常成熟。所以,如果我們繞開數(shù)字人的發(fā)展,談元宇宙就是沒有意義的。

基于數(shù)字人生產(chǎn)的效率和性能的提升,是驅(qū)動元宇宙應(yīng)用的基礎(chǔ)邏輯。這里有兩個案例,一個是目前行業(yè)中做得非常好的歐美超寫實數(shù)字人,左上角是相對比較輕量級的數(shù)字人。在數(shù)字人發(fā)展的基礎(chǔ)上,有各行各業(yè)元宇宙數(shù)字人的探索。

雖然說數(shù)字人的建模和渲染技術(shù)不斷提升,也可以做各領(lǐng)域探索,但不代表每一個領(lǐng)域在一兩年內(nèi)就可以成熟。從我們自己的思考來講,比如社交的元宇宙,Meta已經(jīng)投入了很長的時間,但是目前最高用戶也才達(dá)到20萬,日活還在不斷下降,所以偏社交、大C端的社交應(yīng)用的方向,不是我們目前想要去拓展的方向。

從技術(shù)角度去看,數(shù)字人從開始構(gòu)建,到真正在元宇宙里應(yīng)用起來,具體需要做哪些,以及它的應(yīng)用趨勢是怎樣的?拆解出來是以下五個階段。

第一,把人生產(chǎn)出來,這就是建模的技術(shù)。建模技術(shù)發(fā)展的趨勢,首先是要達(dá)到更高的精度,其次是以更小的成本和更小的算力去獲得更高的精度。從多視角幾何,純數(shù)字算法的模式,向深度學(xué)習(xí)大模型去發(fā)展。

第二,人建出來之后,需要使面部的動作動起來,動作的方向是更加輕便,讓人無感知地應(yīng)用起來,才能在消費(fèi)級有更好的應(yīng)用,所以從傳統(tǒng)的光學(xué)、慣性動作捕捉等往更加輕量的可以消費(fèi)級應(yīng)用的單RGB攝像頭的精細(xì)化驅(qū)動方向發(fā)展。

第三,動起來以后,需要人周邊的服飾和頭發(fā)等的仿真效果。

第四,在把人生產(chǎn)、動作、周邊服飾都做出來以后,重要的方向是能夠把這些很好地渲染出來。

第五,前面四個階段生產(chǎn)完以后,只能說有了這樣的形象出來,可以有基礎(chǔ)的活動交互,而最終還是要用AI給它賦能,讓它具有靈魂。最近有很多人討論ChatGPT,ChatGPT結(jié)合數(shù)字人一定是可以的,并且很快能夠改變很多行業(yè)的應(yīng)用方向,尤其是數(shù)字智能化的助手方向,替代一些人力,更好地展現(xiàn)效率。

從數(shù)字人的劃分來講,我們做了一個分類:從最基礎(chǔ)的風(fēng)格化的數(shù)字人,到寫實數(shù)字人,再到超寫實數(shù)字人。

風(fēng)格化數(shù)字人,目前國外已經(jīng)有很多通用的模型,很多行業(yè)應(yīng)用都在基于這些模型去做。我們認(rèn)為,它更加適合偏游戲、偏輕量化的娛樂性方向,而不適合行業(yè)級的應(yīng)用方向。

2020年,海信推出了自己的第一個元宇宙電視行業(yè)發(fā)布會,當(dāng)時也是風(fēng)格化數(shù)字人。但近一兩年我們想要進(jìn)行行業(yè)應(yīng)用拓展和規(guī)?;?,就一定要往寫實和更加超寫實的方向推進(jìn)。寫實和超寫實數(shù)字人這兩個部分是有交叉的,這取決于具體的應(yīng)用場景。

比如寫實的數(shù)字人,基于單張的圖片,基于1萬以內(nèi)的面片數(shù)去生產(chǎn)數(shù)字人的形象,才有可能在目前的終端算力下,做到幾百上千的并發(fā),去進(jìn)行交互和這個范圍內(nèi)的應(yīng)用。

這是我們自己打造的其中一個超寫實形象,它現(xiàn)在承載著我們流量代理人的角色。我們自己的超寫實數(shù)字人的打造技術(shù),從學(xué)術(shù)到真正能落地的趨勢是一致的,就是高精度掃描以后,AI能夠自動化的建模,可以把原來需要專業(yè)團(tuán)隊做幾個月的工作量縮短到兩周以內(nèi)。我們說超寫實,不僅僅是代表它有8K的貼圖和毛孔級的精度,更重要的是面部的表情,還有身體和骨骼動作的精細(xì)化處理。

這是我們最近兩周的案例,背景是中亞五國在集團(tuán)的采訪。這個場景需要長達(dá)6分鐘的俄語播報內(nèi)容,常規(guī)的展廳不太可能完成,但是現(xiàn)在通過AI數(shù)字人,包括語音的技術(shù)和自動的動作捕捉,2個小時以內(nèi)可以生產(chǎn)這樣的內(nèi)容,滿足應(yīng)用場景的需求。我們說元宇宙、數(shù)字人,還是要考慮到底是在什么樣的場景下提供了什么樣的價值。

另一個案例是更輕量級的模型,精度相對沒有那么高,但是一切的技術(shù)都是服務(wù)具體落地的場景。比如今天的大會,我們有兩路不同的直播,一路是基于VR視頻的直播,另一路是基于元宇宙活動的直播,當(dāng)面臨上百或者是上千虛擬人在同一個空間里進(jìn)行活動和交互的時候,就必須要平衡它千人千面的追求,以及算力、精度、實時互動的流暢。在不同的場景需要不同的寫實度,這是我們在應(yīng)用落地場景的結(jié)合探索中得出的經(jīng)驗。大部分場景可能不需要達(dá)到95%的寫實度,可能只需要達(dá)到60%以上的寫實度就可以達(dá)到流暢、體驗感平衡的效果。

我們對技術(shù)服務(wù)場景這個方向的思考,它不是適合于通用的、想把所有的企業(yè)和用戶都放在一個公共的大空間里的應(yīng)用,而是要聚焦于某一個很小的細(xì)分場景,比如會議的活動,虛擬的教研活動,或者其他的展覽展示活動。

現(xiàn)在大家都在談數(shù)字人的技術(shù),但3年以后,基礎(chǔ)數(shù)字人的能力,無論是建模、驅(qū)動,還是結(jié)合云以后整個AI的生成能力,可能馬上就會成為基建的技術(shù),它會像現(xiàn)在云計算和大數(shù)據(jù)公共算力一樣,成為一種基礎(chǔ)能力。但是在這段時間里,整個行業(yè)的從業(yè)者如果要做到真正的落地和實現(xiàn),還是要明確自己的方向,以及對關(guān)鍵領(lǐng)域進(jìn)行突破。

引用一個報告的數(shù)據(jù),后疫情時代,虛擬活動的場景占比和用戶接受度在逐漸增高。在這種情況下,我們有基礎(chǔ)的面向一個一個活動場景的產(chǎn)品架構(gòu),在這樣的架構(gòu)里面,無論是數(shù)字人,還是云渲染,都已經(jīng)是基礎(chǔ)的技術(shù)能力。傳統(tǒng)的虛擬仿真教育,也面臨著往基于多人的互動遠(yuǎn)程空間更加真實和更具沉浸感的發(fā)展方向,這也是未來我們發(fā)力的細(xì)分場景。

謝謝大家!

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-02-25
海信聚好看AR/VR事業(yè)部總經(jīng)理吳連朋:虛擬空間及數(shù)字人交互技術(shù)應(yīng)用趨勢
FBEC主會場C:相信的力量——FBEC全球元宇宙CEO峰會由武漢東湖新技術(shù)開發(fā)區(qū)管理委員會與陀螺科技聯(lián)合主辦,邀請到海信集團(tuán)聚好看科技股份有限公司AR/VR事業(yè)部總經(jīng)理吳連朋帶來主題為“虛擬空間及數(shù)字人交互的技術(shù)應(yīng)用趨勢”的精彩演講。

長按掃碼 閱讀全文