元宇宙概念爆火后,作為現(xiàn)實(shí)與元宇宙場(chǎng)景連接的重要“媒介”之一虛擬人以主角身份再次破圈。虛擬主播、虛擬教師、虛擬客服、虛擬導(dǎo)游等各類(lèi)虛擬人物形象也愈發(fā)立體和全面地展示在我們的生活中,虛擬人普適化看似又進(jìn)了一步。然而,這些倍受追捧的虛擬人多以CG技術(shù)加持,低智能的驅(qū)動(dòng)能力、局限的推廣應(yīng)用、高額的造價(jià)卻讓更多受眾望而卻步。
今年8月,拓元智慧利用其全棧AI技術(shù),推出了真人復(fù)刻、數(shù)字克隆人服務(wù),并通過(guò)在垂直領(lǐng)域創(chuàng)建具備推理和認(rèn)知能力的數(shù)智人大腦,打造出低門(mén)檻、可規(guī)?;涞氐臄?shù)智人解決方案,為大眾用戶(hù)提供在虛實(shí)融合世界的分身和交互中介,使其成為新的連接及生活方式。
全棧AI技術(shù) 1:1還原真人形象和聲音
《2022虛擬人產(chǎn)業(yè)發(fā)展白皮書(shū)》指出,決定2D真人數(shù)智人高真實(shí)度還原的核心技術(shù)是各類(lèi)驅(qū)動(dòng)算法設(shè)計(jì)和模型訓(xùn)練,數(shù)據(jù)訓(xùn)練的質(zhì)量將決定數(shù)智人內(nèi)容產(chǎn)出的效果。拓元智慧作為一家具備原創(chuàng)領(lǐng)先技術(shù)的AI數(shù)智人平臺(tái)服務(wù)商,在虛擬數(shù)智人核心技術(shù)領(lǐng)域積極布局、持續(xù)創(chuàng)新突破,其核心團(tuán)隊(duì)在自監(jiān)督學(xué)習(xí)、知識(shí)及因果推理、多模態(tài)內(nèi)容生成等關(guān)鍵技術(shù)板塊積淀了多年深厚的技術(shù)基礎(chǔ)。
通過(guò)原創(chuàng)的人體及人臉三維重建、語(yǔ)義/情感關(guān)聯(lián)的表情和動(dòng)作生成、情感化/風(fēng)格化語(yǔ)音合成等全棧AI技術(shù)能力,拓元智慧能根據(jù)真人出鏡錄制的短暫音視頻內(nèi)容,完成人物形象、聲音復(fù)刻及還原,實(shí)現(xiàn)媲美真人的宇宙元分身。
在形象復(fù)刻方面,一是采用人臉三維結(jié)構(gòu)重建模型,訓(xùn)練人物表情、口型和人臉形象,渲染出生動(dòng)、靈活的臉部肌肉和表情;二是采用肢體三維結(jié)構(gòu)重塑,通過(guò)肢體可驅(qū)動(dòng)引擎完成穿著渲染模塊和虛實(shí)環(huán)境交互對(duì)齊。在聲音合成方面,則是采用高保真多層級(jí)語(yǔ)音模型,完成音色、語(yǔ)調(diào)和語(yǔ)速的高度還原。
支持 IP定制 滿(mǎn)足全領(lǐng)域多場(chǎng)景應(yīng)用
傳統(tǒng)認(rèn)知下,形象好、氣質(zhì)佳、普通化標(biāo)準(zhǔn)、音質(zhì)好的人物才可以復(fù)刻出效果好的虛擬數(shù)智人,但基于認(rèn)知AI及數(shù)智大腦原理制作數(shù)智人的拓元,早已打破這一前提。無(wú)論是政府機(jī)構(gòu)、教育培訓(xùn)、MCN機(jī)構(gòu)還是媒體單位,想要復(fù)刻的人物是男性、女性、老人還是兒童,拓元復(fù)刻技術(shù)均能根據(jù)不同外形、語(yǔ)音的人物設(shè)定復(fù)刻出專(zhuān)屬他的IP元宇宙分身,并通過(guò)復(fù)刻而成的分身更換不同風(fēng)格、不同場(chǎng)景,真正實(shí)現(xiàn)“1次復(fù)刻、N次分身”,為用戶(hù)帶來(lái)差異化營(yíng)銷(xiāo)體驗(yàn)。
此外,拓元還可提供專(zhuān)業(yè)的拍攝流程指導(dǎo)、復(fù)刻模型數(shù)據(jù)解析、個(gè)性化推薦等專(zhuān)屬客戶(hù)服務(wù),并為客戶(hù)隱私安全保駕護(hù)航。
低成本運(yùn)營(yíng) 助力企業(yè)/個(gè)人降本增效
復(fù)刻好了數(shù)智人,怎么用呢?早在2019年人民日?qǐng)?bào)社“果果”、新華社“新小微”就告訴了我們答案,虛擬人視頻制作可通過(guò)SAAS服務(wù)、AI云計(jì)算及API開(kāi)放完成。只是高額的制作成本、局限的應(yīng)用場(chǎng)景,并不被普通受眾所接受,大家仍持觀望態(tài)度。但如今虛擬人已開(kāi)始席卷國(guó)內(nèi)各大短視頻平臺(tái),很多刷到的口播短視頻賬號(hào)內(nèi)容,都是由AI虛擬數(shù)智人生成,騰訊、字節(jié)跳動(dòng)、微軟等大廠已開(kāi)放虛擬人制作平臺(tái),高成本虛擬人及虛擬人視頻制作已是過(guò)去式。
拓元智慧也于近期開(kāi)放了元分身產(chǎn)品平臺(tái),推出了顛覆式的AI黑科技。平臺(tái)以打造高真實(shí)度AI數(shù)智分身為核心,通過(guò)文本編輯、個(gè)性化背景及字幕調(diào)整、多情感音色的選擇,一鍵輸出多場(chǎng)景多樣化口播視頻,突破了時(shí)空限制,實(shí)現(xiàn)了制片循環(huán)精簡(jiǎn)化、人效利用精益化、制作成本低廉化、制作產(chǎn)能規(guī)?;拇笸黄?,為視頻內(nèi)容產(chǎn)業(yè)提供了元宇宙時(shí)代的嶄新手段??蓭椭悦襟w創(chuàng)作者實(shí)現(xiàn)高質(zhì)量文本輸出、批量化視頻內(nèi)容生產(chǎn),快速“養(yǎng)成”優(yōu)質(zhì)流量達(dá)人,同時(shí)還能助力醫(yī)療、娛樂(lè)、游戲、教育、通信、銀行等企事業(yè)單位降本增效。
未來(lái),拓元智慧將繼續(xù)深耕AI虛擬數(shù)智人技術(shù),逐步推動(dòng)虛擬分身和元宇宙的普及化。
關(guān)于拓元智慧
拓元(廣州)智慧科技有限公司(X-Era AI),簡(jiǎn)稱(chēng)“拓元智慧”,是一家具備原創(chuàng)領(lǐng)先技術(shù)的多模態(tài)認(rèn)知AI技術(shù)及應(yīng)用服務(wù)商,面向不同行業(yè)用戶(hù)提供統(tǒng)一的能夠模擬真人形象、行為、常識(shí)、創(chuàng)造力和價(jià)值觀的AI數(shù)智人平臺(tái)。團(tuán)隊(duì)核心成員來(lái)自阿里、商湯等知名企業(yè)及Oxford、CMU、中山大學(xué)等頂尖科研機(jī)構(gòu),擁有多年的前沿AI技術(shù)研究及工程化與業(yè)務(wù)落地經(jīng)驗(yàn)。
拓元智慧擁有300多項(xiàng)技術(shù)成果,在國(guó)際頂級(jí)期刊/會(huì)議上累計(jì)發(fā)表學(xué)術(shù)論文300余篇,在數(shù)十項(xiàng)主流AI競(jìng)賽或者評(píng)測(cè)基準(zhǔn)中獲得冠軍,十余次獲得學(xué)術(shù)期刊及會(huì)議的最佳/優(yōu)秀論文獎(jiǎng),獲得中國(guó)圖像圖形學(xué)會(huì)科學(xué)技術(shù)一等獎(jiǎng)、吳文俊人工智能自然科學(xué)獎(jiǎng)、省部級(jí)自然科學(xué)獎(jiǎng)等。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )