在降低數(shù)字人定制門檻的道路上,訊飛智作按下了加速鍵。2024年10月24日,訊飛智作首發(fā)超擬人數(shù)字人,僅需一張照片就能實(shí)現(xiàn)數(shù)字人定制。此次超擬人數(shù)字人嵌入至訊飛智作小程序上,無需打開電腦登錄,在人人擁有手機(jī)的年代,再次降低用戶路徑,讓每人擁有自己的超擬人數(shù)字人成為可能。
作為科大訊飛旗下一款AIGC內(nèi)容生產(chǎn)平臺,訊飛智作自誕生以來就一直為用戶提供“AI配音”“數(shù)字人視頻播報”“聲音定制”“形象定制”等服務(wù),致力于提高各種場景下音視頻內(nèi)容生產(chǎn)效率。而此次首發(fā)超擬人數(shù)字人,更是訊飛智作在AI領(lǐng)域的進(jìn)一步躍升。
基于大模型的多模態(tài)交互技術(shù)的創(chuàng)新與升級,訊飛智作首發(fā)超擬人數(shù)字人讓個性化數(shù)字人的打造有了更多選擇。數(shù)字人定制不再是調(diào)用提前錄制模版資源的“預(yù)制菜”,而是由一張照片就能驅(qū)動的新突破。
在此次技術(shù)提升下,一張照片驅(qū)動數(shù)字人不僅沒有讓超擬人數(shù)字人表現(xiàn)力降低,反而借助情感貫穿的多模態(tài)交互能力,提升其表情與肢體的表現(xiàn)能力。大模型的多模態(tài)交互技術(shù)統(tǒng)一了文本、語音和表情,實(shí)現(xiàn)跨模態(tài)的語義一致性。也就是說,超擬人數(shù)字人的情感表達(dá)更加真實(shí)連貫,數(shù)字人的口唇不僅能夠高度同步,表情和動作上也會隨之變化表現(xiàn),更貼近真人的情感表達(dá)。
于此同時,超擬人數(shù)字人還與此前的“一句話聲音復(fù)刻”功能做了有機(jī)結(jié)合。借助大模型語音合成技術(shù),用戶在定制專屬的超擬人數(shù)字人聲音時僅需根據(jù)提示朗讀文本,訊飛智作便會快速學(xué)習(xí)你的音色、韻律以及說話習(xí)慣,短短幾秒鐘便能復(fù)刻出其高質(zhì)量的專屬音頻。不僅如此,訊飛智作還實(shí)現(xiàn)了跨語種復(fù)刻的能力。
訊飛智作小程序“聲音復(fù)刻”功能頁面
在當(dāng)下大模型競爭的白熱化階段,訊飛智作選擇將視角轉(zhuǎn)向注重真實(shí)場景落地的技術(shù)優(yōu)化。超擬人數(shù)字人這一技術(shù)的實(shí)現(xiàn),讓數(shù)字人普及N種場景成為可能,成為促進(jìn)千行百業(yè)智能化轉(zhuǎn)型的重要動力。
在傳統(tǒng)的教培場景下,數(shù)字人定制多服務(wù)于教師職能。如大學(xué)老師借助數(shù)字人定制服務(wù)讓每個人都擁有自己的云課堂,定制2D高仿真的虛擬數(shù)字人再通過合成課件PPT、素材、場景、視頻完善課程教學(xué)。而此次超擬人數(shù)字人進(jìn)一步提升教師應(yīng)用場景的便捷性,無需錄制長段的綠幕視頻,僅需一張照片,訊飛智作便可自動生成屬于教師的超擬人數(shù)字人。除了大學(xué)教師,在中小學(xué)教育場景下,利用超擬人數(shù)字人來進(jìn)行賽課無疑也是一種高效且吸引的手段。
在自媒體場景下,超擬人數(shù)字人的應(yīng)用前景尤為廣闊。通過一張照片即可生成超擬人數(shù)字人,讓口播博主不再困頓于視頻場景的繁瑣布置、口播錄制反復(fù)修改等問題。僅需一張優(yōu)質(zhì)的照片,輸入想要表達(dá)的文案,即可生成優(yōu)質(zhì)的出鏡視頻。
訊飛智作小程序超擬人數(shù)字人定制頁面
訊飛智作首發(fā)超擬人數(shù)字人作為一種全新的數(shù)字人定制通路,不僅升級新增了多模態(tài)、超擬人、個性化等特性,還全方位豐富了數(shù)字人的“交互”。僅需一張照片生成的超擬人數(shù)字人為各行各業(yè)帶來了前所未有的創(chuàng)新和變革,相信未來能為企業(yè)和用戶提供更加優(yōu)質(zhì)和便捷的服務(wù)。
訊飛智作小程序超擬人數(shù)字人部分公版形象
當(dāng)下,訊飛智作小程序上在首發(fā)超擬人數(shù)字人后也在不斷優(yōu)化,持續(xù)增加更多公版形象。期待訊飛智作繼續(xù)推出更多針對不同行業(yè)和領(lǐng)域的數(shù)字人技術(shù),引領(lǐng)AIGC內(nèi)容革命。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )