成都匯陽投資關(guān)于Sora 橫空出世,AI 產(chǎn)業(yè)鏈風(fēng)云再起!

【Sora 在視頻生成和模擬能力實(shí)現(xiàn)重大突破】

2 月16 日,OpenAI 發(fā)布最新文生視頻大模型 Sora ,并在官網(wǎng)發(fā)布由其生成的 48 個(gè)視頻樣例。 目前,Sora 仍處于測(cè)試階段,僅對(duì)部分評(píng)估人員、視覺藝術(shù)家、設(shè)計(jì)書和電影制作人開放訪問權(quán)限。

Sora 在視頻生成和模擬能力實(shí)現(xiàn)重大突破。基于通用視覺數(shù)據(jù)的模型 Sora 具有強(qiáng)大的功能,具體來看:

1)視頻生成和處理能力:生成長(zhǎng)達(dá) 1 分鐘的視頻,遠(yuǎn)超此前 Pika 的 7 秒、Runaway Gen2 的 18 秒,視頻畫面的表現(xiàn)和構(gòu)圖效果更佳。并且,生成視頻具有3D 一致性,即可生成具有動(dòng)態(tài)攝像機(jī)運(yùn)動(dòng)的視頻,隨著攝像機(jī)的移動(dòng)和旋轉(zhuǎn),人物和場(chǎng)景元素在 3D 空間中保持一致移動(dòng)。

2)圖像生成能力:生成不同大小、分辨率最高可達(dá) 2048x2048 像素的圖片。3)模擬能力:在 3D 空間中模擬人類、動(dòng)物、 自然環(huán)境的特征,生成視頻符合物理世界的規(guī)則。并且還能模擬數(shù)字世界、生成程序游戲。

【不僅是多模態(tài),Sora 為世界模型的實(shí)現(xiàn)奠定基礎(chǔ)】

此次文生視頻模型 Sora 的發(fā)布是 OpenAI 繼文字、圖像之后,在內(nèi)容生成領(lǐng)域的又一突破。同時(shí),其強(qiáng)大的視頻生成和模擬能力標(biāo)志著 AI 技術(shù)在多模態(tài)領(lǐng)域?qū)崿F(xiàn)重大突破。該模型強(qiáng)大的功能有望進(jìn)一步優(yōu)化內(nèi)容創(chuàng)作者的視頻制作流程,促進(jìn)優(yōu)質(zhì)內(nèi)容生產(chǎn)。并且,模型所具備的模擬物理世界和數(shù)字世界的能力或?qū)⒓涌焓澜缒P偷膶?shí)現(xiàn)進(jìn)程,推動(dòng)游戲開發(fā)、虛擬現(xiàn)實(shí)等領(lǐng)域的發(fā)展。

Sora 采用 Transformer 架構(gòu),并用 patches 作為訓(xùn)練和預(yù)測(cè)的基本單位。1)數(shù)據(jù)處理:類比于大語言模型將各種文本統(tǒng)一為 tokens, Sora 將不同的視頻和圖片等視覺數(shù)據(jù)壓縮在低維潛空間中,將其分解為統(tǒng)一的 patches,以此作為視頻大模型訓(xùn)練和預(yù)測(cè)的基本單位。2) 計(jì)算架構(gòu) :Sora 采用的是 duffis ion transformer 架構(gòu) , 即基于 transformer 編碼器-解碼器的架構(gòu),對(duì)經(jīng)過增加噪點(diǎn)處理的 patches 進(jìn)行編碼,再通過解碼器逐步還原出原始 patches 的預(yù)測(cè)。隨著訓(xùn)練數(shù)據(jù)的增加,樣本質(zhì)量將顯著提升。

【關(guān)注價(jià)值重估下的兩大投資主線】

AI 多模態(tài)技術(shù)的出現(xiàn),將各種內(nèi)容形式與多種智能處理算法相結(jié)合,可實(shí)現(xiàn)不同內(nèi)容形式間的相互轉(zhuǎn)化。按形式進(jìn)行劃分,內(nèi)容資產(chǎn)可分為文字、圖片、音視頻、游戲四大類。展望未來,隨著多模態(tài)技術(shù)不斷突破,文字、圖片、音視頻、游戲內(nèi)容間的轉(zhuǎn)化門檻將逐步降低,AI 輔助內(nèi)容生成的比例將逐漸提升,長(zhǎng)期來看 AI 生成有望占據(jù)主導(dǎo)地位。內(nèi)容資產(chǎn)有望迎來價(jià)值重估,建議關(guān)注內(nèi)容資產(chǎn)以及生成內(nèi)容資產(chǎn)的 AI 工具兩條投資主線:

1)內(nèi)容資產(chǎn):首推最低維的內(nèi)容形式即文字類內(nèi)容,且擁有內(nèi)容數(shù)量多及質(zhì)量高的公司彈性最大。文字作為最低維的內(nèi)容被升維空間最大,有望全面受益于內(nèi)容資產(chǎn)價(jià)值重估,而網(wǎng)絡(luò)文學(xué)的娛樂性最強(qiáng),因此其商業(yè)化空間最大。

2)生成高維內(nèi)容資產(chǎn)的生產(chǎn)工具價(jià)值更高。1)AI 視頻工具: 該領(lǐng)域海外公司表現(xiàn)更為突出,如 Runaway 的 Gen-1 和 Gen-2 、Pika Labs 的 Pika 1.0 、以及 OpenAI 最新發(fā)布的 Sora 。2)AI 音頻工具:具備 AI 歌聲進(jìn)化功能的音樂社交 App 給麥,該功能能識(shí)別并抓取用戶的個(gè)性化音色,讓用戶實(shí)現(xiàn)對(duì)多語種、不同風(fēng)格音樂的演唱, 用戶可授權(quán) AI 用個(gè)人聲音合成新歌曲;Meta 推出 AI 聲音生成模型 Audio box ,實(shí)現(xiàn)根據(jù)文字或音頻生成音頻的功能。AI 游戲工具,通過模糊語音指令可實(shí)現(xiàn)數(shù)字資產(chǎn)的創(chuàng)建和細(xì)節(jié)調(diào)整,助力高度復(fù)雜的游戲開發(fā)。

【相關(guān)受益圖及參考標(biāo)】

滬電股份---AI 帶動(dòng)算力基建需求大漲,公司業(yè)績(jī)?cè)鲩L(zhǎng)提速

長(zhǎng)電科技---Q4 訂單總額恢復(fù)至去年同期,多領(lǐng)域增長(zhǎng)動(dòng)能強(qiáng)勁

中文在線---2023 年凈利同比預(yù)增 119%-129% 加碼 AI+IP 雙引擎戰(zhàn)略

免責(zé)聲明:本文匯陽投研團(tuán)隊(duì)整理編輯,僅代表團(tuán)隊(duì)觀點(diǎn),任何投資建議不作為您投資的依據(jù),您須獨(dú)立作出投資決策,風(fēng)險(xiǎn)自擔(dān)。請(qǐng)您確認(rèn)自己具有相應(yīng)的權(quán)利能力、行為能力、風(fēng)險(xiǎn)識(shí)別能力及風(fēng)險(xiǎn)承受能力,能夠獨(dú)立承擔(dān)法律責(zé)任。所涉及個(gè)股僅作投資參考和學(xué)習(xí)交流,不作為買賣依據(jù)。投資有風(fēng)險(xiǎn),入市需謹(jǐn)慎!

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )