全演藝圈明星都在關(guān)注的視頻大模型是什么樣子的?

很多科技界的老饕都還記得,2021年4月舉辦的NVIDIA的GTC線上峰會(huì),英偉達(dá)(NVIDIA)創(chuàng)始人兼CEO黃仁勛變身主廚 ,將發(fā)布場地挪到了自家廚房 。超過一個(gè)多小時(shí)的發(fā)布會(huì)中,其中有14秒的畫面中,老黃的廚房、標(biāo)志性的皮衣,甚至他的表情、動(dòng)作、頭發(fā)……全都是合成出來的數(shù)字人和背景。當(dāng)時(shí)業(yè)界一片嘩然,大呼被老黃“騙了三個(gè)月居然沒發(fā)現(xiàn)!”

但隨著AIGC技術(shù)的快速發(fā)展,到今天,無論多么真實(shí)的數(shù)字人表演,14秒的時(shí)長都已經(jīng)不夠滿足觀眾們的胃口了。那么各位觀眾和老司機(jī),一小時(shí)三十分鐘的長度,恰似一部電影的長度的真人數(shù)字人表演夠不夠?老黃的廚房注定要被囿于晝夜與愛,那么星際科幻大片和防暑降溫小貼士一起出現(xiàn)夠不夠?

7月27日14點(diǎn),中國北京,天氣溫度適中,沒有炎日,適合出門。東三環(huán)邊上的康萊德酒店,“新視界·新壹視頻大模型發(fā)布會(huì)”的藍(lán)色系主視覺,科技感十足。在接下來不到兩個(gè)小時(shí)的時(shí)間里,這里,將會(huì)發(fā)生改變視頻創(chuàng)作的里程碑事件。

觀眾還沒進(jìn)到會(huì)議內(nèi)場,就被場外兩塊屏幕吸引難以移步。數(shù)字人的對(duì)話、互動(dòng)并不鮮見,但與3D數(shù)字人對(duì)話的流暢程度、語音語義的理解程度,能否解決復(fù)雜多變的實(shí)際應(yīng)用場景的問題能力,甚至數(shù)字人的形象設(shè)計(jì),都是給觀眾留下深刻印象的關(guān)鍵因素之一。

以往科技圈開發(fā)布會(huì),都是以“自嗨”的形式來推進(jìn)的。但這次卻一反常態(tài),還在暖場時(shí)段,李冰冰、黃曉明、賈乃亮、王祖藍(lán)、龔俊、楊超越等20多位當(dāng)紅演藝圈明星都發(fā)來祝福和關(guān)注的視頻,祝福的話各有不同,但他們都共同提到了“新壹視頻大模型”,到底是何方神圣?

會(huì)議開始,更出人意料的場面出現(xiàn)了。沒有美女帥哥主持人身著華麗的禮服出場,也沒有幽默風(fēng)趣的主持人給現(xiàn)場助興,但每個(gè)觀眾的臉上從發(fā)布會(huì)開始的第一秒鐘開始就都充滿著不可思議的表情——全世界第一場由真人數(shù)字人作為全程主持人的發(fā)布會(huì)就此誕生了。

新壹科技創(chuàng)始人、董事長韓坤和他上百位從四面八方趕來的朋友們,以及幾百位慕名而來的媒體和用戶齊坐在臺(tái)下,“大家好,我是你們的老朋友韓坤,我正以數(shù)字人的身份出席這場發(fā)布會(huì),并擔(dān)任主持人。雖然我是個(gè)冰冷的數(shù)字人,但我還是能夠體會(huì)到比這個(gè)夏天北京天氣更熱烈的現(xiàn)場氣氛。”全場掌聲雷動(dòng)。

從主持人的專業(yè)性要求來說,這個(gè)開場白有些平淡,但了解韓坤和他的團(tuán)隊(duì)在過去幾年經(jīng)歷的人都明白,這一刻的平淡下面,是何等的激潮澎湃。據(jù)內(nèi)部員工透露,看到韓坤數(shù)字人主持人開口說話的一刻,“以為就是給他本人真人錄的視頻而已。”

為了穩(wěn)妥,擔(dān)心受到網(wǎng)絡(luò)、硬件、以及其他不可控因素的影響,技術(shù)團(tuán)隊(duì)曾建議在發(fā)布會(huì)現(xiàn)場和其他公司一樣,展示一些demo和視頻文件即可,“很多大廠都這樣”,大家如是說。但韓坤大手一揮,當(dāng)場拒絕,“要做就來真的!”。

臺(tái)下的韓坤真人本人面色平靜,神態(tài)自如,但目光如炬,此刻他仿佛站在視頻+AI的時(shí)間坐標(biāo)軸上,回顧從前是成就和輝煌,抬頭遠(yuǎn)眺是光榮和夢(mèng)想。

在由韓坤的數(shù)字人主持人介紹引導(dǎo)之后,終于輪到他本人登臺(tái)演講了。他和他的團(tuán)隊(duì),在過去將近20年的時(shí)間里深耕視頻行業(yè)引領(lǐng)視頻行業(yè)趨勢(shì),20年的團(tuán)隊(duì)技術(shù)積累終于把創(chuàng)造力賦予了機(jī)器,20年來親眼見證從PGC、UGC到AIGC視頻生產(chǎn)力變革,韓坤用他特有的平穩(wěn)的語調(diào)娓娓道來,并沒有太多情緒上的波動(dòng),仿佛一切就是順其自然而已。

截至7月底,2023年中國已經(jīng)發(fā)布過100多個(gè)大模型,仿佛不發(fā)大模型,就沒資格上牌桌一樣。這種情況下,韓坤直接把目光落在了面向垂直場景、解決垂直需求的垂直大模型上面。

韓坤邀請(qǐng)了好幾位好朋友一起登臺(tái)發(fā)布新壹視頻大模型,這是中國第一個(gè)聚焦在視頻領(lǐng)域的大模型,是以視頻生成為核心的多模態(tài)AIGC模型。新壹視頻大模型它不僅僅是一個(gè)工具,更是一個(gè)理解你、理解視頻、理解美學(xué)的藝術(shù)家。”韓坤表情平靜,淡淡地微笑,平靜地介紹。

隨后能讓韓坤真正激動(dòng)的時(shí)刻終于到了。從事了將近20年視頻行業(yè)的工作,韓坤還沒有過當(dāng)導(dǎo)演的行動(dòng),但這次,出于對(duì)《流浪地球》的喜愛以及對(duì)新壹視頻大模型的信心,韓坤當(dāng)場宣布要拍一部《流浪星球3》。不用擼袖子,他直接就對(duì)著全場觀眾演示起如何通過新壹視頻大模型來創(chuàng)作一部科幻大片的。

韓坤對(duì)著新壹秒創(chuàng)平臺(tái)對(duì)話框輸入了幾個(gè)關(guān)于人類駕駛地球、駛離太陽系并遇到危險(xiǎn)的關(guān)鍵詞,新壹視頻大模型的AI幫寫功能立刻就生成了一段腳本,速度和內(nèi)容都讓連臺(tái)下坐著的一位編劇嘆為觀止。

韓坤介紹,腳本會(huì)在新壹視頻大模型里面進(jìn)行一個(gè)圖片的訓(xùn)練,然后大模型會(huì)完成腳本生成成分鏡頭的圖片。隨后韓坤表示想要一段有交響樂感覺的配樂,很快AI也替他完成了,韓坤很滿意。隨后就是見證奇跡的時(shí)刻了。

短短不到5分鐘,一部將近一分鐘時(shí)長的宇宙科幻大片《流浪星球3》的預(yù)告片就完整地呈現(xiàn)了在現(xiàn)場觀眾面前。

全場觀眾掌聲雷動(dòng),全新創(chuàng)作的短片,人物表情自然,動(dòng)作流暢,場景變化也非常壯觀,完全是為真正的《流浪地球3》做了一次預(yù)演。要知道,放在傳統(tǒng)的電影工業(yè)來說,編劇、導(dǎo)演、演員、特效制作、燈光、美術(shù)、拍攝、剪輯、配音、配樂……普通人的科幻夢(mèng)是遙不可及的。

韓坤表示,新壹視頻大模型實(shí)現(xiàn)了從腳本生成,到AI作圖、AI視頻、AI音樂,再到智能剪輯配音的AI全流程視頻創(chuàng)作。讓每個(gè)人都能實(shí)現(xiàn)高質(zhì)量、高效率、低成本、無門檻的視頻創(chuàng)作。

除了創(chuàng)作《流浪星球3》這樣的科幻大片,通過新壹視頻大模型的秒創(chuàng)平臺(tái),也可以創(chuàng)作像夏日防暑這樣的適合在朋友圈去分享的這種視頻小貼士。隨后新壹科技CEO雷濤在現(xiàn)場直接演示起了如何在短短不到5分鐘的時(shí)間里,從一段簡單的文字描述生成一段夏日防暑避暑小秒鐘的視頻制作。

其AI幫寫功能可以快速地把作者想法變成文章(腳本),隨后秒創(chuàng)就開始用把這些文案分成若干個(gè)片段,每個(gè)片段則匹配一個(gè)視頻,隨后就到了一個(gè)視頻的草稿。隨后,可以根據(jù)創(chuàng)作者個(gè)人喜好,分別可以加入數(shù)字人播報(bào),對(duì)片段素材進(jìn)行AI作畫的優(yōu)化、或者對(duì)片段素材進(jìn)行AI制作視頻,以及還可以調(diào)背景音樂、配音等等,如此之后,就可以生成一段完整的視頻了。

類似這樣的視頻如果去剪輯可能要花上幾個(gè)小時(shí)的時(shí)間,但是現(xiàn)在通過秒創(chuàng)幾分鐘就可以完成,為了達(dá)到這個(gè)效果,秒創(chuàng)除了提供圖片、視頻、聲音、數(shù)字人生成等AIGC的功能以外,還提供了一個(gè)千萬級(jí)結(jié)構(gòu)化視頻庫為用戶提供匹配服務(wù)。

對(duì)于頭部大廠還在發(fā)布會(huì)現(xiàn)場放錄制視頻或者Demo,新壹科技的發(fā)布會(huì)則凸顯一個(gè)真實(shí)實(shí)時(shí)演示。使用基于新壹視頻大模型的秒創(chuàng)平臺(tái)可以極大地提高視頻創(chuàng)作者的工作效率,降低創(chuàng)作的門檻,這也使創(chuàng)作者從繁瑣的體力勞動(dòng)中解放出來,從事真正有創(chuàng)造力的工作。

而在前文提到的英偉達(dá)黃仁勛的廚房發(fā)布會(huì)上僅僅展示的14秒特效,則是由幾十個(gè)工程師經(jīng)歷3個(gè)多月才完成的。要造“假的老黃”,得到攝影棚里拍上幾千張各種角度的照片,通過一套3D掃描把他臉上的每道褶子都采集成數(shù)據(jù)。

而韓坤介紹,通過多模態(tài)的合成,新壹科技可以將真人錄制的視頻和音頻素材,快速生成2D寫實(shí)數(shù)字人,基于新壹視頻大模型可以在24小時(shí)之內(nèi)完成一個(gè)數(shù)字人的訓(xùn)練。

此外,新壹數(shù)字人平臺(tái)也可以選擇各種風(fēng)格的3D形象,3D數(shù)字人更適合去制作直播、實(shí)時(shí)交互場景。3D數(shù)字人設(shè)計(jì)自由度更高,同時(shí)它支持豐富的表情動(dòng)作,而且通過算法可以去驅(qū)動(dòng)它的根據(jù)上下文語境去調(diào)整表情和動(dòng)作,讓交流更加生動(dòng)有趣。雷濤現(xiàn)場演示了推薦最近上映的電影,以及北京秋天的穿衣建議,讓在場觀眾近距離、生動(dòng)地體會(huì)到數(shù)字人帶來的全新互動(dòng)體驗(yàn)。

而從14秒到一分鐘,再到數(shù)字人主持人主持一場長達(dá)一個(gè)半小時(shí)的發(fā)布會(huì),體現(xiàn)了AIGC技術(shù)的大爆發(fā),也體現(xiàn)了韓坤和他的新壹科技團(tuán)隊(duì)深厚的AI技術(shù)積累和對(duì)視頻業(yè)務(wù)的精深掌握。

數(shù)字人并不是僅僅是一個(gè)娛樂工具,或者一個(gè)簡單的對(duì)話體驗(yàn),未來幾年所有活躍在互聯(lián)網(wǎng)上的人都會(huì)擁有自己的數(shù)字分身,每個(gè)人都可以打造一個(gè)自己的虛擬IP。隨著元宇宙在產(chǎn)品技術(shù)端的突破和需求端的釋放,數(shù)字人將正式迎來爆發(fā)式增長。

正是基于對(duì)數(shù)字人產(chǎn)業(yè)的極大信心,新壹科技還在發(fā)布會(huì)現(xiàn)場推出了一款明星數(shù)字人產(chǎn)品——秒祝。秒祝通過對(duì)于明星視頻進(jìn)行訓(xùn)練,將明星的形象和聲音完美還原出來,生成對(duì)應(yīng)的明星數(shù)字人形象,最終呈現(xiàn)給用戶的是以明星數(shù)字人為主角的個(gè)性化定制的祝福視頻。

海外市場,2017年創(chuàng)辦的Cameo在2020年已吸引了超過4萬“名人”入駐,平臺(tái)年交易額超過1億美元,年增長率超過450%?;诮?0年視頻行業(yè)資源的積累,新壹科技和國內(nèi)大部分明星都有合作和信任基礎(chǔ),在發(fā)布會(huì)開場之前的暖場視頻中,就有李冰冰、黃曉明等20多位明星發(fā)來了祝福視頻。有了這樣的資源基礎(chǔ),新壹科技在秒祝產(chǎn)品上取得進(jìn)展和突破,只是時(shí)間問題。

秒祝通過幫助明星和粉絲建立聯(lián)系,從而構(gòu)建了新型的明星與粉絲的關(guān)系,通過秒祝平臺(tái)粉絲只要支付少量的費(fèi)用就可以購買明星個(gè)性化的祝福視頻。

而對(duì)于企業(yè)用戶來講,數(shù)字人祝福或者是數(shù)字人代言這樣的成本比請(qǐng)明星真人便宜的多,它的交付也要便捷和穩(wěn)定得多。明星數(shù)字人產(chǎn)品的應(yīng)用場景也將延伸到會(huì)議、活動(dòng)、廣告銷售等等,能夠?yàn)槊餍呛推髽I(yè)創(chuàng)造更大的價(jià)值。

看起來極為簡單的操作,其背后卻是韓坤和他的新壹科技團(tuán)隊(duì)多年苦練內(nèi)功厚積薄發(fā)的小片段。事實(shí)上,他們?cè)?a href="http://ygpos.cn/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD_1.html" target="_blank" class="keylink">人工智能領(lǐng)域的探索最早可追溯到2018年以前,彼時(shí)他們通過一下科技的自有內(nèi)容平臺(tái),積累了海量的音視頻數(shù)據(jù)和視頻業(yè)務(wù)經(jīng)驗(yàn)。

2020年底,韓坤和他的團(tuán)隊(duì)就將研發(fā)重心轉(zhuǎn)向AIGC視頻生成領(lǐng)域,定位也從專注移動(dòng)視頻應(yīng)用的公司,轉(zhuǎn)向以視頻為核心應(yīng)用場景的人工智能公司。

了解韓坤和他的團(tuán)隊(duì)的人都知道,新壹是在一下科技的基礎(chǔ)上新建的,這樣決定了新壹科技絕非是一匹黑馬突然出現(xiàn)在世人面前,而是以一家在視頻領(lǐng)域有深厚積累的頭部企業(yè)的身份重新回到公眾視野中來。

從韓坤創(chuàng)辦的酷六網(wǎng)成為第一家在納斯達(dá)克上市的視頻網(wǎng)站,到一下科技時(shí)期秒拍開創(chuàng)互聯(lián)網(wǎng)產(chǎn)品一周連續(xù)三次登陸《新聞聯(lián)播》的紀(jì)錄,再到秒拍和一直播同時(shí)拿下短視頻和直播全網(wǎng)用戶滲透率第一名,以及曾經(jīng)成為國內(nèi)最大的視頻生產(chǎn)平臺(tái)、牢牢占據(jù)免費(fèi)應(yīng)用下載排行榜的榜首10多天的小咖秀,韓坤和他的團(tuán)隊(duì)本身就是一段將近20年來不斷創(chuàng)造視頻行業(yè)奇跡、一直引領(lǐng)視頻行業(yè)趨勢(shì)的傳奇。

盡管一下科技曾遭遇挫折,但韓坤和他的團(tuán)隊(duì)沒有消沉,反而義無反顧投入到AIGC視頻的業(yè)務(wù)中來。四年來的臥薪嘗膽,沉默礪劍,如今光寒十四州。韓坤對(duì)此如是說:

“這是我們新的開始,我們把釋放AIGC視頻生產(chǎn)力作為公司新的定位,這也是公司要達(dá)成的首要目標(biāo)。我們的團(tuán)隊(duì)起了新壹這個(gè)名字,是因?yàn)槲覀儧Q定是從零到一去新建,之所以這樣決定不是因?yàn)樗菀祝沁@樣做最難。我們的決心和信心源自這次新建不是在零的基礎(chǔ)上新建,而是在過去無數(shù)次一下一下敲擊鍵盤積累代碼、一點(diǎn)一點(diǎn)積累技術(shù)、一幀一幀完善視頻產(chǎn)品、一秒一秒與時(shí)間賽跑的基礎(chǔ)上新建。零是我們對(duì)于過去取得輝煌的態(tài)度,壹是我們對(duì)于未來不勝不歸的決心?!?/strong>

隨著對(duì)于釋放AIGC視頻生產(chǎn)力目標(biāo)的確立,韓坤認(rèn)為,新壹團(tuán)隊(duì)已經(jīng)成為一支有新的思想、更加有戰(zhàn)斗力的團(tuán)隊(duì)。他明確指出:“AIGC會(huì)徹底改變我們的未來,未來,誰用AI多誰厲害,這次我相信我們將再次引領(lǐng)時(shí)代趨勢(shì),繼續(xù)引領(lǐng)產(chǎn)業(yè)進(jìn)步和發(fā)展,我們的新征程、新團(tuán)隊(duì)、新開始,一定會(huì)成功?!?/p>

如前文所述,這次新壹科技的新發(fā)布,乃是厚積薄發(fā)。根據(jù)當(dāng)場披露的研發(fā)規(guī)劃路線圖,新壹科技清晰構(gòu)建了一個(gè)生態(tài),即基于新壹視頻大模型的推出以秒祝和數(shù)字人為代表的AIGC平臺(tái),在多個(gè)不同的垂直場景里面提供產(chǎn)品和服務(wù),覆蓋B端和C端用戶。接下來公司還將發(fā)布一個(gè)面向政務(wù)的垂直模型平臺(tái)。

今天的視頻產(chǎn)業(yè)將通過AIGC實(shí)現(xiàn)飛躍,目前互聯(lián)網(wǎng)80%的流量都是視頻流量,但只有20%的內(nèi)容實(shí)現(xiàn)了視頻化,剩下80%的內(nèi)容的視頻化將由AIGC完成,新壹視頻大模型出現(xiàn)是正當(dāng)其時(shí)。

中央電視臺(tái)導(dǎo)演、國家一級(jí)編劇夏蒙在現(xiàn)場感慨地表示,“之前拍攝一部紀(jì)錄片,從拍攝到制作,周期要超過半年。在AI科技面前,我覺得我們的努力有時(shí)候不堪一擊。我唯一相信的是美是不會(huì)改變的,無論我們科技怎么發(fā)達(dá),它都需要記錄者。但AI的興起一定會(huì)顛覆現(xiàn)有的影視的格局,無論如何我們阻擋不了AI前進(jìn)的腳步?!?/p>

AI前進(jìn)的腳步就是由新壹科技這樣的企業(yè)一步一步走出來的,讓我們拭目以待,新壹科技,新的開始,壹定成功。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-08-01
全演藝圈明星都在關(guān)注的視頻大模型是什么樣子的?
全演藝圈明星都在關(guān)注的視頻大模型是什么樣子的?

長按掃碼 閱讀全文