8月12日消息,今年2月OpenAI發(fā)布文生視頻模型Sora,其逼真而富有想象力的視頻生成能力給大家?guī)?lái)AI震撼。Sora雖然能生成60s視頻,但是并未對(duì)外開(kāi)放使用,被視頻業(yè)者戲稱(chēng)為“期貨”。
國(guó)內(nèi)AI生視頻的產(chǎn)品研發(fā)腳步也加快了,7月快手團(tuán)隊(duì)的AI生視頻產(chǎn)品“可靈” 網(wǎng)頁(yè)端正式上線(xiàn) , 8月字節(jié)跳動(dòng)旗下的“即夢(mèng)AI”網(wǎng)頁(yè)、App也開(kāi)放使用。這兩款產(chǎn)品都能實(shí)現(xiàn)“文生視頻”和“圖生視頻”,都免費(fèi)開(kāi)放給用戶(hù)使用,可謂是真正的“現(xiàn)貨”了。
作為國(guó)內(nèi)短視頻領(lǐng)域的兩家頭部企業(yè),他們推出的AI生視頻工具表現(xiàn)如何呢?我們小小試用比較了一下,大家可以看看兩者的效果,你更喜歡哪一款。
測(cè)試條件:
目前可靈可生成5s、10s視頻,但是文生視頻“高性能模式”下不支持生成10s視頻;
即夢(mèng)AI可生成3s、6s、9s、12s視頻。
因此,我們選擇了默認(rèn)設(shè)置下,可靈(5s)和即夢(mèng)AI(6s)圖生視頻和文生視頻生成的效果進(jìn)行比較。
一、圖生視頻
從動(dòng)物、風(fēng)景、人物圖片來(lái)測(cè)試比較。
第一個(gè)
使用一張含有“熊貓”的照片。
輸入提示詞要求:熊貓頭抬起來(lái),看向我,露出笑容
看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
可靈比較尷尬的是,沒(méi)分清楚圖片中大熊貓的頭(朝下)和尾(在上面),直接把大熊貓的屁股給弄成頭轉(zhuǎn)向“我們”了。
即夢(mèng)AI雖然分清楚了大熊貓頭尾,但是嚴(yán)重失真,出現(xiàn)了6條腿的熊貓,而且在扭動(dòng)身體時(shí),熊貓身體甚至感覺(jué)要斷掉了……
整體效果來(lái)看,除去頭1s的首位倒置,可靈生成的熊貓更逼真、運(yùn)動(dòng)效果更連貫。
這一局PK,站可靈(+1分)。
第二個(gè)
用一張含有上海東方明珠塔的風(fēng)景圖。
輸入提示詞要求:東方明珠塔從下往上依次亮起彩燈
看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
即夢(mèng)AI生成的視頻中,東方明珠塔的燈從上往下亮起,和我們要求的方向相反了,視頻補(bǔ)充了路面上車(chē)輛經(jīng)過(guò)的視覺(jué)效果;
可靈的亮燈效果更明顯,特別突出了東方明珠塔上2個(gè)圓球的燈光視覺(jué)效果,運(yùn)鏡上,我們選擇了隨機(jī)運(yùn)鏡,這個(gè)視頻里整個(gè)塔都搖動(dòng)了起來(lái),感覺(jué)不太真實(shí)。
整體來(lái)看,即夢(mèng)AI生成的視頻更逼真一些。
這局PK站即夢(mèng)AI(+1分)。
第三
用一張含有人物的圖。
輸入提示詞要求:孩子翻動(dòng)手中的書(shū),并露出微笑
再看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
即夢(mèng)AI生成的視頻翻車(chē)比較明顯,首先是被翻的書(shū)像是憑空多出一本摞在了上面,另外,人物手部變形嚴(yán)重。
可靈翻書(shū)動(dòng)作完成更好一些,人物手部也有變形,不過(guò)好歹還能分清手指,不至于像即夢(mèng)AI那么嚴(yán)重。
這局PK站可靈(+2分)。
下面,在看看可靈和即夢(mèng)AI的文生視頻表現(xiàn)。
二、文生視頻
第一個(gè): 采用Sora經(jīng)典視頻的提示詞,讓可靈和即夢(mèng)AI各自生成視頻。
輸入提示詞:A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
即夢(mèng)AI生成的人物行走時(shí)腿部姿態(tài)比較別扭,周邊人物的處理更虛化,整體效果更偏動(dòng)漫視覺(jué)效果。
可靈生成的人物行走流暢,周邊出現(xiàn)的人物也更為真實(shí),整體效果更逼真一些。
這局PK站可靈(+3分)。
第二個(gè):
輸入提示詞文本:在桂林山水間,一位俠女乘坐竹筏前行,她穿著紅色的長(zhǎng)裙,手拿黑色的佩劍,注視著遠(yuǎn)方,陽(yáng)光灑在水面,波光粼粼,有白云從山頂飄過(guò)。
看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。
點(diǎn)擊圖片跳轉(zhuǎn)視頻
即夢(mèng)AI生成的視頻很好的理解了“桂林山水”這四個(gè)字背后的意思,視頻對(duì)喀斯特地貌特征呈現(xiàn)更好。缺憾是“黑色的佩劍”這個(gè)表現(xiàn)形式太夸張了,飄來(lái)飄去有點(diǎn)兒失真。
可靈生成的視頻“桂林山水”特征不明顯,不過(guò)竹筏滑動(dòng)的效果及水面波動(dòng)和產(chǎn)生的光影效果更好。
這局PK真是比較糾結(jié),看在“桂林山水”的面子上站即夢(mèng)AI(+2分)。
最后,總結(jié)一下,從上面5五局PK來(lái)看,可靈3局勝出比即夢(mèng)AI。
大家覺(jué)得哪個(gè)更好呢?
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 創(chuàng)新流通模式 國(guó)美隆重推出汽車(chē)流通品牌
- 基于openGauss的關(guān)系型數(shù)據(jù)庫(kù)產(chǎn)品占比達(dá)28.5%,成三個(gè)主流開(kāi)源技術(shù)路線(xiàn)之首
- 小米汽車(chē)交付量破13萬(wàn)完成全年目標(biāo),明年目標(biāo)或定為36萬(wàn)輛
- 《全職高手》登陸上海北外灘 成二次元愛(ài)好者熱門(mén)打卡地
- 新勢(shì)力2025年將迎決戰(zhàn)?銷(xiāo)量翻番才能活下去?
- 馬蜂窩大數(shù)據(jù):“元旦一日游”熱度上漲166%,不少人選擇“請(qǐng)四休九”
- 亞馬遜云科技陳曉建:2025年很多客戶(hù)將從生成式AI原型驗(yàn)證轉(zhuǎn)為生產(chǎn)應(yīng)用
- 林肯中國(guó)回應(yīng)“并入福特中國(guó)”傳聞:簡(jiǎn)化財(cái)務(wù)體系 各項(xiàng)業(yè)務(wù)保持不變
- 要做中國(guó)的OpenAI?字節(jié)跳動(dòng)2024年研發(fā)開(kāi)支接近BAT之和
- 螞蟻旗下跨境匯款平臺(tái)為開(kāi)發(fā)者提供收款服務(wù) 每日限額10萬(wàn)美元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。