AI生視頻:快手可靈 VS 字節(jié)即夢(mèng)AI,誰(shuí)勝出?

8月12日消息,今年2月OpenAI發(fā)布文生視頻模型Sora,其逼真而富有想象力的視頻生成能力給大家?guī)?lái)AI震撼。Sora雖然能生成60s視頻,但是并未對(duì)外開(kāi)放使用,被視頻業(yè)者戲稱(chēng)為“期貨”。

國(guó)內(nèi)AI生視頻的產(chǎn)品研發(fā)腳步也加快了,7月快手團(tuán)隊(duì)的AI生視頻產(chǎn)品“可靈” 網(wǎng)頁(yè)端正式上線(xiàn) , 8月字節(jié)跳動(dòng)旗下的“即夢(mèng)AI”網(wǎng)頁(yè)、App也開(kāi)放使用。這兩款產(chǎn)品都能實(shí)現(xiàn)“文生視頻”和“圖生視頻”,都免費(fèi)開(kāi)放給用戶(hù)使用,可謂是真正的“現(xiàn)貨”了。

作為國(guó)內(nèi)短視頻領(lǐng)域的兩家頭部企業(yè),他們推出的AI生視頻工具表現(xiàn)如何呢?我們小小試用比較了一下,大家可以看看兩者的效果,你更喜歡哪一款。

測(cè)試條件:

目前可靈可生成5s、10s視頻,但是文生視頻“高性能模式”下不支持生成10s視頻;

即夢(mèng)AI可生成3s、6s、9s、12s視頻。

因此,我們選擇了默認(rèn)設(shè)置下,可靈(5s)和即夢(mèng)AI(6s)圖生視頻和文生視頻生成的效果進(jìn)行比較。

一、圖生視頻

從動(dòng)物、風(fēng)景、人物圖片來(lái)測(cè)試比較。

第一個(gè)

使用一張含有“熊貓”的照片。

輸入提示詞要求:熊貓頭抬起來(lái),看向我,露出笑容

看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。

點(diǎn)擊圖片跳轉(zhuǎn)視頻

視頻結(jié)果比較:

可靈比較尷尬的是,沒(méi)分清楚圖片中大熊貓的頭(朝下)和尾(在上面),直接把大熊貓的屁股給弄成頭轉(zhuǎn)向“我們”了。

即夢(mèng)AI雖然分清楚了大熊貓頭尾,但是嚴(yán)重失真,出現(xiàn)了6條腿的熊貓,而且在扭動(dòng)身體時(shí),熊貓身體甚至感覺(jué)要斷掉了……

整體效果來(lái)看,除去頭1s的首位倒置,可靈生成的熊貓更逼真、運(yùn)動(dòng)效果更連貫。

這一局PK,站可靈(+1分)。

第二個(gè)

用一張含有上海東方明珠塔的風(fēng)景圖。

輸入提示詞要求:東方明珠塔從下往上依次亮起彩燈

看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。

點(diǎn)擊圖片跳轉(zhuǎn)視頻

視頻結(jié)果比較:

即夢(mèng)AI生成的視頻中,東方明珠塔的燈從上往下亮起,和我們要求的方向相反了,視頻補(bǔ)充了路面上車(chē)輛經(jīng)過(guò)的視覺(jué)效果;

可靈的亮燈效果更明顯,特別突出了東方明珠塔上2個(gè)圓球的燈光視覺(jué)效果,運(yùn)鏡上,我們選擇了隨機(jī)運(yùn)鏡,這個(gè)視頻里整個(gè)塔都搖動(dòng)了起來(lái),感覺(jué)不太真實(shí)。

整體來(lái)看,即夢(mèng)AI生成的視頻更逼真一些。

這局PK站即夢(mèng)AI(+1分)。

第三

用一張含有人物的圖。

輸入提示詞要求:孩子翻動(dòng)手中的書(shū),并露出微笑

再看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。

點(diǎn)擊圖片跳轉(zhuǎn)視頻

視頻結(jié)果比較:

即夢(mèng)AI生成的視頻翻車(chē)比較明顯,首先是被翻的書(shū)像是憑空多出一本摞在了上面,另外,人物手部變形嚴(yán)重。

可靈翻書(shū)動(dòng)作完成更好一些,人物手部也有變形,不過(guò)好歹還能分清手指,不至于像即夢(mèng)AI那么嚴(yán)重。

這局PK站可靈(+2分)。

下面,在看看可靈和即夢(mèng)AI的文生視頻表現(xiàn)。

二、文生視頻

第一個(gè): 采用Sora經(jīng)典視頻的提示詞,讓可靈和即夢(mèng)AI各自生成視頻。

輸入提示詞:A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。

點(diǎn)擊圖片跳轉(zhuǎn)視頻

視頻結(jié)果比較:

即夢(mèng)AI生成的人物行走時(shí)腿部姿態(tài)比較別扭,周邊人物的處理更虛化,整體效果更偏動(dòng)漫視覺(jué)效果。

可靈生成的人物行走流暢,周邊出現(xiàn)的人物也更為真實(shí),整體效果更逼真一些。

這局PK站可靈(+3分)。

第二個(gè):

輸入提示詞文本:在桂林山水間,一位俠女乘坐竹筏前行,她穿著紅色的長(zhǎng)裙,手拿黑色的佩劍,注視著遠(yuǎn)方,陽(yáng)光灑在水面,波光粼粼,有白云從山頂飄過(guò)。

看看可靈(5s)和即夢(mèng)AI(6s)的生成結(jié)果表現(xiàn)。

點(diǎn)擊圖片跳轉(zhuǎn)視頻

即夢(mèng)AI生成的視頻很好的理解了“桂林山水”這四個(gè)字背后的意思,視頻對(duì)喀斯特地貌特征呈現(xiàn)更好。缺憾是“黑色的佩劍”這個(gè)表現(xiàn)形式太夸張了,飄來(lái)飄去有點(diǎn)兒失真。

可靈生成的視頻“桂林山水”特征不明顯,不過(guò)竹筏滑動(dòng)的效果及水面波動(dòng)和產(chǎn)生的光影效果更好。

這局PK真是比較糾結(jié),看在“桂林山水”的面子上站即夢(mèng)AI(+2分)。

最后,總結(jié)一下,從上面5五局PK來(lái)看,可靈3局勝出比即夢(mèng)AI。

大家覺(jué)得哪個(gè)更好呢?

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-08-12
AI生視頻:快手可靈 VS 字節(jié)即夢(mèng)AI,誰(shuí)勝出?
國(guó)內(nèi)AI生視頻的產(chǎn)品研發(fā)腳步也加快了,7月快手團(tuán)隊(duì)的AI生視頻產(chǎn)品“可靈” 網(wǎng)頁(yè)端正式上線(xiàn) , 8月字節(jié)跳動(dòng)旗下的“即夢(mèng)AI”網(wǎng)頁(yè)、App也開(kāi)放使用。這兩款產(chǎn)品都能實(shí)現(xiàn)“文生視頻”和“圖生視頻”,都免費(fèi)開(kāi)放給用戶(hù)使用,可謂是真正的“現(xiàn)貨”了。

長(zhǎng)按掃碼 閱讀全文