8月12日消息,今年2月OpenAI發(fā)布文生視頻模型Sora,其逼真而富有想象力的視頻生成能力給大家?guī)?a href="http://ygpos.cn/AI_1.html" target="_blank" class="keylink">AI震撼。Sora雖然能生成60s視頻,但是并未對外開放使用,被視頻業(yè)者戲稱為“期貨”。
國內(nèi)AI生視頻的產(chǎn)品研發(fā)腳步也加快了,7月快手團隊的AI生視頻產(chǎn)品“可靈” 網(wǎng)頁端正式上線 , 8月字節(jié)跳動旗下的“即夢AI”網(wǎng)頁、App也開放使用。這兩款產(chǎn)品都能實現(xiàn)“文生視頻”和“圖生視頻”,都免費開放給用戶使用,可謂是真正的“現(xiàn)貨”了。
作為國內(nèi)短視頻領(lǐng)域的兩家頭部企業(yè),他們推出的AI生視頻工具表現(xiàn)如何呢?我們小小試用比較了一下,大家可以看看兩者的效果,你更喜歡哪一款。
測試條件:
目前可靈可生成5s、10s視頻,但是文生視頻“高性能模式”下不支持生成10s視頻;
即夢AI可生成3s、6s、9s、12s視頻。
因此,我們選擇了默認設(shè)置下,可靈(5s)和即夢AI(6s)圖生視頻和文生視頻生成的效果進行比較。
一、圖生視頻
從動物、風景、人物圖片來測試比較。
第一個
使用一張含有“熊貓”的照片。
輸入提示詞要求:熊貓頭抬起來,看向我,露出笑容
看看可靈(5s)和即夢AI(6s)的生成結(jié)果表現(xiàn)。
點擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
可靈比較尷尬的是,沒分清楚圖片中大熊貓的頭(朝下)和尾(在上面),直接把大熊貓的屁股給弄成頭轉(zhuǎn)向“我們”了。
即夢AI雖然分清楚了大熊貓頭尾,但是嚴重失真,出現(xiàn)了6條腿的熊貓,而且在扭動身體時,熊貓身體甚至感覺要斷掉了……
整體效果來看,除去頭1s的首位倒置,可靈生成的熊貓更逼真、運動效果更連貫。
這一局PK,站可靈(+1分)。
第二個
用一張含有上海東方明珠塔的風景圖。
輸入提示詞要求:東方明珠塔從下往上依次亮起彩燈
看看可靈(5s)和即夢AI(6s)的生成結(jié)果表現(xiàn)。
點擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
即夢AI生成的視頻中,東方明珠塔的燈從上往下亮起,和我們要求的方向相反了,視頻補充了路面上車輛經(jīng)過的視覺效果;
可靈的亮燈效果更明顯,特別突出了東方明珠塔上2個圓球的燈光視覺效果,運鏡上,我們選擇了隨機運鏡,這個視頻里整個塔都搖動了起來,感覺不太真實。
整體來看,即夢AI生成的視頻更逼真一些。
這局PK站即夢AI(+1分)。
第三
用一張含有人物的圖。
輸入提示詞要求:孩子翻動手中的書,并露出微笑
再看看可靈(5s)和即夢AI(6s)的生成結(jié)果表現(xiàn)。
點擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
即夢AI生成的視頻翻車比較明顯,首先是被翻的書像是憑空多出一本摞在了上面,另外,人物手部變形嚴重。
可靈翻書動作完成更好一些,人物手部也有變形,不過好歹還能分清手指,不至于像即夢AI那么嚴重。
這局PK站可靈(+2分)。
下面,在看看可靈和即夢AI的文生視頻表現(xiàn)。
二、文生視頻
第一個: 采用Sora經(jīng)典視頻的提示詞,讓可靈和即夢AI各自生成視頻。
輸入提示詞:A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
看看可靈(5s)和即夢AI(6s)的生成結(jié)果表現(xiàn)。
點擊圖片跳轉(zhuǎn)視頻
視頻結(jié)果比較:
即夢AI生成的人物行走時腿部姿態(tài)比較別扭,周邊人物的處理更虛化,整體效果更偏動漫視覺效果。
可靈生成的人物行走流暢,周邊出現(xiàn)的人物也更為真實,整體效果更逼真一些。
這局PK站可靈(+3分)。
第二個:
輸入提示詞文本:在桂林山水間,一位俠女乘坐竹筏前行,她穿著紅色的長裙,手拿黑色的佩劍,注視著遠方,陽光灑在水面,波光粼粼,有白云從山頂飄過。
看看可靈(5s)和即夢AI(6s)的生成結(jié)果表現(xiàn)。
點擊圖片跳轉(zhuǎn)視頻
即夢AI生成的視頻很好的理解了“桂林山水”這四個字背后的意思,視頻對喀斯特地貌特征呈現(xiàn)更好。缺憾是“黑色的佩劍”這個表現(xiàn)形式太夸張了,飄來飄去有點兒失真。
可靈生成的視頻“桂林山水”特征不明顯,不過竹筏滑動的效果及水面波動和產(chǎn)生的光影效果更好。
這局PK真是比較糾結(jié),看在“桂林山水”的面子上站即夢AI(+2分)。
最后,總結(jié)一下,從上面5五局PK來看,可靈3局勝出比即夢AI。
大家覺得哪個更好呢?
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )