在電視和電影的拍攝中,演員在表演中經(jīng)常會(huì)不小心犯下一些小錯(cuò)誤。對(duì)于影片的剪輯師而言,如果不想要花費(fèi)巨資重新拍攝,那么就只能接受這些瑕疵。
那么我們可以想象一下,剪輯師是否能通過(guò)文字劇本來(lái)重新修改視頻。這個(gè)過(guò)程簡(jiǎn)單地就像平時(shí)處理word文檔那樣,添加你想要的內(nèi)容,刪除多余的內(nèi)容,甚至完全重新排列拍攝的影片,讓它看起來(lái)就像一個(gè)全新的視頻那樣,毫無(wú)瑕疵。
一批來(lái)自斯坦福大學(xué)、馬克斯普朗克信息學(xué)研究所、普林斯頓大學(xué)和Adobe Research的研究人員組織了一個(gè)團(tuán)隊(duì),他們創(chuàng)建了一種算法,它能編輯頭部特寫(xiě)的對(duì)話(huà)視頻——即視頻中的講話(huà)人主要出現(xiàn)肩膀以上的部分。
對(duì)于視頻剪輯師和發(fā)行商而言,這個(gè)研究成果會(huì)非常有用。但也有人擔(dān)心這種工具會(huì)影響網(wǎng)上視頻和圖片的可信性。研究人員也針對(duì)這些工具提出了一些使用準(zhǔn)則,提示觀看者這些視頻受到過(guò)修改。
“不幸的是,這種技術(shù)永遠(yuǎn)會(huì)招來(lái)不法分子的注意。盡管如此,它能帶來(lái)更多創(chuàng)造性的視頻編輯和內(nèi)容創(chuàng)作應(yīng)用,因此也是值得的?!彼固垢4髮W(xué)博士后Ohad Fried說(shuō)道。
這種應(yīng)用通過(guò)全新的腳本從各種視頻片段中提取講話(huà)時(shí)的唇部動(dòng)作,并采用機(jī)器學(xué)習(xí)將它“移植”到目標(biāo)視頻中,讓觀眾看起來(lái)更自然。換句話(huà)說(shuō),它就是讓“唇部運(yùn)動(dòng)”和文本同步。
“從表面上看,這些視頻非常完美,它不再需要重新錄制?!盕ried說(shuō)道,他以第一作者的身份發(fā)表了一篇相關(guān)研究的論文,目前該論文已經(jīng)上傳至論文預(yù)印本網(wǎng)站arXiv上。該項(xiàng)目始于兩年前,當(dāng)時(shí)Fried還只是普林斯頓大學(xué)計(jì)算機(jī)科學(xué)家Adam Finkelstein手下的一名研究生。
一旦演員在表演時(shí)講錯(cuò)了臺(tái)詞,剪輯師只需要重新修改一下劇本臺(tái)詞,這個(gè)應(yīng)用會(huì)自動(dòng)找到視頻中對(duì)應(yīng)的片段,并搜索該視頻中其他的臺(tái)詞,重新組裝這段語(yǔ)音。換句話(huà)說(shuō),這就是在重寫(xiě)視頻的臺(tái)詞,就像我們修改文檔中拼錯(cuò)的單詞那樣。該算法需要原始視頻為素材,修改時(shí)間約為40分鐘。
在此之后,這個(gè)算法會(huì)從其他視頻中尋找人物講話(huà)時(shí)的嘴部動(dòng)作,生成新的視頻。
為了讓視頻看起來(lái)更加自然,該算法還能讓運(yùn)動(dòng)參數(shù)的變化更加平滑,并進(jìn)行3D動(dòng)畫(huà)渲染。最后,它會(huì)通過(guò)一種名為Neural Rendering的機(jī)器學(xué)習(xí)技術(shù)提高視頻的仿真度。
在138位參與者的測(cè)試?yán)?,該團(tuán)隊(duì)的編輯結(jié)果中有60%被評(píng)為“逼真”。也就是說(shuō)加工后的視頻和原始視頻非常像,但Fried表示還有很大的提升空間。(來(lái)源:獵云網(wǎng))
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 比亞迪上半年研發(fā)投入超200億元,比特斯拉多出約40億
- 英偉達(dá)第二財(cái)季營(yíng)收300.40億美元 凈利潤(rùn)同比大增168%
- 知名特斯拉投資人“心灰意冷”:持倉(cāng)已砍半,AI和機(jī)器人都救不了它!
- 騰訊音樂(lè)Q2持續(xù)高質(zhì)量增長(zhǎng):總收入71.6億元,付費(fèi)用戶(hù)數(shù)1.17億
- 微軟Q4營(yíng)收647億美元凈利220億 盤(pán)后一度大跌7%
- 英偉達(dá)市值接近蘋(píng)果 高增長(zhǎng)可以持續(xù)嗎?
- 優(yōu)信發(fā)布財(cái)報(bào):零售量環(huán)比同比均增長(zhǎng) 預(yù)計(jì)2025財(cái)年業(yè)務(wù)量增長(zhǎng)超200%
- 36氪Q4季報(bào)圖解:營(yíng)收1億同比增7% 凈虧1766萬(wàn)
- 聯(lián)想控股2023年凈虧損38.74億元同比轉(zhuǎn)虧,營(yíng)收下降10%
- 騰訊音樂(lè)Q4及年報(bào):在線音樂(lè)強(qiáng)勁增長(zhǎng),持續(xù)促進(jìn)產(chǎn)業(yè)共贏
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。