YouTube玩轉(zhuǎn)的自動(dòng)字幕,為什么被國(guó)內(nèi)視頻網(wǎng)站“主動(dòng)錯(cuò)過(guò)”?

原標(biāo)題:YouTube玩轉(zhuǎn)的自動(dòng)字幕,為什么被國(guó)內(nèi)視頻網(wǎng)站“主動(dòng)錯(cuò)過(guò)”?

成為中國(guó)YouTube,這估計(jì)是每一家國(guó)內(nèi)視頻網(wǎng)站都曾經(jīng)設(shè)想過(guò)的目標(biāo)。

現(xiàn)在,無(wú)論是從全球市場(chǎng)規(guī)模、還是從營(yíng)收規(guī)模上來(lái)說(shuō),YouTube都已經(jīng)是一個(gè)龐然大物。而在國(guó)內(nèi),至今已難以找到一家能夠與YouTube實(shí)力相當(dāng),甚至說(shuō)模式相似的視頻網(wǎng)站了。

差異是如何產(chǎn)生的,已經(jīng)成為一個(gè)可以寫成商業(yè)專著的選題了。而這一次我們則關(guān)心一個(gè)更為細(xì)節(jié)的產(chǎn)品技術(shù)問(wèn)題,那就是在YouTube上早已實(shí)現(xiàn)的自動(dòng)字幕功能,為何沒(méi)有在國(guó)內(nèi)的主流的視頻網(wǎng)站上出現(xiàn)?

據(jù)報(bào)道,在2017年初,以UGC起家的YouTube已經(jīng)為10億條視頻提供了自動(dòng)添加字幕的服務(wù),使用者每天的播放次數(shù)超過(guò) 1500 萬(wàn)次,而且目前已支持全球10種語(yǔ)言的自動(dòng)字幕加載,以及支持包括簡(jiǎn)體中文在內(nèi)的上百種語(yǔ)言的機(jī)器翻譯。

那么這一自動(dòng)字幕的功能為何沒(méi)有被我們國(guó)內(nèi)的視頻網(wǎng)站“Copy”?

也許你第一反應(yīng)會(huì)想到技術(shù)原因。也是也不全是。畢竟近幾年,我國(guó)在自動(dòng)語(yǔ)言識(shí)別上面的技術(shù)早已成熟,在視頻網(wǎng)站上應(yīng)用也許早已不成問(wèn)題。

“是不為也,非不能也?!比绻侠戏蜃釉谑?,可能還會(huì)說(shuō)出這句話來(lái)。但原因究竟是啥,恐怕還是要繼續(xù)追問(wèn)下去,而最終我們其實(shí)還是想對(duì)這些國(guó)內(nèi)視頻網(wǎng)站的新老玩家們提問(wèn)下:

這么“香”的技術(shù),到底要不要學(xué)習(xí)一下呢?

自動(dòng)字幕:從Goodness到Business

YouTube的自動(dòng)字幕功能是在2009年由谷歌的工程師們開(kāi)發(fā)的,那時(shí)離谷歌收購(gòu)YouTube已經(jīng)過(guò)去三年了。

這一功能的初衷是,通過(guò)將視頻聲音轉(zhuǎn)化成文字字幕,為全世界有聽(tīng)力障礙的用戶提供便利。而開(kāi)發(fā)這一功能的軟件工程師肯·海倫斯坦也正是一位聾啞人士。

眾所周知,YouTube是從用戶UGC視頻內(nèi)容起家的,目前仍然是全球最大的UGC視頻網(wǎng)站。當(dāng)前月用戶訪問(wèn)數(shù)可以達(dá)到18億,用戶每分鐘上傳視頻時(shí)長(zhǎng)達(dá)到400小時(shí),并且時(shí)長(zhǎng)還在增長(zhǎng)。

這同時(shí)意味著,有大量上傳的UGC視頻中是沒(méi)有主動(dòng)添加字幕的。這對(duì)于正常聽(tīng)力的用戶來(lái)說(shuō),并沒(méi)有什么影響,而對(duì)于有聽(tīng)力障礙的人來(lái)說(shuō),則相當(dāng)于缺少了極其重要的音頻信息。

而自動(dòng)字幕的加入,則在一定程度上幫助了聽(tīng)障用戶獲取更多的信息渠道。

目前,谷歌和YouTube團(tuán)隊(duì)正在利用機(jī)器學(xué)習(xí)為自動(dòng)字幕增加音效信息,從而更大程度地豐富音頻內(nèi)容的表達(dá)。通過(guò)添加如鈴聲、狗叫聲、敲門聲等音效字幕,也正是出于改善聾啞或聽(tīng)障人士的觀看體驗(yàn)而進(jìn)行的技術(shù)改進(jìn)。

這樣一項(xiàng)出于社會(huì)責(zé)任感和用戶公平體驗(yàn)的技術(shù),也帶來(lái)了額外的市場(chǎng)推廣價(jià)值。

隨著自動(dòng)字幕可以識(shí)別的語(yǔ)種的增加,以及自動(dòng)翻譯功能的加入,這一項(xiàng)技術(shù)成為一項(xiàng)全球用戶都可以受益的功能。比如,大量?jī)?yōu)質(zhì)的英語(yǔ)原聲知識(shí)分享視頻可以通過(guò)自動(dòng)添加英語(yǔ)字幕,再轉(zhuǎn)為其他語(yǔ)種,供非英語(yǔ)區(qū)的用戶觀看學(xué)習(xí)。這顯然對(duì)YouTube的全球化推廣產(chǎn)生了積極的推動(dòng)作用。

在每天上千萬(wàn)次的自動(dòng)字幕的使用中,語(yǔ)音識(shí)別難免會(huì)出現(xiàn)一定錯(cuò)誤,但隨著YouTube社區(qū)用戶對(duì)這些自動(dòng)字幕信息進(jìn)行評(píng)論和編輯后,這些信息又會(huì)再進(jìn)入機(jī)器學(xué)習(xí)的流程,從而幫助自動(dòng)字幕系統(tǒng)更好地提高準(zhǔn)確率。同時(shí),自動(dòng)字幕及機(jī)器翻譯準(zhǔn)確度的提升,又推動(dòng)內(nèi)容推薦的精準(zhǔn)度的提升,進(jìn)一步增加用戶粘性和使用時(shí)長(zhǎng)。

一項(xiàng)幫助提升用戶體驗(yàn)的AI技術(shù),又在用戶的海量數(shù)據(jù)的幫助下變得更加強(qiáng)大,很好地印證了“科技向善”可以帶來(lái)更多意想不到的好處。

當(dāng)然,這里有一點(diǎn)比較遺憾的地方是,如果你有機(jī)會(huì)使用YouTube的中文簡(jiǎn)體的自動(dòng)翻譯功能的時(shí)候,你可能并不好理解翻譯出來(lái)的中文到底在表達(dá)什么意思?

一來(lái),可能視頻中中文口語(yǔ)化的音頻內(nèi)容確實(shí)不好翻譯;二來(lái),由于你懂得的原因,這個(gè)自動(dòng)翻譯的數(shù)據(jù)模型并沒(méi)有得到有效的訓(xùn)練。

那么,自動(dòng)字幕如此得天獨(dú)厚的市場(chǎng)空白、如此巨大的應(yīng)用規(guī)模,以及如此現(xiàn)成的技術(shù)條件,為什么沒(méi)有國(guó)內(nèi)的視頻網(wǎng)站主動(dòng)去使用呢?

為什么國(guó)內(nèi)視頻網(wǎng)站們“主動(dòng)”錯(cuò)過(guò)這一技術(shù)?

想要回答幾大國(guó)內(nèi)視頻網(wǎng)站“為啥沒(méi)有采用自動(dòng)字幕”這一小問(wèn)題前,需要先回答“他們?yōu)樯稕](méi)有繼續(xù)發(fā)展UGC的內(nèi)容模式,而是轉(zhuǎn)向了影視劇版權(quán)購(gòu)買的模式”?

十年多前的中國(guó)還不是一塊UGC的沃土,相比較于美國(guó)家庭掀起的家庭錄像及生活視頻的制作消費(fèi)的浪潮,當(dāng)時(shí)的國(guó)人對(duì)于優(yōu)秀影視作品的需求更為強(qiáng)烈。UGC內(nèi)容并沒(méi)有實(shí)現(xiàn)更好的商業(yè)變現(xiàn)方式,堅(jiān)持以UGC為定位“土豆網(wǎng)”成了早早出局的元老級(jí)玩家。

而影視劇作品是不缺少優(yōu)質(zhì)的人工字幕翻譯的。在國(guó)家嚴(yán)格把控版權(quán)問(wèn)題之前,在這些視頻網(wǎng)站上,大量的海外電視劇電影被以“用戶上傳”的名義免費(fèi)播放。同時(shí),提供國(guó)外影視劇翻譯的字幕組的出現(xiàn),也讓視頻網(wǎng)站們可以以極低的成本獲得優(yōu)質(zhì)、準(zhǔn)確的字幕。

2010年之后,隨著愛(ài)奇藝、騰訊視頻的出現(xiàn),優(yōu)酷土豆合并后又被阿里收購(gòu)為標(biāo)志的BAT巨頭入場(chǎng),視頻網(wǎng)站們徹底進(jìn)入了以PGC影視劇內(nèi)容生態(tài)為主的“版權(quán)”燒錢爭(zhēng)奪戰(zhàn)。這時(shí)的巨頭們已經(jīng)開(kāi)始向往Netflix的自制會(huì)員付費(fèi)模式了。

UGC內(nèi)容當(dāng)中的字幕添加問(wèn)題,從商業(yè)價(jià)值上也就再也沒(méi)有進(jìn)入這些網(wǎng)站的決策范圍了。

再者,中國(guó)自身市場(chǎng)的數(shù)億的用戶紅利,使得當(dāng)時(shí)的視頻網(wǎng)站們?cè)跔?zhēng)奪存量市場(chǎng)都有些自顧不暇,自然也沒(méi)有動(dòng)過(guò)“出?!钡哪铑^。沒(méi)有出海需求,也就沒(méi)有海外用戶。而統(tǒng)一的中文語(yǔ)言環(huán)境并不需要對(duì)中文音頻進(jìn)行多語(yǔ)種的翻譯。即使隨著機(jī)器學(xué)習(xí)、自然語(yǔ)言處理技術(shù)的出現(xiàn),也沒(méi)有視頻大廠們想要費(fèi)力去應(yīng)用。

對(duì)于長(zhǎng)期處在燒錢虧損狀態(tài)的玩家們,照顧聽(tīng)障者等弱勢(shì)人群的觀看體驗(yàn),看來(lái)也沒(méi)有進(jìn)入到他們的產(chǎn)品目標(biāo)當(dāng)中。畢竟主流的影視劇視頻資源和PCG內(nèi)容資源都已經(jīng)使用了人工添加的字幕。邊緣化的UGC內(nèi)容和特殊的少數(shù)用戶群,似乎并不需要投入過(guò)多精力。

從以上種種的原因看來(lái),動(dòng)力不足,正是這些視頻大廠們不愿玩轉(zhuǎn)“自動(dòng)字幕”的最好解釋。而無(wú)所作為并不代表他們未來(lái)也不需要這項(xiàng)技術(shù)。

在當(dāng)前人口紅利消失、用戶增加趨緩的情況下,出海成為近兩年來(lái)幾大視頻網(wǎng)站玩家們的集體行動(dòng)。除了將國(guó)內(nèi)優(yōu)秀的影視劇內(nèi)容對(duì)外輸出外,吸引海外用戶制作分享大量的優(yōu)質(zhì)UGC內(nèi)容,成為產(chǎn)品海外市場(chǎng)本地化發(fā)展的必由之路。

而從YouTube的啟示來(lái)看,增加這一自動(dòng)字幕以及自動(dòng)語(yǔ)言翻譯功能,將會(huì)對(duì)UGC內(nèi)容生態(tài)帶來(lái)非常積極的正面作用。

十年來(lái),狂飆突進(jìn)中落下的功課,是不是該補(bǔ)一補(bǔ)了?

破解出海困境,自動(dòng)字幕可助一臂之力

當(dāng)前,以海外版抖音TikTok為代表的短視頻應(yīng)用出海方興未艾,而國(guó)內(nèi)以騰訊、愛(ài)奇藝為代表的長(zhǎng)視頻網(wǎng)站巨頭也已經(jīng)開(kāi)啟出海模式。當(dāng)前,主要扎堆進(jìn)入東南亞市場(chǎng)。

TikTok這類更具興趣屬性和娛樂(lè)表演屬性的短視頻應(yīng)用,沉浸式的算法推薦也同樣在海外取得了極大的成功;帶版權(quán)的背景音樂(lè)、炸裂特效和簡(jiǎn)單方便的字幕特效和傻瓜式的剪輯手法,使得海外年輕人們的接受和制作門檻更低。TikTok很快在日韓、美國(guó)以及東南亞等國(guó)家快速流行起來(lái)。

相比之下,依靠精品內(nèi)容出海的視頻網(wǎng)站則顯得進(jìn)展緩慢,需要步步為營(yíng),穩(wěn)扎穩(wěn)打。

我國(guó)視頻網(wǎng)站的出海時(shí)間不長(zhǎng),但已經(jīng)經(jīng)歷了三個(gè)階段。先是經(jīng)歷了海外優(yōu)質(zhì)內(nèi)容的引入;然后再?gòu)?fù)制這一模式加強(qiáng)自身版權(quán)內(nèi)容的對(duì)外輸出。而在去年,則開(kāi)始主導(dǎo)搭建海外的自有媒體平臺(tái),并開(kāi)始與海外各個(gè)國(guó)家的主流媒體、運(yùn)營(yíng)商等達(dá)成長(zhǎng)期戰(zhàn)略合作。

華語(yǔ)內(nèi)容的輸出成為本次出海的重點(diǎn),但是想要在海外市場(chǎng)真正取得成功,那必然還是要吸引本地化的視頻內(nèi)容。據(jù)調(diào)查,海外視頻用戶更會(huì)為帶有本地文化印記和本土語(yǔ)言的視頻內(nèi)容進(jìn)行付費(fèi)。因此,鼓勵(lì)海外本地的UGC內(nèi)容的制作和分享,培養(yǎng)和建成規(guī)?;鸵?guī)范化的本地內(nèi)容生態(tài),才能最終留存住本地化用戶,形成長(zhǎng)期使用習(xí)慣。

除了進(jìn)行一定的原創(chuàng)內(nèi)容補(bǔ)貼,或者參照YouTube的廣告分成模式外,降低UGC制作的使用門檻,提升海外用戶的觀影體驗(yàn),也是更為根本的解決方案。

這時(shí)候,基于語(yǔ)音識(shí)別和機(jī)器翻譯的能力,增加自動(dòng)字幕以及自動(dòng)翻譯的功能,可以更好地幫助制作者完成字幕的添加工作,同時(shí)幫助大量用戶快速翻譯其他國(guó)家的視頻內(nèi)容。

一、通過(guò)加入對(duì)視頻內(nèi)容的自動(dòng)字幕的加入,可以吸引海外用戶更愿意主動(dòng)創(chuàng)作本土內(nèi)容,增進(jìn)海外用戶對(duì)本土內(nèi)容的觀看和消費(fèi)。

二、通過(guò)引入多語(yǔ)種之間的字幕翻譯,來(lái)提升和優(yōu)化海外用戶的內(nèi)容推薦體系,從而形成豐富的海外生態(tài),從而提高視頻內(nèi)容的國(guó)際化推廣的力度。

當(dāng)然,自動(dòng)字幕和自動(dòng)翻譯功能的實(shí)現(xiàn)還受到語(yǔ)料資料的限制,國(guó)內(nèi)的視頻網(wǎng)站們除了自身所熟悉的中文視頻外,還要對(duì)東南亞各國(guó)的音視頻的語(yǔ)音進(jìn)行大量地采集和訓(xùn)練。

出海難題無(wú)數(shù)條,起碼這一技術(shù)可以作為在出海中打拼的“騰愛(ài)們”必須要補(bǔ)上的一門基礎(chǔ)課,而視頻內(nèi)容的本地化UGC可以成為下一輪出海重點(diǎn)發(fā)力的新嘗試。

欲戴王冠,必承其重。眾所周知,YouTube在全球獲得的巨大流量,來(lái)自于YouTube的強(qiáng)大的技術(shù)能力、廣告營(yíng)銷體系以及谷歌的軟硬件支持……從今天YouTube的成功去倒推原因,我們會(huì)列出一串長(zhǎng)長(zhǎng)的清單。在這份清單的一行里,我們注意到了出于社會(huì)責(zé)任而添加的一項(xiàng)小小的功能,而這一功能卻帶來(lái)每天上千萬(wàn)人的使用。

對(duì)于國(guó)內(nèi)的視頻網(wǎng)站來(lái)說(shuō),這確實(shí)是值得學(xué)習(xí)的一個(gè)經(jīng)驗(yàn)。即使一開(kāi)始并沒(méi)有特別緊要的應(yīng)用場(chǎng)景,也沒(méi)有明顯的商業(yè)利益,但是可以通過(guò)技術(shù),特別是AI技術(shù),來(lái)大規(guī)模地、以無(wú)限降低邊際成本的方式,來(lái)改善用戶體驗(yàn),那一定是值得去嘗試的。

而現(xiàn)在,國(guó)內(nèi)視頻網(wǎng)站、短視頻已經(jīng)處在揚(yáng)帆出海的風(fēng)口,語(yǔ)音識(shí)別以及機(jī)器翻譯的技術(shù)也現(xiàn)成可用,而全球文化多元化交流的需求也正在井噴。出海的這些玩家們想要抓住這場(chǎng)新的全球UGC內(nèi)容爆發(fā)的紅利,自動(dòng)字幕技術(shù)大有可為。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2020-04-07
YouTube玩轉(zhuǎn)的自動(dòng)字幕,為什么被國(guó)內(nèi)視頻網(wǎng)站“主動(dòng)錯(cuò)過(guò)”?
這一次我們則關(guān)心一個(gè)更為細(xì)節(jié)的產(chǎn)品技術(shù)問(wèn)題,那就是在YouTube上早已實(shí)現(xiàn)的自動(dòng)字幕功能,為何沒(méi)有在國(guó)內(nèi)的主流的視頻網(wǎng)站上出現(xiàn)?同時(shí),提供國(guó)外影視劇翻譯的字幕組的出現(xiàn),也讓視頻網(wǎng)站們可以以極低的成本

長(zhǎng)按掃碼 閱讀全文