不僅給QQ開(kāi)美顏?zhàn)兟暎@個(gè)實(shí)驗(yàn)室還改變了老大爺?shù)耐砟晟?/h1>

1999 年騰訊發(fā)布 QQ 時(shí),吳祖榕成為了第一批用戶。左小祥那會(huì)還在上高中,兩年后,他也成為了擁有 QQ 號(hào)的“弄潮鵝”。

同一年,劉杉在美國(guó)讀博士,那時(shí),讓她暢想二十年后的生活未免有點(diǎn)太早。

2005年,騰訊 QQ 的同時(shí)在線人數(shù)首次突破了 1000 萬(wàn),僅用了四年時(shí)間就達(dá)到了 100 倍的增長(zhǎng)。在QQ 飛速發(fā)展的這一年,吳加入了騰訊,負(fù)責(zé)QQ客戶端的開(kāi)發(fā)工作。四年后,左也加入了騰訊。

那會(huì)兒,騰訊雖然有名,卻也沒(méi)有那么有名,至少劉杉在美國(guó)還沒(méi)聽(tīng)過(guò)這個(gè)企業(yè)。

三條線在 2017 年匯成一點(diǎn),這個(gè)“點(diǎn)”就是騰訊音視頻實(shí)驗(yàn)室。

建團(tuán)隊(duì)做標(biāo)準(zhǔn)

2016 年 11月,騰訊音視頻技術(shù)中心升級(jí)為騰訊音視頻實(shí)驗(yàn)室。

吳祖榕一開(kāi)始在 QQ 團(tuán)隊(duì)負(fù)責(zé) QQ 客戶端的開(kāi)發(fā)工作,后來(lái)帶團(tuán)隊(duì),成為 QQ 客戶端團(tuán)隊(duì)的技術(shù)總監(jiān)。2015年,他負(fù)責(zé)商業(yè)化部門的研發(fā)團(tuán)隊(duì)管理工作。到了2017年6月,吳輪值到了音視頻實(shí)驗(yàn)室。

吳到了實(shí)驗(yàn)室后,覺(jué)得視頻標(biāo)準(zhǔn)很重要,騰訊音視頻實(shí)驗(yàn)室也應(yīng)參與打造音視頻技術(shù)標(biāo)準(zhǔn),所以,騰訊音視頻實(shí)驗(yàn)室開(kāi)始全球范圍內(nèi)尋找視頻標(biāo)準(zhǔn)的領(lǐng)軍人物。

他們把目光投向了曾在多家國(guó)際知名企業(yè)負(fù)責(zé)多媒體技術(shù)研發(fā)的專家劉杉。

劉杉在美二十年,多次擔(dān)任音視頻國(guó)際標(biāo)準(zhǔn)組織的主席,她是 200 多個(gè)美國(guó)和全球?qū)@暾?qǐng)的發(fā)明人,其中許多發(fā)明已被授權(quán)并成為標(biāo)準(zhǔn)基本專利或被內(nèi)置于多款通信和多媒體產(chǎn)品中。她還是已定稿國(guó)際標(biāo)準(zhǔn)Rec. ITU-T H.265 v4 | ISO/IEC 23008-2:2017和正在制定的下一代國(guó)際標(biāo)準(zhǔn)VVC的聯(lián)席主編。

用一句話概括就是,劉杉在全球音視頻領(lǐng)域耕耘已久,經(jīng)驗(yàn)豐富,成績(jī)斐然。

當(dāng)騰訊向劉杉發(fā)出邀請(qǐng)時(shí),她是遲疑的。

2017 年,騰訊在全球 500 強(qiáng)公司中排名第 478 位,相較于劉的幾個(gè)老東家——半導(dǎo)體全球頂尖 IC 設(shè)計(jì)公司聯(lián)發(fā)科、娛樂(lè)商業(yè)巨頭索尼和排名第 83 位的華為,好像是這么個(gè)意思。

再者,相較于高通、三星、愛(ài)立信、諾基亞、LG、華為、聯(lián)發(fā)科等公司在音視頻領(lǐng)域的研究積累,騰訊可以說(shuō)是真的晚起步了,劉杉遲疑也情有可原。

但騰訊對(duì)于音視頻實(shí)驗(yàn)室是有長(zhǎng)久規(guī)劃的。

騰訊音視頻實(shí)驗(yàn)室是騰訊 SNG 布局 AI 的“三駕馬車”之一,騰訊的高級(jí)執(zhí)行副總裁湯道生掌管這里。劉杉一路談到湯道生,湯對(duì)劉說(shuō):“第一年沒(méi)什么要求,只要先把團(tuán)隊(duì)組建起來(lái)就可以了,但騰訊的目標(biāo)是出海和國(guó)際化,音視頻領(lǐng)域一定要做成國(guó)際標(biāo)準(zhǔn)。”

要把“孩子”一把拉扯大,騰訊對(duì)“孩子”期望還挺高,劉杉覺(jué)得,這事可以搞。

2017 年 11 月,劉杉加入騰訊音視頻實(shí)驗(yàn)室的第一個(gè)任務(wù)是把視頻標(biāo)準(zhǔn)團(tuán)隊(duì)組建起來(lái),代表騰訊去標(biāo)準(zhǔn)會(huì)上提交提案。短短兩個(gè)月時(shí)間內(nèi),新人騰訊擠在一群老牌標(biāo)準(zhǔn)團(tuán)隊(duì)里,向 MPEG 122 會(huì)議提交了十個(gè)高質(zhì)量的提案。

2018 年 7 月盧布爾雅納的標(biāo)準(zhǔn)會(huì)議上,騰訊音視頻實(shí)驗(yàn)室的多項(xiàng)技術(shù)被 VVC 標(biāo)準(zhǔn)采納。在 2018 年 10 月澳門的標(biāo)準(zhǔn)會(huì)議上,在多項(xiàng)技術(shù)提案被 VVC 標(biāo)準(zhǔn)采納之余,王者榮耀視頻片段被納入 VVC標(biāo)準(zhǔn)制定測(cè)試集,確保騰訊重要應(yīng)用場(chǎng)景將受益于新一代視頻壓縮標(biāo)準(zhǔn)。

騰訊音視頻實(shí)驗(yàn)室還在這一年內(nèi)聚集了其他標(biāo)準(zhǔn)領(lǐng)域的大牛。湯道生原本以為在一年時(shí)間里,音視頻實(shí)驗(yàn)室頂多把路修到“二環(huán)”,沒(méi)想到一下到了“五環(huán)”。

一直擔(dān)任自適應(yīng)比特率流媒體技術(shù) DASH 工業(yè)論壇主席和董事長(zhǎng)的伊拉齊·索達(dá)加于 2018 年年底加入騰訊音視頻實(shí)驗(yàn)室,擔(dān)任首席研究員。在加入騰訊之前,他曾在微軟與各種研究和產(chǎn)品小組合作,參與多媒體技術(shù)的發(fā)展和標(biāo)準(zhǔn)化方面的研究和落地, 也曾負(fù)責(zé) Windows 的多媒體交付策略、產(chǎn)品對(duì)齊和標(biāo)準(zhǔn)化項(xiàng)目。同時(shí),他也是首個(gè)基于 HTTP 的自適應(yīng)比特率串流解決方案 MPEG CMAF 小組的聯(lián)合主席。

Vidyo公司知識(shí)產(chǎn)權(quán)與標(biāo)準(zhǔn)的副總裁斯蒂芬·溫格于 2018 年年初加入騰訊音視頻實(shí)驗(yàn)室,擔(dān)任知識(shí)產(chǎn)權(quán)與標(biāo)準(zhǔn)的高級(jí)總監(jiān)。在加入騰訊之前,他曾參與新多媒體技術(shù)的標(biāo)準(zhǔn)化組織,尤其是 IETF、ITU-T 和 MPEG。

緊跟國(guó)外標(biāo)準(zhǔn),國(guó)內(nèi)標(biāo)準(zhǔn)建立上也要有一席之地。

音視頻編碼標(biāo)準(zhǔn)(AVS)是我國(guó)具備自主知識(shí)產(chǎn)權(quán)的第二代信源編碼標(biāo)準(zhǔn),騰訊音視頻實(shí)驗(yàn)室的 TPG格式已被 AVS2 標(biāo)準(zhǔn)接收,并在參與 AVS3 的標(biāo)準(zhǔn)制定。

至此,你可能發(fā)現(xiàn)了騰訊音視頻實(shí)驗(yàn)室的打法:針對(duì)特定標(biāo)準(zhǔn)領(lǐng)域招募大牛,點(diǎn)對(duì)點(diǎn)突破。

從與QQ共舞到業(yè)務(wù)變遷

技術(shù)骨干左小祥則經(jīng)歷了騰訊音視頻實(shí)驗(yàn)室的幾個(gè)重要節(jié)點(diǎn)。左從 2010 年開(kāi)始負(fù)責(zé) PC QQ 基礎(chǔ)能力開(kāi)發(fā),2015 年以后,負(fù)責(zé)手機(jī) QQ、macQQ 音視頻基礎(chǔ)功能的開(kāi)發(fā)。

吳祖榕和左小祥告訴雷鋒網(wǎng),在主要服務(wù)QQ 的業(yè)務(wù)上,騰訊音視頻實(shí)驗(yàn)室構(gòu)建了新一代SPEAR音視頻通信引擎AVC,承載億級(jí) QQ 用戶通信,集成音視頻通信SDK,構(gòu)建豐富的一對(duì)一、一對(duì)多、多對(duì)多的實(shí)時(shí)音視頻通話場(chǎng)景。為了滿足越來(lái)越年輕化的用戶需求,音視頻中心提出了低碼率下實(shí)時(shí)視頻的美顏功能,將美顏從圖片處理提升到視頻處理的全新應(yīng)用場(chǎng)景,還推出了語(yǔ)音變聲功能。

移動(dòng)化浪潮來(lái)臨時(shí),音視頻技術(shù)也面臨著如何在移動(dòng)網(wǎng)絡(luò)下解決各種聲音的采集播放問(wèn)題。最大的挑戰(zhàn)是,人是移動(dòng)的,這代表著網(wǎng)絡(luò)是波動(dòng)的,在網(wǎng)絡(luò)波動(dòng)的過(guò)程中怎么保證低延遲、高清晰,變得比原來(lái)更有挑戰(zhàn)。

網(wǎng)絡(luò)層面要求工程師們做更多網(wǎng)絡(luò)抖動(dòng)、丟包的測(cè)試,算法還得自適應(yīng)不同網(wǎng)絡(luò)。到底當(dāng)前鏈路上可用帶寬有多少?延遲是多少?在實(shí)時(shí)音視頻領(lǐng)域,解決這些問(wèn)題的一個(gè)通用方案是,建立一套模型,估算結(jié)果反饋給編碼器,告訴應(yīng)用層策略發(fā)送多少冗余信息或者在何時(shí)做更多重傳。

其中,最核心的技術(shù)在于對(duì)帶寬的估計(jì),如何更準(zhǔn)確、實(shí)時(shí)地發(fā)現(xiàn)當(dāng)前帶寬發(fā)生的波動(dòng),到底是有人跟你搶,還是使用者自身在移動(dòng)?騰訊音視頻實(shí)驗(yàn)室花了很多時(shí)間打造云端控制的流控。

另一個(gè)挑戰(zhàn)是,設(shè)備更加多樣性,人們的使用場(chǎng)景不再是筆記本電腦以及一個(gè)攝像頭、麥克風(fēng)。每個(gè)安卓廠商、手機(jī)廠商采集的播放延遲都不一樣,需要做大量適配,多了很多工作量。

移動(dòng)化解決完后,視頻應(yīng)用面臨了爆發(fā),包括點(diǎn)播業(yè)和直播業(yè),許多競(jìng)爭(zhēng)對(duì)手涌了進(jìn)來(lái)。

“直播對(duì)帶寬要求很高,主播跟觀眾互動(dòng)的實(shí)時(shí)性也要很好。友商把我們的客戶教育成了音視頻專家。有一個(gè)客戶在南美,他會(huì)很直接地告訴我們,現(xiàn)在房間秒開(kāi)、AGC聲音增量或噪聲回聲消除剪切得不夠好,會(huì)用非常專業(yè)的音視頻指標(biāo)跟你講,整個(gè)行業(yè)在被競(jìng)爭(zhēng)對(duì)手推著往前走。”吳祖榕說(shuō)。

吳祖榕之前碰到一個(gè)客戶,他的 APP 里同時(shí)用了騰訊和其友商的音視頻 SDK,今天用騰訊的 SDK 看用戶的反饋是多少,明天用友商的 SDK 看用戶反饋是多少,直接從用戶的反饋數(shù)量判斷誰(shuí)的質(zhì)量好。

吳不怕比較:“在服務(wù)產(chǎn)品過(guò)程中,大家也會(huì)不斷定一些關(guān)鍵指標(biāo)、核心指標(biāo),然后找原因,找問(wèn)題。找完原因、問(wèn)題解決完之后,我們驗(yàn)證穩(wěn)定了也會(huì)立刻反饋到 To B 服務(wù)的SDK質(zhì)量中,是一個(gè)蠻正向的循環(huán)。”

云時(shí)代下,改變未來(lái)

2018 年 9 月 30 日,騰訊正式宣布啟動(dòng)新一輪整體戰(zhàn)略升級(jí),并對(duì)架構(gòu)進(jìn)行大調(diào)整,湯道生成了主管騰訊云與智慧產(chǎn)業(yè)事業(yè)群 CSIG 的老板,騰訊音視頻實(shí)驗(yàn)室歸了 CSIG ,由劉杉和吳祖榕擔(dān)任實(shí)驗(yàn)室聯(lián)合負(fù)責(zé)人。

雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))了解到,因?yàn)?QQ 在國(guó)內(nèi)市場(chǎng)比較飽和,除了平穩(wěn)支撐 QQ 的業(yè)務(wù),騰訊音視頻實(shí)驗(yàn)室承擔(dān)了為騰訊云的出海提供服務(wù)的重任,并投入更多人力在騰訊云還有 to B 業(yè)務(wù)上。

QQ 的音視頻通話能力已經(jīng)獨(dú)立作為云上的解決方案,這個(gè)解決方案也同步向企業(yè)售賣,全民 K 歌、QQ 空間直播、NOW 直播、騰訊教育內(nèi)部直播體系也由騰訊音視頻實(shí)驗(yàn)室支撐,視頻處理平臺(tái)目前已經(jīng)上線微視。2019 年,騰訊音視頻實(shí)驗(yàn)室將主要在自動(dòng)駕駛車聯(lián)地圖、會(huì)議、在線教育等領(lǐng)域推新產(chǎn)品。

劉杉介紹:“實(shí)驗(yàn)室自研的 GME 游戲多媒體引擎已經(jīng)落地在游戲場(chǎng)景,目前正在開(kāi)拓海外市場(chǎng)。實(shí)驗(yàn)室的技術(shù)輸出除了支持公司業(yè)務(wù)比如游戲、微視、云等,同時(shí)也直接對(duì)接外部客戶。比如,我們有另一款產(chǎn)品叫投屏,是和會(huì)議相關(guān)的產(chǎn)品,開(kāi)會(huì)的時(shí)候手機(jī)和筆記本等終端的內(nèi)容都可以直接無(wú)線投到大屏幕上,本地和遠(yuǎn)程會(huì)議投屏都支持,這款產(chǎn)品已經(jīng)覆蓋整個(gè)騰訊辦公設(shè)施并且已經(jīng)開(kāi)始對(duì)外銷售。2019 年會(huì)進(jìn)一步上量,還有我們的基于深度學(xué)習(xí)的視頻處理平臺(tái),目前已經(jīng)上線微視,2019 年會(huì)進(jìn)一步拓展對(duì)內(nèi)對(duì)外業(yè)務(wù)。”

她指的新領(lǐng)域包括騰訊音視頻實(shí)驗(yàn)室在泛多媒體技術(shù)研發(fā),包含點(diǎn)云、VR360和沉浸式多媒體體驗(yàn),以及多媒體和神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的結(jié)合等。

吳祖榕看好三項(xiàng)技術(shù)對(duì)音視頻領(lǐng)域的挑戰(zhàn)。

一是隨著基礎(chǔ)設(shè)施的提升以及 5G 的布局,市場(chǎng)要求更高碼率、高清、更高分辨率的視頻出現(xiàn),對(duì)視頻的質(zhì)量要求更高,高質(zhì)量視頻的傳輸和分發(fā)是關(guān)鍵點(diǎn)。二是在實(shí)時(shí)音視頻通信領(lǐng)域上,隨著 AI 技術(shù)的進(jìn)步,過(guò)去很多很難解決的問(wèn)題在今天有了機(jī)會(huì)。比如,大部分手機(jī)只有一個(gè)麥克風(fēng),過(guò)去很難實(shí)現(xiàn)單通道下的語(yǔ)音增強(qiáng)技術(shù),要么就要使用很多麥克風(fēng)才能做好降噪。隨著深度學(xué)習(xí)的引入,這些技術(shù)有了新機(jī)會(huì)。三是如何讓網(wǎng)絡(luò)更有效地把人眼關(guān)注的區(qū)域給更多碼率做編碼,讓網(wǎng)絡(luò)和超分辨率進(jìn)行更多適配。

“人的感官需求可能會(huì)隨著基礎(chǔ)設(shè)施的提升不斷提升,東京奧運(yùn)會(huì)甚至用 8K 視頻做直播,這讓我感覺(jué)到,我們已經(jīng)從以前的‘聽(tīng)得清、看得清’到今天的‘聽(tīng)得真、看得真’,這是技術(shù)最大的不同。”吳祖榕說(shuō)。

關(guān)于音視頻技術(shù)所能造就的未來(lái),吳沒(méi)有太多想象。他是活在當(dāng)下的人,感受著自己目前鉆研的這些產(chǎn)品技術(shù)帶來(lái)的沖擊。

有一天,吳祖榕在蛋糕店看到老板娘開(kāi)了 NOW 直播,吳很詫異。老板娘說(shuō),這有很多粉絲,她可以使用直播技術(shù)跟粉絲介紹她的蛋糕是怎么做的。還有一次,吳去北京出差,坐上了一輛出租車,開(kāi)車的大爺全程跟他介紹自己在全民 K 歌上的成就,大爺每天 5 點(diǎn)鐘下了班就回家跟老伴一起拿著麥克風(fēng)唱歌,平時(shí)在全民 K 歌上跟朋友互動(dòng)。

不僅給QQ開(kāi)美顏?zhàn)兟?,這個(gè)實(shí)驗(yàn)室還改變了老大爺?shù)耐砟晟?/></p><p>大爺說(shuō)得十分激動(dòng),吳祖榕也一陣心潮彭拜,他真真切切地感受到,自己在做的這些技術(shù)在改變?nèi)藗兊纳睢?/p><p>快到春節(jié)了,左小祥用 QQ 給老家的父母打了通電話,告訴他們歸家日期。劉杉啟程回美國(guó),她在飛機(jī)上打開(kāi)一部電影,卻下意識(shí)地跳脫劇情,分析電影畫(huà)面的質(zhì)量和背后可能的視頻技術(shù)。</p><p>對(duì)他們來(lái)說(shuō),這些都是生活,但努力實(shí)現(xiàn)的音視頻技術(shù),又讓這些不只是生活。</p><p>還有改變未來(lái)。( 來(lái)源:雷鋒網(wǎng) 李勤)</p>              	<p style=

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-02-02
不僅給QQ開(kāi)美顏?zhàn)兟?,這個(gè)實(shí)驗(yàn)室還改變了老大爺?shù)耐砟晟?/div>
1999 年騰訊發(fā)布 QQ 時(shí),吳祖榕成為了第一批用戶。左小祥那會(huì)還在上高中,兩年后,他也成為了擁有 QQ 號(hào)的“弄潮鵝”。

長(zhǎng)按掃碼 閱讀全文