2019聲網(wǎng)賦能全行業(yè):探索前沿技術(shù)、產(chǎn)品服務(wù)不斷升級

據(jù)Gartner預(yù)測,2020年全球互聯(lián)設(shè)備的規(guī)模將達到250億臺,是2015年的5倍之多。如此海量設(shè)備間的互聯(lián)互動將是一個巨大的實時網(wǎng)絡(luò),API可以把所有設(shè)備、App連接起來,讓用戶進行真正實時的音視頻、數(shù)據(jù)和觀點的交流互動。

早在2014年,聲網(wǎng)便看到了萬物互聯(lián)同實時音視頻的巨大機會,并開創(chuàng)了面向全球的實時音視頻云服務(wù)。而作為實時音視頻云服務(wù)的開創(chuàng)者和引領(lǐng)者,聲網(wǎng)Agora也從未停止過上下求索、思變求進的步伐,在剛剛過去的2019年,聲網(wǎng)實現(xiàn)多項產(chǎn)品、服務(wù)革新、新技術(shù)探索全面落地,并且推進了業(yè)務(wù)和服務(wù)的迅猛增長。

2019聲網(wǎng)賦能全行業(yè):探索前沿技術(shù)、產(chǎn)品服務(wù)不斷升級

日通話分鐘數(shù)超過6億

150000+注冊App使用聲網(wǎng)API

服務(wù)覆蓋10余個行業(yè),100余種場景

全球50+新增數(shù)據(jù)中心

300%全網(wǎng)帶寬容量上漲

中國區(qū)支持百萬大頻道動態(tài)擴展能力

海外大頻道擴容時間縮短50%

支持5G網(wǎng)絡(luò)下高清、大碼率視頻傳輸

移動端超分、感知視頻編碼、AI 降噪等新技術(shù)落地

新技術(shù)探索全面落地

在與開發(fā)者、客戶攜手拓展新場景的同時,聲網(wǎng)的技術(shù)根基也更加深固。在 2019 年落地了多項技術(shù)探索。

AI算法讓視頻更高清:業(yè)界首個商用移動端超分算法

聲網(wǎng)Agora 的視頻超分辨率技術(shù),可以將實時傳輸中的視頻在原有分辨率的基礎(chǔ)上實現(xiàn)兩個方向的2倍同步放大,并獲得顯著的細節(jié)增強,全面提高原有視頻分辨率。聲網(wǎng)Agora 超分算法同時支持在云端和移動終端上實時運行,并可以在移動終端上達到非常出色的效果。這是行業(yè)內(nèi)首個可實時運行于移動設(shè)備端上的超分算法模型。

AI算法助力音頻審核、降噪

在音頻方面,也有 AI 應(yīng)用落地。一方面全新的 AI 降噪技術(shù),可有效地處理噴麥、電流音等常見聲音干擾;另一方面,利用AI 丟包隱藏技術(shù)有效保證弱網(wǎng)情況下的有效溝通。

更節(jié)省寬帶:編碼更高效

聲網(wǎng)在音頻編碼上做了如下3方面優(yōu)化,來節(jié)省寬帶使用。

感知編碼

可在畫質(zhì)不變的情況下,幫助用戶節(jié)省更多的碼率,能大幅節(jié)省使用帶寬 ,或在一些場景下可以提升畫面的流暢性。

H.265

已全面支持 H.265,在傳輸同等質(zhì)量的視頻時,帶寬占用只需 H.264 的一半。

軟編更高效

在傳統(tǒng)的 PRIM 算法上進行了優(yōu)化,在軟件編碼器上開啟后,對圖像運動相對簡單的場景,可節(jié)省其 20%的帶寬。

高音質(zhì)語聊房:聲音美化接近專業(yè)調(diào)音效果

Agora SDK 已全面支持 20kHz 高頻譜、48kHz 全頻帶高音質(zhì)應(yīng)用,可以全面保證頻譜的豐富性、飽和度和高保真度。優(yōu)化了弱網(wǎng)環(huán)境下的音頻表現(xiàn),在70%的丟包情況下,仍能獲得流暢的高音質(zhì)表現(xiàn)。并提供接近專業(yè)調(diào)音效果的聲音美化功能。

“專線”級別傳輸質(zhì)量

進一步提升優(yōu)質(zhì)傳輸率

Agora SD-RTN™ 作為承載 RTC 業(yè)務(wù)的實時傳輸網(wǎng),在 2019 年也得到了進一步的優(yōu)化。目前網(wǎng)內(nèi)傳輸,通話送達率已達到 99.9%。對東南亞、印度、南美等地區(qū)的傳輸覆蓋進行優(yōu)化,這些地區(qū)的優(yōu)質(zhì)傳輸率已經(jīng)達到 95%以上,進一步提升了泛娛樂、教育等多種場景的互動體驗。

降低“錯分率”

通常來講,國內(nèi)傳輸?shù)臄?shù)據(jù)可能會遇到“運營商錯分”問題,比如本應(yīng)在電信網(wǎng)絡(luò)內(nèi)傳輸?shù)臄?shù)據(jù),會因為個別中小運營商的服務(wù)器分配錯誤,導(dǎo)致跨運營商傳輸。當(dāng)出現(xiàn)這種情況時,通話的質(zhì)量就會受到影響。聲網(wǎng)在這一年中,針對這個問題進行了一系列的探索與優(yōu)化,已將“錯分率”降低到 0.1%。

技術(shù)生態(tài)助力實時互動場景升級

在用戶需求和市場環(huán)境變化的過程中,聲網(wǎng)的服務(wù)也不斷創(chuàng)新升級。我們已與全球 40 多個合作伙伴開啟云市場,共同創(chuàng)建一個 RTC 實時互聯(lián)網(wǎng)生態(tài),幫助開發(fā)者加速集成開發(fā),并針對不同實時互動場景的需求,推出多種場景化方案。

穩(wěn)定支持在線教育全場景

聲網(wǎng)面向1V1、小班課、互動大班課、雙師課堂、超級小班課、AI互動課堂、音樂教學(xué)、游戲化教學(xué)等8大在線教學(xué)場景,均推出了相應(yīng)解決方案。在普通語音教學(xué)場景下支持8K或16K采樣,在音樂教學(xué)場景下覆蓋全頻帶的48kHz采樣;最高可支持 4K 高清分辨率;融合聲網(wǎng)Agora語音引擎與AI音頻降噪算法,針對雙講現(xiàn)象進行了特別優(yōu)化。

超低延時 H5 實時直播

聲網(wǎng)在今年發(fā)布了推出 H5 實時直播解決方案,視頻延時可低至 200ms,純音頻可低至 50ms。它基于 Agora Web SDK 實現(xiàn),既兼容大部分的 Android 機型、瀏覽器,又可以滿足白板+H5 直播對實時性的要求。

升級遠程醫(yī)療解決方案

隨著RTC 技術(shù)不斷在醫(yī)療行業(yè)中的滲透,視頻急救、醫(yī)學(xué)教學(xué)、遠程問診、電子處方等場景逐漸 RTC 化,醫(yī)生與患者足不出戶,即可在線上完成問診、開藥和教學(xué)交流。據(jù)某客戶數(shù)據(jù)顯示,今年有超過10w用戶發(fā)起在線視頻問診。這一場景就是基于聲網(wǎng)遠程醫(yī)療解決方案實現(xiàn)的。

同時,結(jié)合聲網(wǎng)RTM SDK、本地錄制和云端錄制服務(wù),可滿足醫(yī)療教學(xué)、電子處方等場景對屏幕共享、醫(yī)學(xué)影像操作、病例實時共享等遠程協(xié)作需求。

2019聲網(wǎng)賦能全行業(yè):探索前沿技術(shù)、產(chǎn)品服務(wù)不斷升級

聲網(wǎng)助力醫(yī)視圈實現(xiàn)遠程醫(yī)療協(xié)作

高可靠的低功耗智能設(shè)備解決方案

自從小天才視頻手表基于聲網(wǎng) Agora SDK 實現(xiàn)了視頻通話功能后,我們不僅推出了低功耗智能設(shè)備場景方案,并先后集成到了AR 眼鏡、智能攝像頭、智能音箱等產(chǎn)品中。低功耗智能設(shè)備場景方案適用于基于 ARM 架構(gòu)、Android 系統(tǒng)平臺的低功耗智能設(shè)備。

泛金融視頻雙錄,數(shù)據(jù)安全,存儲可靠

聲網(wǎng)推出了泛金融視頻雙錄場景方案。在滿足企業(yè)網(wǎng)絡(luò)安全要求的前提下,可以實現(xiàn)企業(yè)內(nèi)外網(wǎng)音視頻和信令信息互通,錄制,加密等企業(yè)級需求。

全場景支持內(nèi)容審核

聲網(wǎng)在原有的實時語音互動直播的基礎(chǔ)上,整合業(yè)界 Top 3 語音識別服務(wù),推出了業(yè)界獨有的一站式智能語音識別方案。開發(fā)者只需在應(yīng)用中集成聲網(wǎng) Agora SDK,即可讓音頻在實時傳輸?shù)倪^程中完成語音內(nèi)容識別與審核。

視頻會議實現(xiàn)實時雙語字幕

Agora SDK 融合業(yè)界領(lǐng)先的語音識別和機器翻譯技術(shù),推出視頻雙向翻譯轉(zhuǎn)寫功能,可實現(xiàn)在實時視頻會議場景中“中譯英”和“英譯中”的同傳工作,讓視頻會議也能擁有雙語字幕。

產(chǎn)品革新,服務(wù)升級

實時消息全球部署低延時

實時消息(RTM)SDK 在 5 月正式發(fā)布,系統(tǒng)容量提高了數(shù)倍并可隨時拓展,支持單頻道百萬級并發(fā)在線及億級消息并發(fā)。并提供豐富的功能支持語音聊天室、小班課、大班課等等不同業(yè)務(wù)場景,幫助國內(nèi)、出海以及海外客戶輕松構(gòu)建實時場景。

RTSA開放 SD-RTN™ 碼流加速能力

RTSA 實時碼流加速 SDK 主要面向那些自己可以完成軟硬件編解碼或有特殊編碼要求的開發(fā)團隊的,RTSA SDK 可以幫助他們解決復(fù)雜的實時網(wǎng)絡(luò)傳輸問題,讓他們的音視頻數(shù)據(jù)也可以接入 SD-RTN,獲得覆蓋全球的優(yōu)質(zhì)傳輸體驗。

云端錄制服務(wù),30 分鐘即可快速集成

2019 年中旬,聲網(wǎng)正式推出云端錄制服務(wù)。開發(fā)者通過 5 個 RESTful API 即可方便快速的開啟和控制云錄制功能。

推流 3.0,可靠性全面提升

在今年對 Agora SDK 升級后,聲網(wǎng)推流服務(wù)極大的提高了服務(wù)的可擴展性、可靠性和 API 的易用性,并且卡頓率和音視頻質(zhì)量得到了顯著的改善。目前,推流成功率與 CDN 的握手成功率均超過 99.99%。

“水晶球

2019聲網(wǎng)賦能全行業(yè):探索前沿技術(shù)、產(chǎn)品服務(wù)不斷升級

水晶球?qū)崟r狀態(tài)看板

水晶球(Agora Analytics)是聲網(wǎng)發(fā)布的業(yè)界首個實時音視頻全通話周期質(zhì)量監(jiān)控與分析平臺。水晶球每天有 3000 億數(shù)據(jù)點,從 App 端到 SD-RTN™,從采集到渲染,為用戶提供全鏈路的質(zhì)量透明信息,讓用戶真正做到對自己應(yīng)用中的實時音視頻數(shù)據(jù)質(zhì)量了若指掌,支持RESTful API。

一切以開發(fā)者為中心

第五屆 RTC 實時互聯(lián)網(wǎng)大會

2019 年 6 月舊金山、10 月北京,兩場 RTC 大會如約舉行。在北京的第五屆 RTC2019 實時互聯(lián)網(wǎng)大會上,來自 W3C、搜狗、阿里巴巴達摩院、字節(jié)跳動、美團、滬江CCTalk、bilibili等團隊 40 多位技術(shù)總監(jiān)、資深工程師,圍繞 AI、大前端、網(wǎng)絡(luò)架構(gòu)、編解碼等話題分享了實踐經(jīng)驗與前瞻理念。他們還與現(xiàn)場的數(shù)千位開發(fā)者一起度過了一個充滿知識、歡笑的程序員節(jié)。

2019聲網(wǎng)賦能全行業(yè):探索前沿技術(shù)、產(chǎn)品服務(wù)不斷升級

圖:舊金山allthingsrtc 大會

2019聲網(wǎng)賦能全行業(yè):探索前沿技術(shù)、產(chǎn)品服務(wù)不斷升級

圖:北京RTC2019

行業(yè)首個 RTC 創(chuàng)新開發(fā)大賽

7 月 1 日,聲網(wǎng)發(fā)起了業(yè)界首個圍繞 RTC 技術(shù)展開的創(chuàng)新開發(fā)大賽。大賽共三個賽道,包括編程創(chuàng)新挑戰(zhàn)、超分辨率圖像質(zhì)量挑戰(zhàn)和超分辨率算法性能挑戰(zhàn),共有 150 余人參加了編程創(chuàng)新挑戰(zhàn), 760 多支隊伍參加了超分辨率的兩項挑戰(zhàn)賽,最后有 9支團隊脫穎而出贏得大獎。

2019聲網(wǎng)賦能全行業(yè):探索前沿技術(shù)、產(chǎn)品服務(wù)不斷升級

2014年,從硅谷一個車庫的幾行代碼開始,到2019年,聲網(wǎng)每天為全球開發(fā)者提供超過6億分鐘的實時音視頻技術(shù)服務(wù)。

支持新語言與開發(fā)框架

在 2019 年初,F(xiàn)lutter 開始成為開發(fā)者們最關(guān)注的技術(shù)趨勢之一。聲網(wǎng)率先支持了 Flutter ,并推出 Agora Flutter SDK.

為了滿足開發(fā)者們希望將實時音視頻通話與人臉識別、圖像識別、聲紋識別或與其它 Python 庫結(jié)合的需求,能玩出更多花樣。聲網(wǎng)發(fā)布了Python SDK,并提供了集成 TensorFlow進行圖像識別的Demo。

目前,已推出超過 120 個 Demo。在不斷維護、更新代碼的同時,聲網(wǎng)也對大部分的集成文檔進行了優(yōu)化,讓它們更加通俗易懂,降低大家的上手門檻。

Solo系列編解碼技術(shù)的開源與演進

在今年的 RTC 2019 實時互聯(lián)網(wǎng)大會上,聲網(wǎng)正式開源了自研的語音抗丟包編解碼器 SOLO 編解碼器,它可以幫助所有正在做實時音視頻的開發(fā)者,有效減少丟包對語音通話質(zhì)量的影響。同時,下一代 SOLO 編解碼器——SOLOX 的技術(shù)演進步伐也未停歇。在低碼率下,SOLOX 比 Opus 的抗丟包模式 MOS 分高出了 0.7 以上,且碼流兼容 Opus,即 SoloX 的碼流可以被 Opus 正常解碼。

國內(nèi)首個 WebRTC 鏡像與開源文檔

在 Demo 以外,聲網(wǎng)還為 WebRTC 開發(fā)者建立了國內(nèi)首個 WebRTC 源碼鏡像,以及開放于 Github 上的 WebRTC 中文文檔。開發(fā)者們不用再受限于網(wǎng)絡(luò),可以直接下載、編譯 WebRTC 源碼,還可以閱讀或自行優(yōu)化 WebRTC 中文文檔。這兩個資源的地址,均已公開在 RTC 開發(fā)者社區(qū)(rtcdeveloper.com)中和 Github 中。

更易用的開發(fā)文檔

為了給開發(fā)者更好的開發(fā)體驗,聲網(wǎng)對超過 100 位開發(fā)者進行了訪談,并根據(jù)建議全面優(yōu)化了文檔,包括重寫了 8 個產(chǎn)品 8 個系統(tǒng)平臺的 Quickstart、文檔搜索功能與搜索結(jié)果優(yōu)化、重構(gòu)了 31 篇高階開發(fā)指南、優(yōu)化了所有產(chǎn)品、平臺 Token 的文檔易用性等。而且,在官方 Github 開源了所有開發(fā)文檔,讓開發(fā)者參與優(yōu)化出更適合他們的文檔。

聲網(wǎng)Agora成立于2014年,是實時音視頻云行業(yè)的開創(chuàng)者及領(lǐng)先者,也是全球最大的實時音視頻專業(yè)服務(wù)商。在過去6年的全球化運營中,聲網(wǎng)以實時音視頻RTC技術(shù)為核心驅(qū)動了爆發(fā)式的業(yè)務(wù)增長。截至2019年10月,聲網(wǎng)的日均通話分鐘數(shù)已經(jīng)達到6億,每年為企業(yè)客戶、創(chuàng)新創(chuàng)業(yè)項目、開發(fā)者提供超過5.79億分鐘免費服務(wù)時長,全球范圍有超過30億臺終端安裝使用Agora SDK的應(yīng)用。

2014年成立至今,聲網(wǎng)已經(jīng)將RTC技術(shù)賦能到社交直播、教育、游戲、金融、醫(yī)療、企業(yè)協(xié)作、IoT、VR/AR等10余個行業(yè),共計100余種應(yīng)用場景。聲網(wǎng)Agora服務(wù)的國內(nèi)外產(chǎn)品包括陌陌、斗魚、虎牙、抖音、VIPKID、好未來、火花思維、小米、華為云、金山云、眾安保險、The Meet Group(美國最大的婚戀社交平臺)、Hike Messenger(印度“微信”)、musical.ly(北美短視頻平臺)、LisPon(日本二次元音頻社區(qū))、Stager Live(日本直播平臺)等。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-01-02
2019聲網(wǎng)賦能全行業(yè):探索前沿技術(shù)、產(chǎn)品服務(wù)不斷升級
據(jù)Gartner預(yù)測,2020年全球互聯(lián)設(shè)備的規(guī)模將達到250億臺,是2015年的5倍之多。

長按掃碼 閱讀全文