">

聲網(wǎng)CEO趙斌:“聲網(wǎng)在RTE行業(yè)首次實(shí)現(xiàn)廣播級(jí)4K超高清實(shí)時(shí)互動(dòng)體驗(yàn)”

10月25日消息,RTE2023第九屆實(shí)時(shí)互聯(lián)網(wǎng)大會(huì)上,聲網(wǎng)創(chuàng)始人兼CEO趙斌宣布:“聲網(wǎng)在RTE行業(yè)首次實(shí)現(xiàn)廣播級(jí)4K超高清實(shí)時(shí)互動(dòng)體驗(yàn)。”他指出,“4K不僅僅只有分辨率一個(gè)緯度,光亮強(qiáng)度的動(dòng)態(tài)范圍、色彩的真實(shí)度、飽和度,以及色彩漸變的細(xì)膩程度,都是真正超高清體驗(yàn)里不可或缺的一環(huán)?!?/p>

趙斌認(rèn)為,虛擬人+AIGC所創(chuàng)造的情感和情緒價(jià)值或?qū)⒃谖磥?lái)解決社交供需不平衡的現(xiàn)狀,并引領(lǐng)交互對(duì)象發(fā)生變化。另一層面,隨著AIGC能力的進(jìn)一步加強(qiáng),越來(lái)越多的應(yīng)用型開(kāi)發(fā)將被AIGC替代,API+AI的形式將大幅提高應(yīng)用開(kāi)發(fā)效率。

大模型在快速發(fā)展,但交互界面仍局限于文字聊天互動(dòng)方式。趙斌提到,通過(guò)過(guò)去一年的投入和打磨,聲網(wǎng)推出行業(yè)首創(chuàng)AIGC-RTC能力模塊,可支持與任何大模型平臺(tái)結(jié)合,實(shí)現(xiàn)更低延時(shí)、更自然、更沉浸的實(shí)時(shí)語(yǔ)音對(duì)話,為企業(yè)協(xié)作、社交 、直播、游戲等多種場(chǎng)景提供新玩法、新機(jī)會(huì)。

聲網(wǎng)合伙人兼客戶(hù)成功副總裁孫雨潤(rùn)介紹,“根據(jù)聲網(wǎng)某東南亞頭部泛娛樂(lè)客戶(hù)數(shù)據(jù)顯示,當(dāng)視頻從標(biāo)清升級(jí)高清,停留超過(guò)30秒觀眾數(shù)提升19%,觀眾人均觀看時(shí)長(zhǎng)提升30%,同時(shí)觀眾打賞率大幅提升。某國(guó)內(nèi)知名社交出海App,從CDN升級(jí)聲網(wǎng)極速直播,送禮率增長(zhǎng)12.3%?!?/p>

聲網(wǎng)首席科學(xué)家、CTO鐘聲指出,回溯過(guò)去五年,最典型的事件就是大模型的突破,從2017年的Transformer,到如今的ChatGPT-4,人工智能的發(fā)展,讓信息傳播和消費(fèi)智能化的趨勢(shì)越來(lái)越明顯,萬(wàn)事歸于中心化AGI接管的趨勢(shì)和威脅也越來(lái)越明顯。大模型在帶來(lái)發(fā)展機(jī)遇的同時(shí),也帶來(lái)了計(jì)算需求快速增長(zhǎng)、算力受能源供給力限制、大模型數(shù)據(jù)資源不夠、存儲(chǔ)需求增長(zhǎng)過(guò)快等問(wèn)題。未來(lái),我們除了要做負(fù)責(zé)任的AI之外,在端上和邊緣上的分布式實(shí)時(shí)智能將成為價(jià)值公平分配的重要技術(shù)手段,也是減緩中心化AGI對(duì)人類(lèi)威脅的有效途徑,這也注定會(huì)成為一個(gè)新的技術(shù)發(fā)展趨勢(shì)。

鐘聲認(rèn)為,AGI將走進(jìn)實(shí)時(shí)互動(dòng),實(shí)現(xiàn)人人可分身,幫助在應(yīng)用場(chǎng)景中復(fù)制名師、網(wǎng)紅,甚至普通人也將通過(guò)AI分身豐富體驗(yàn)、緩解時(shí)間稀缺的瓶頸。此外,他預(yù)測(cè),具備端邊實(shí)時(shí)智能的高清實(shí)時(shí)互動(dòng)能力將成新趨勢(shì)和競(jìng)爭(zhēng)焦點(diǎn)。

鐘聲介紹到,實(shí)時(shí)高清需要許多端上實(shí)時(shí)AI,在Low Level Vision and Audio這一需求層面,聲網(wǎng)的SDK 4.1.x, 4.2.x版本已經(jīng)可以支持1080P/4K視頻的例如超分、虛擬背景、感知編碼、降噪、去回聲等底層計(jì)算機(jī)視覺(jué)處理和高音質(zhì)的計(jì)算機(jī)聽(tīng)覺(jué)處理能力。在High Level Vision and Audio層面,聲網(wǎng)已經(jīng)部分實(shí)現(xiàn)對(duì)物體、聲音、場(chǎng)景的理解和重構(gòu)能力,包括面捕、動(dòng)捕、情感計(jì)算,物體識(shí)別和場(chǎng)景重建等,可以大力改善多種應(yīng)用場(chǎng)景下的用戶(hù)體驗(yàn)。(一橙)

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-10-25
聲網(wǎng)CEO趙斌:“聲網(wǎng)在RTE行業(yè)首次實(shí)現(xiàn)廣播級(jí)4K超高清實(shí)時(shí)互動(dòng)體驗(yàn)”
聲網(wǎng)CEO趙斌:“聲網(wǎng)在RTE行業(yè)首次實(shí)現(xiàn)廣播級(jí)4K超高清實(shí)時(shí)互動(dòng)體驗(yàn)”,趙斌,聲網(wǎng),rte"/>

長(zhǎng)按掃碼 閱讀全文