10月25日消息,RTE2023第九屆實時互聯(lián)網大會上,聲網創(chuàng)始人兼CEO趙斌宣布:“聲網在RTE行業(yè)首次實現(xiàn)廣播級4K超高清實時互動體驗?!彼赋?,“4K不僅僅只有分辨率一個緯度,光亮強度的動態(tài)范圍、色彩的真實度、飽和度,以及色彩漸變的細膩程度,都是真正超高清體驗里不可或缺的一環(huán)。”
趙斌認為,虛擬人+AIGC所創(chuàng)造的情感和情緒價值或將在未來解決社交供需不平衡的現(xiàn)狀,并引領交互對象發(fā)生變化。另一層面,隨著AIGC能力的進一步加強,越來越多的應用型開發(fā)將被AIGC替代,API+AI的形式將大幅提高應用開發(fā)效率。
大模型在快速發(fā)展,但交互界面仍局限于文字聊天互動方式。趙斌提到,通過過去一年的投入和打磨,聲網推出行業(yè)首創(chuàng)AIGC-RTC能力模塊,可支持與任何大模型平臺結合,實現(xiàn)更低延時、更自然、更沉浸的實時語音對話,為企業(yè)協(xié)作、社交 、直播、游戲等多種場景提供新玩法、新機會。
聲網合伙人兼客戶成功副總裁孫雨潤介紹,“根據(jù)聲網某東南亞頭部泛娛樂客戶數(shù)據(jù)顯示,當視頻從標清升級高清,停留超過30秒觀眾數(shù)提升19%,觀眾人均觀看時長提升30%,同時觀眾打賞率大幅提升。某國內知名社交出海App,從CDN升級聲網極速直播,送禮率增長12.3%?!?/p>
聲網首席科學家、CTO鐘聲指出,回溯過去五年,最典型的事件就是大模型的突破,從2017年的Transformer,到如今的ChatGPT-4,人工智能的發(fā)展,讓信息傳播和消費智能化的趨勢越來越明顯,萬事歸于中心化AGI接管的趨勢和威脅也越來越明顯。大模型在帶來發(fā)展機遇的同時,也帶來了計算需求快速增長、算力受能源供給力限制、大模型數(shù)據(jù)資源不夠、存儲需求增長過快等問題。未來,我們除了要做負責任的AI之外,在端上和邊緣上的分布式實時智能將成為價值公平分配的重要技術手段,也是減緩中心化AGI對人類威脅的有效途徑,這也注定會成為一個新的技術發(fā)展趨勢。
鐘聲認為,AGI將走進實時互動,實現(xiàn)人人可分身,幫助在應用場景中復制名師、網紅,甚至普通人也將通過AI分身豐富體驗、緩解時間稀缺的瓶頸。此外,他預測,具備端邊實時智能的高清實時互動能力將成新趨勢和競爭焦點。
鐘聲介紹到,實時高清需要許多端上實時AI,在Low Level Vision and Audio這一需求層面,聲網的SDK 4.1.x, 4.2.x版本已經可以支持1080P/4K視頻的例如超分、虛擬背景、感知編碼、降噪、去回聲等底層計算機視覺處理和高音質的計算機聽覺處理能力。在High Level Vision and Audio層面,聲網已經部分實現(xiàn)對物體、聲音、場景的理解和重構能力,包括面捕、動捕、情感計算,物體識別和場景重建等,可以大力改善多種應用場景下的用戶體驗。(一橙)
- 最高獎勵100萬元 蔚來堅決打擊黑公關和網絡水軍
- 工信部:三家基礎電信企業(yè)均全面接入DeepSeek開源大模型
- 長城汽車:Coffee Agent與DeepSeek實現(xiàn)技術深度融合
- 三星中國公司換帥:崔勝植離任,李大成掌舵
- Valve官方否認重啟Steam Machine項目,與AMD合作僅為驅動程序改進
- 疑似2000萬OpenAI用戶賬戶信息泄露,公司緊急調查
- Meta涉嫌大規(guī)模下載盜版電子書 用于AI模型訓練
- 騰訊云推出DeepSeek模型API接口,實現(xiàn)聯(lián)網搜索新突破
- 車市開年“卷瘋”了!價格戰(zhàn)又來了
- DeepSeek加速上車 寶駿汽車官宣已完成深度融合
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。