快手出席中國多媒體大會:產(chǎn)學(xué)研合作共贏,迎接AGI時代新機遇

近日,中國多媒體大會(ChinaMM2023)在云南昆明召開,快手高級副總裁、研發(fā)線負責(zé)人于冰受邀在大會上發(fā)表了《AGI時代下智能媒體技術(shù)前沿進展與思考》主題演講,結(jié)合快手在多媒體技術(shù)領(lǐng)域內(nèi)的創(chuàng)新實踐,分享快手的技術(shù)前沿進展及相關(guān)思考。

分階段探索業(yè)務(wù)發(fā)展策略,持續(xù)推進技術(shù)能效優(yōu)化

自2011年成立至今,快手已經(jīng)發(fā)展成為國民級短視頻直播數(shù)字社區(qū),在用戶、內(nèi)容、商業(yè)等方面保持良性增長態(tài)勢。而快手社區(qū)生態(tài)的蓬勃發(fā)展,離不開快手長期的巨大投入,以大規(guī)模自研技術(shù)支撐業(yè)務(wù)發(fā)展。

回顧快手過往經(jīng)歷,于冰表示,業(yè)務(wù)發(fā)展會經(jīng)歷入局、成長、成熟等多個階段,在業(yè)務(wù)發(fā)展的不同階段,快手所采取的研發(fā)策略也各有側(cè)重。創(chuàng)新成長期更注重持續(xù)投入,探索新產(chǎn)品、新周期;而成熟階段則需聚焦優(yōu)化效率,兼顧體驗,既保證產(chǎn)品體驗的競爭力,又保證業(yè)務(wù)的穩(wěn)健成長。

于冰以快手音視頻業(yè)務(wù)為例,目前該業(yè)務(wù)已步入成熟期,研發(fā)策略重點也轉(zhuǎn)移至提升效率、優(yōu)化成本,追求單位成本下算力、存儲和網(wǎng)絡(luò)使用效率的提升??焓只谧匝幸曨l質(zhì)量評估KVQ、視頻增強修復(fù)KEP和KRP、視頻壓縮編碼算法KVC等一系列核心技術(shù),形成數(shù)據(jù)驅(qū)動的視頻處理閉環(huán),在兼顧體驗的同時極致壓縮視頻。

2022年,快手技術(shù)toB業(yè)務(wù)StreamLake推出了首款自研智能視頻處理芯片SL200,該芯片集成了快手領(lǐng)先的視頻編解碼、圖像處理、AI推理、內(nèi)容自適應(yīng)編碼等關(guān)鍵技術(shù),具備高質(zhì)量、高密度、智能化的特點,在業(yè)內(nèi)處于領(lǐng)先地位。在今年7月舉辦的MSU2022世界編碼器大賽中,SL200一舉奪得4K和1080P賽道24項指標中的16項第一。在本屆大會上,SL200也榮獲了中國多媒體企業(yè)創(chuàng)新技術(shù)獎。目前,SL200芯片已全面應(yīng)用于快手的直播和短視頻業(yè)務(wù),實現(xiàn)成熟技術(shù)通過StreamLake對產(chǎn)業(yè)賦能。

而在數(shù)字人領(lǐng)域,快手也取得了諸多領(lǐng)先成果??焓秩溌纷匝辛斯鈭鰭呙柚亟?、超寫實人像建模、智能綁定、動作捕捉與驅(qū)動、物理仿真等數(shù)字人核心技術(shù),推出“快手虛擬演播助手(KVS)”和“快手智播”兩大解決方案;結(jié)合內(nèi)容平臺在品牌營銷領(lǐng)域的獨特優(yōu)勢,在美術(shù)、技術(shù)、運營、營銷等多個維度賦能,打造了百萬粉絲虛擬主播關(guān)小芳、蒙牛集團首位虛擬員工奶思等多個知名IP。未來,結(jié)合智能編曲、圖像/視頻生成、LLM等AI能力,快手數(shù)字人技術(shù)將繼續(xù)在文旅、教育、游戲、直播電商等領(lǐng)域廣泛應(yīng)用,助力客戶打造高品質(zhì)低成本的3D和2D數(shù)字人。

深耕AI大模型領(lǐng)域,拓展產(chǎn)研學(xué)生態(tài)實現(xiàn)雙向賦能

隨著多媒體與AI技術(shù)的深度結(jié)合,快手持續(xù)深耕AI技術(shù),推動產(chǎn)品形態(tài)、用戶體驗發(fā)展,探索短視頻業(yè)務(wù)的第二曲線。于冰認為,AI大模型作為當下最重要的革命性技術(shù),進入爆發(fā)期,有望開啟AGI時代,而多模態(tài)內(nèi)容生成與理解是其核心能力。

當前,多模態(tài)AI大模型因其在文本、代碼、圖像和視頻等多種內(nèi)容上突出的生成與理解能力,有望為視頻生產(chǎn)、理解、分發(fā)、消費等全鏈路打開新的技術(shù)視角,突破傳統(tǒng)音視頻編碼的技術(shù)天花板,突破基于用戶行為的搜廣推算法的傳統(tǒng)思路,將視頻內(nèi)容創(chuàng)作從PGC、UGC帶動進入AIGC時代,創(chuàng)造AI大模型驅(qū)動的視頻內(nèi)容創(chuàng)作工具,激發(fā)創(chuàng)作者的創(chuàng)意空間,高效率、低成本地生產(chǎn)高質(zhì)量的視頻內(nèi)容。

而短視頻、直播作為最典型的多模態(tài)媒介,快手也抓住平臺基因,在AI大模型領(lǐng)域重度投入,全方位探索技術(shù)突破。于冰介紹,目前,快手在AI大模型的布局體系分為三個層級:基于具備高性能、高并發(fā)、高算力的“大基建”,構(gòu)建快手多模態(tài)的AI“大模型”,進而在搜廣推、內(nèi)容創(chuàng)作、用戶增長、研發(fā)效能等領(lǐng)域內(nèi)打造“大應(yīng)用”。

例如在搜廣推領(lǐng)域,快手搜廣推算法已達到國際領(lǐng)先水平,相關(guān)成果獲得信息檢索與數(shù)據(jù)挖掘領(lǐng)域國際頂級學(xué)術(shù)會議CIKM Best Paper、SIGIR Best Paper - Honorable Mention等榮譽,目前快手突破傳統(tǒng)基于用戶行為的技術(shù)思路,探索更深層次的模型網(wǎng)絡(luò),開拓推薦模型,利用內(nèi)容生成與理解來探索深層次用戶興趣的新路徑。

同時,在多模態(tài) AI大模型的加持下, AI技術(shù)和工具可全方位地賦能影視創(chuàng)作者,助其在創(chuàng)作、拍攝、后期等各階段激發(fā)創(chuàng)意、提升效率和內(nèi)容質(zhì)量,影視制作的周期也能大幅提高,過去花費數(shù)年拍攝的大片有望數(shù)月完成。

技術(shù)發(fā)展從萌芽到成熟,不僅僅靠企業(yè)自研,也需要高??蒲袡C構(gòu)的人才賦能。此前,快手先后與清華大學(xué)、中國科學(xué)技術(shù)大學(xué)北京研究院、中國人民大學(xué)建立聯(lián)合科研機構(gòu),與全球頂尖高校、實驗室建立科研合作,共同探索音視頻、多媒體和AI領(lǐng)域的前沿技術(shù),聯(lián)合培養(yǎng)科研人才。

“學(xué)術(shù)界有頂尖的技術(shù)和優(yōu)秀的科研人才,工業(yè)界則具備真實的應(yīng)用場景,擁有海量數(shù)據(jù)和大算力的優(yōu)勢,兩者深度合作、雙向賦能,其價值將成倍放大。”于冰表示,一方面,技術(shù)的突破將在互聯(lián)網(wǎng)業(yè)務(wù)中得到規(guī)模化使用,產(chǎn)生巨大的經(jīng)濟效益和社會效益;另一方面,互聯(lián)網(wǎng)真實的場景、海量的數(shù)據(jù)、強大的算力,也能助力科研技術(shù)不斷迭代。未來,快手將持續(xù)促進產(chǎn)學(xué)研生態(tài)完善,向?qū)W術(shù)界開放場景、數(shù)據(jù)和算力,共同探索AGI時代智能媒體新技術(shù),以技術(shù)賦能行業(yè)創(chuàng)新與發(fā)展。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )