GAITC 2021智媒專題論壇丨黃瑾:AI在媒體領(lǐng)域持續(xù)創(chuàng)新 釋放數(shù)字生產(chǎn)力

11月27日,在2022全球人工智能技術(shù)大會上,由CAAI智能傳媒專委會、中國傳媒大學媒體融合與傳播國家重點實驗室、新浪AI媒體研究院聯(lián)合支持的“融合與發(fā)展”新智者·智能媒體專題論壇在線上舉行。華為云副總裁黃瑾在本次專題論壇上,與來自業(yè)界、學術(shù)界的嘉賓們分享了《華為云持續(xù)創(chuàng)新,釋放數(shù)字生產(chǎn)力》的主題演講。黃瑾認為,當前行業(yè)正在從移動互聯(lián)網(wǎng)進入虛實融合的3D互聯(lián)網(wǎng)的時代,媒體產(chǎn)業(yè)將迎來蓬勃的發(fā)展機會。

圖注:華為云副總裁黃瑾-“融合與發(fā)展”新智者·智能媒體專題論壇

以下為黃瑾演講實錄,內(nèi)容經(jīng)編輯略有刪減:

黃瑾:尊敬的各位領(lǐng)導(dǎo),各位朋友,大家好,非常榮幸有機會參加本次會議。我在華為云負責戰(zhàn)略與產(chǎn)業(yè)發(fā)展工作,今天的主題是《華為云持續(xù)創(chuàng)新,釋放數(shù)字生產(chǎn)力》。今天我將分享兩個方面的內(nèi)容,首先來看一看人工智能領(lǐng)域的創(chuàng)新與實踐。人工智能已經(jīng)應(yīng)用到了華為自身業(yè)務(wù)的所有主業(yè)務(wù)流程中,目前已經(jīng)有超過900多個場景的應(yīng)用,如銷售、研發(fā)、制造、供應(yīng)鏈等等,創(chuàng)造了相當于增加了12,000名數(shù)字員工。

舉個例子,在供應(yīng)鏈領(lǐng)域,華為的業(yè)務(wù)遍布了全球170多個國家,有190個中心倉引入了AI之后,實現(xiàn)了貨量預(yù)估的準確率提升70%,訂單履行周期下降76%,在很多的業(yè)務(wù)環(huán)節(jié)都可以使用AI來提升效率。比如智能裝箱、OCR單據(jù)識別等等。在運輸?shù)沫h(huán)節(jié),通過路徑智能優(yōu)化,就可以降低車輛租賃成本約35%。在裝箱的環(huán)節(jié),華為有8000多種各種各樣的包裝箱,有30多種車型,引入了AI的裝箱算法之后就可以讓每輛車的裝載效率提升很多,每年可以節(jié)約近1億人民幣。

從華為的實踐來看,我們有幾點體驗和心得。第一,AI已經(jīng)完全具備進入所有主業(yè)務(wù)流程的能力。第二,選擇價值場景非常重要,一定要沿著業(yè)務(wù)流程來識別業(yè)務(wù)對象和價值場景,尤其是要關(guān)注海量重復(fù)復(fù)雜的場景,效果是最好的。第三,業(yè)務(wù)部門的深度參與,甚至是業(yè)務(wù)部門牽頭是項目成功的關(guān)鍵。

同時,要成功的應(yīng)用好人工智能,需要實現(xiàn)場景、算法、數(shù)據(jù)、算力四位一體。

在華為云應(yīng)用AI來服務(wù)外部的客戶,我們也進行了大量的實踐和積極的探索,感謝所有的客戶和伙伴的支撐。那么主流的應(yīng)用場景已經(jīng)涵蓋了,醫(yī)療、氣象、智慧工業(yè)、互聯(lián)網(wǎng)、智能媒體、城市治理、科研探索等等,已經(jīng)超過了800多個項目的實踐。其中30%的項目已經(jīng)進入了客戶的業(yè)務(wù)核心系統(tǒng),凡是能夠用AI進入業(yè)務(wù)核心系統(tǒng)的客戶,平均盈利能力提升約18%。

下面我們將重點介紹幾個案例,在醫(yī)藥行業(yè),華為云研發(fā)了盤古藥物分子大模型,大家知道新藥的研發(fā)工作風險非常大,周期長、成本高,醫(yī)藥界存在一條“雙十定律”,即一款新藥從研發(fā)到上市,平均成本超過10億美金,研發(fā)周期大于10年。即使如此,大約也只有10%的新藥能被批準進入臨床期。那么在抗生素研發(fā)領(lǐng)域,甚至有的藥物剛進入臨床階段,細菌就已經(jīng)產(chǎn)生了對其的耐受性。我們和西安交大合作,西安交大一附院劉冰教授,他帶領(lǐng)團隊在抗生素領(lǐng)域采用了華為云的AI盤古藥物分子大模型,來做AI輔助藥物設(shè)計,突破性的研發(fā)出超級抗菌藥,突破了業(yè)界這個雙十定律,將先導(dǎo)藥的研發(fā)周期從數(shù)年縮短到了一個月,研發(fā)成本降低70%。

在知識計算這個領(lǐng)域也是一個新的創(chuàng)新領(lǐng)域。知識計算就是用AI的技術(shù)來實現(xiàn),機器將知識轉(zhuǎn)化成可計算的模型。在石油勘探領(lǐng)域,華為AI的知識計算顯著地降低了從業(yè)門檻,傳承了專家的知識經(jīng)驗,提升了油氣識別的效率。油田勘探是一個復(fù)雜的過程,高度的依賴人員的經(jīng)驗。

例如,對數(shù)千米以下的地下構(gòu)造和油藏特點進行準確判斷是非常困難的,需要對大量的信息進行綜合的計算,需要經(jīng)驗非常豐富的專家來做準確的分析。那么華為云將測井領(lǐng)域的知識圖譜中實體關(guān)系屬性表達成向量的形式,并構(gòu)建深度的神經(jīng)網(wǎng)絡(luò)。油氣層識別效率比傳統(tǒng)的方法提升了5%,同時節(jié)約了專家約70%的時間,并提供智能推薦的能力,為決策層提供了更好的依據(jù)。大港油田將知識計算應(yīng)用到超過900口的油井,實現(xiàn)了油氣水層位的智能識別,平均時間縮短了70%,識別準確率達到了解釋專家的水平。

我們看看焦化領(lǐng)域,焦化企業(yè)80%左右的成本在配煤。焦炭的質(zhì)量與輸入的各種因素關(guān)系非常復(fù)雜,當前配煤比例主要是依賴技術(shù)工程師的人的經(jīng)驗,很難做到精準。那么,在配煤主業(yè)務(wù)場景,AI就可以給客戶帶來更大的價值。例如鞍鋼通過機理模型和AI模型的融合,構(gòu)建高精度焦炭質(zhì)量預(yù)測模型,預(yù)測焦炭的質(zhì)量,優(yōu)化配比耗時縮短至10秒以內(nèi),焦炭的質(zhì)量預(yù)測準確率在98%,平均煤的成本可以降低5-20元每噸。如果年產(chǎn)量超過200萬噸的焦煤,就可以節(jié)約成本上千萬人民幣。

煤礦行業(yè),通過AI的大模型,能夠圍繞著安全生產(chǎn)、工業(yè)優(yōu)化、決策指揮、經(jīng)營管理等場景進行全方面的優(yōu)化,可以實現(xiàn)智能化,減少事故,大幅提升生產(chǎn)質(zhì)量和效率。例如,在山西沙曲礦離線驗證精煤的產(chǎn)量預(yù)計提升0.2%。山東能源濟二煤礦啟動驗證,按每噸精煤700元測算,預(yù)計落地收益達到1.96億人民幣。還有煤礦的現(xiàn)場管理是非常重要的,煤礦現(xiàn)場同樣能通過AI來優(yōu)化。

在智能汽車領(lǐng)域,通過應(yīng)用華為云的知識計算,一汽紅旗的4s店,一次性修復(fù)率提升了4%,客戶維修等待時間下降了23%,廠家支持介入率下降了30%,維修技師的培養(yǎng)時間縮短了30%,客戶反饋從過去的人找知識變成現(xiàn)在的知識找人,可以幫助員工快速的成長,成為領(lǐng)域的專家,推動了集團的知識化轉(zhuǎn)型。

我們再看看城市治理,目前很多的城市都整合了熱線系統(tǒng),統(tǒng)一到12345,那么,華云的AI應(yīng)用到了上海、廣州、長沙、貴陽、湛江等很多城市的熱線整合過程中。以上海的12345熱線為例,這條熱線的響應(yīng)速度現(xiàn)在非常的快,而且能回答的問題非常的多。這是因為該系統(tǒng)去年開始就引入了人工智能的技術(shù),用到了自動派單,語音識別,甚至有情緒感知等功能。有了這些技術(shù)的加持,整個熱線的服務(wù)速度加快了,過去一張單要好幾分鐘的時間,現(xiàn)在幾秒鐘就搞定了,同時這些單的分發(fā)更加智能,客戶的滿意度得到提升。

除了效率提升和滿意度提升之外,這條熱線變得越來越智能,甚至可以主動的預(yù)測風險事項。例如:寒潮來了,哪些地方的水管爆裂,會提提前做出預(yù)測,讓城市部門做好更好的預(yù)案,快速處理。得益于AI的加持,不僅是熱線的服務(wù)效率提升了,也讓市民感受到了城市管理的溫度。除了生產(chǎn)效率改進之外,我們認為 AI也可以讓世界變得更加美好。

接下來,我給大家分享智能媒體創(chuàng)新的實踐。過去10年移動互聯(lián)網(wǎng)的時代,整個視頻用戶增加超過了10億,已經(jīng)非常接近于我國的人口總數(shù)。當前行業(yè)正在從移動互聯(lián)網(wǎng)進入虛實融合的3D互聯(lián)網(wǎng)的時代,媒體產(chǎn)業(yè)帶來蓬勃的發(fā)展機會。

2025年全球VR設(shè)備出貨量將超過1億臺,AR的設(shè)備預(yù)計會達到5,000萬臺,應(yīng)用于B端的數(shù)字人預(yù)計超過300萬,C端以10億來計。未來幾年,我們可以看到3D的內(nèi)容和應(yīng)用會帶來萬億美金的市場,但是在這個大市場的背后,仍然有非常多的制約性的技術(shù)問題,這些問題需要我們一起去探索去解決。

第一個問題,視頻是內(nèi)容為王的。但是目前面臨的最大問題是精品的內(nèi)容還是比較少,制作周期非常的長,產(chǎn)能低,整個中國傳統(tǒng)的長視頻產(chǎn)量年可以達到5萬個小時。反過來我們看到優(yōu)質(zhì)的VR視頻內(nèi)容,每年產(chǎn)能還不到100個小時。在游戲領(lǐng)域熱門的VR游戲《節(jié)奏光劍》在全球售出僅有500萬份,但大家都熟悉的2D游戲《王者榮耀》日活就過億了,在華為應(yīng)用市場下載就超過39億次,那么這是幾個量級的差別,為什么會有這樣的差別?

除了終端的普及率和體驗之外,核心問題是整個3D音視頻制作的效率太低了。好的內(nèi)容生產(chǎn)周期要18個月,甚至是24個月,這就導(dǎo)致內(nèi)容的供給非常的弱,制約了整個產(chǎn)業(yè)的發(fā)展。

第二個問題就是我們有內(nèi)容制作,有直播,但當前最大的問題是網(wǎng)絡(luò)技術(shù),還有一些結(jié)構(gòu)性的問題需要去創(chuàng)新、去解決。

大家現(xiàn)在看一個短視頻,一般是720p、1080p一般最多需要5兆bps,但是我們看VR至少需要30兆的帶寬,而精品的VR甚至到到百兆。所以,我們談元宇宙,我們判斷以后最少需要300兆,甚至要到一個G的帶寬。從時延的角度來看看,一個普通視頻時延可能不是問題,但是VR如果時延大于50毫秒,就會有很強的眩暈感。那么我們看到這個帶寬需要百倍千倍的提升,時延50倍以上的提升來降低時延。所以,單靠5G光的技術(shù)是解決不了的,這個時候需要網(wǎng)絡(luò)架構(gòu)上的創(chuàng)新,云、網(wǎng)、邊端的協(xié)同來解決這些問題。

華為云如何來不斷的創(chuàng)新來釋放媒體產(chǎn)業(yè),更多的是數(shù)字生產(chǎn)力。今天我們重點探討兩個方面的內(nèi)容。一個方面就是華為云能夠提供四條場景化的管線,影視綜藝后期管線、云上智能直播管線、虛實融合內(nèi)容管線、云上虛擬互動管線來幫助大家做媒體內(nèi)容生產(chǎn)的時候更加高效。

第二就是我們講講有六個方面的技術(shù)創(chuàng)新,使我們有更好的體驗。

首先我們看看影視綜藝后期管線,這個管線從DIT開始到制作成片結(jié)束,通過云上的制片系統(tǒng)、制作系統(tǒng)、云桌面、云渲染以及相關(guān)的計算存儲的能力,使能整個制作團隊從解決大素材上云開始,通過云上編碼實現(xiàn)素材的套剪,通過華為影視工作站級的云桌面,解決藝術(shù)家隨時隨地的可以創(chuàng)作與剪輯,素材安全的保存,云上協(xié)同的審片,快速的渲染等等。那么,AI的應(yīng)用可以大幅提升藝術(shù)家的工作效率,包括老舊素材的修復(fù)、上色、搜索、字幕生成、多軌合板,不良藝人與競品的擦除等等,讓我們的藝術(shù)家從繁瑣的重復(fù)勞動中釋放出來,更加聚焦于藝術(shù)的創(chuàng)意。

第二個是云上的智能直播管線,針對直播的需求,如高碼率、高色域、融媒體、播控、5G直播等等,以及一些智能互動的直播場景。采用多地互動,AI導(dǎo)播切換,AI畫面優(yōu)化,虛擬場景等等。華為云上構(gòu)建了智能直播管線,輕量化的處理,采用5G技術(shù)加云上IP壓縮流,代替?zhèn)鹘y(tǒng)的SDI線路,降低了傳統(tǒng)直播的轉(zhuǎn)播車依賴,極大的提升了媒體從業(yè)人員的單兵作戰(zhàn)能力,引入更多的IP化終端,如手機、無人機、VR自由視角矩陣等等,提升了直播設(shè)備的豐富性與多視角。專業(yè)的云上導(dǎo)播配合各種云端生產(chǎn)的開發(fā) kit,如AI切換、虛擬場景制作、3D特效包裝等等,給傳統(tǒng)導(dǎo)播能力升級換代。通過RTC的技術(shù)將直播引入雙向轉(zhuǎn)動能力,極大的延伸了直播業(yè)務(wù)形態(tài)和打破地域的限制。

第三虛擬融合的內(nèi)容管線。在虛實融合的時代,數(shù)字內(nèi)容的制作方式,從攝像機實拍轉(zhuǎn)向3D內(nèi)容的建模、仿真、渲染,主要制作的內(nèi)容就是數(shù)字人、數(shù)字物、數(shù)字場景。

精品的數(shù)字內(nèi)容生產(chǎn)實際上面臨了非常多的挑戰(zhàn),例如《阿凡達》當年從制作到成片花了5年的時間,有48家公司,超過1800多個特效人員,使用了超過4萬多盒的CPU用于內(nèi)容制作和特效渲染,很明顯這個行業(yè)需要更加便捷的工具。

華為云的云上數(shù)字內(nèi)容生產(chǎn)線,擁有百萬盒的渲染資源,將影視制作的拍攝、剪輯、建模、綁定、驅(qū)動、渲染、合成到分發(fā)的全流程,在云上進行了重構(gòu),實現(xiàn)了流程自動化。全球的影視創(chuàng)作者可以無縫協(xié)作,高效協(xié)同,大幅提升制作效率,讓大片內(nèi)容制作周期從數(shù)年可以縮短到幾個月。

第四是云上的虛擬互動管線。傳統(tǒng)的會議、培訓、展會、會談在未來會有很大的變化。例如沉浸式的體驗,更加的實時互動模式。

實際上我們看到周邊的工作和生活已經(jīng)有越來越多這樣的例子,例如云上虛擬會議,可以提供包括會議、培訓、峰會、宣講,讓參會人員以數(shù)字人的方式進入虛擬場景,全新的體驗。例如云上展廳現(xiàn)在越來越流行,可以將實際的物理展廳搬到云上,隨時隨地可以參觀,可以提供更加互動的參展方式,遠程的接待海外的客戶對我們來說非常有用。在疫情期間,我們?nèi)A為利用這個能力,實際上接待了非常多的海外客戶。

接下來,我們重點看看技術(shù)點上的創(chuàng)新,第一個是云網(wǎng)邊端的協(xié)同。在未來的虛擬融合的世界需要通過分布式的云,通過全球一張網(wǎng)連接無數(shù)虛擬數(shù)字空間,在數(shù)字空間中有社交、工作、娛樂,同時通過彈性的調(diào)度,將海量的用戶分配到全球不同的數(shù)字空間中,實現(xiàn)消息交互框架能夠支持上億次每秒的交互,交互時延低于20-50毫秒,這就是云網(wǎng)邊端協(xié)同的價值,可以達到虛擬人、虛擬空間,真實人、真實空間,進行實時的交互和互動,最終實現(xiàn)萬人同服的數(shù)字體驗。

第二是數(shù)字人大腦。讓數(shù)字人真正的智能化,AI是核心。我們稱之為數(shù)字人大腦。通過AI的逐步應(yīng)用,讓數(shù)字人越來越聰明。首先是表情和肢體的控制能力,其次是記憶和學習能力。通過AI的大模型讓數(shù)字人驅(qū)動,由專業(yè)動捕面捕驅(qū)動,眼睛到無中之人的自我驅(qū)動。同時通過云上的記憶和存儲,通過大模型知識訓練,讓數(shù)字人學習到不同的知識和技能,甚至培養(yǎng)獨特的個性魅力。

第三是區(qū)塊鏈的能力,為了快速跨越產(chǎn)業(yè)裂谷,我們需要從傳統(tǒng)的線下生產(chǎn)模式走向集約化協(xié)作共享的生產(chǎn)方式。我們聯(lián)合合作伙伴打造了面向媒體產(chǎn)業(yè)的數(shù)字資產(chǎn)聯(lián)盟鏈,讓原來每個工作室的數(shù)字資產(chǎn)在云上可以安全的分享和流轉(zhuǎn),從而激發(fā)整個行業(yè)的創(chuàng)造力。

第四是云上的渲染,萬核渲一圖以及AI加持的渲染。我們知道《阿麗塔:戰(zhàn)斗天使》的特效非常好,阿麗塔的一只眼睛比《魔戒》中咕嚕全身的像素都高,這背后《阿麗塔》平均每一幀需要100個小時來渲染,總計用了超過4億個小時的渲染時間,是《阿凡達》的三倍。

所以,渲染是創(chuàng)造高品質(zhì)數(shù)字內(nèi)容的基礎(chǔ)。華為云借助云上的海量算力、高效存儲、快捷網(wǎng)絡(luò)和彈性調(diào)度,可以實現(xiàn)萬核渲一圖,例如《流浪地球》用5,000萬美金的費用拍出了媲美好萊塢幾個億的大片的效果,其中就有華為云和我們伙伴的貢獻。

那么,我們也推出了MetaEngine,這是華為自研的圖形引擎。通過將云AI和計算機圖形學相結(jié)合,可以大幅的提升渲染的效率。以一部90分鐘的3D電影為例,原來在線下渲染大約需要6個月,使用我們部在烏蘭察布的這個云渲染服務(wù),可以降低到兩周完成,如果進一步使用了我們的MetaEngine只需要7天。

第五個是多模態(tài)標簽?;贏I的盤古多模態(tài)大模型,可以從視頻、人像、語音、文字等多個模態(tài)自動輸出對應(yīng)的標簽。也就是我們放一段視頻之后,我們就可以自動的形成非常多的標簽,然后開始來做場景的編目,智能的檢索、歸檔和推薦。傳統(tǒng)的方法可能需要3-6個月的時間才能完成一套自定義的標簽體系。

由于盤古多模態(tài)大模型已經(jīng)學習了100億對的數(shù)據(jù),支持萬級別的數(shù)據(jù)標簽,所以很容易快速自動的形成客戶需要的標簽體系。這個服務(wù)已經(jīng)開始友好客戶的試用,例如億幕科技、銀河威爾、貴州多彩新媒,GITV等等。其中天合智造通過AI多模態(tài)智能標簽識別,實現(xiàn)了對視頻智能剪輯,包括智能生成封面、視頻拆條、人臉替換、目標擦除、智能剪裁等等。

第六是自由視角。大家看這個圖的左邊的子彈時間是用戶可以在終端上切換第一視角,而右邊的時空凝結(jié)是我們一般導(dǎo)演可以控制視角,給大家展示更好的全景視角。

自由視角已經(jīng)在湖南臺、央視等多個項目中參與了節(jié)目的創(chuàng)新與制作,華為云進一步將自由視角引入到直播中,我們可以允許客戶獲得更多更好的直播體驗,提升客戶的觀感。

最后,回顧一下,今天我們主要是探討了兩個方面的內(nèi)容。第一是華為云的AI在各行業(yè)創(chuàng)新的實踐,第二就是我們在媒體領(lǐng)域的創(chuàng)新與實踐。華為云將在人工智能和媒體領(lǐng)域持續(xù)的創(chuàng)新,不斷的來釋放我們產(chǎn)業(yè)的數(shù)字生產(chǎn)力。華為的公司的愿景是把數(shù)字世界帶入每個人、每個家庭、每個組織,構(gòu)建萬物互聯(lián)的智能世界。

我的匯報就到這里,謝謝大家。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )