對癥下藥、打破桎梏:華為NAIE云地協(xié)同為電信網(wǎng)絡(luò)鋪就智能升維之路

9月26日專稿(蔣均牧)隨著人類社會的數(shù)字化進(jìn)程不斷深入,“聯(lián)網(wǎng)”在今天已經(jīng)成為如“衣食住行”般的基礎(chǔ)需求,業(yè)務(wù)、運(yùn)維、聯(lián)接的復(fù)雜度也與日俱增。通過引入AI,打造一張基于用戶體驗(yàn)的智能化、全自動的網(wǎng)絡(luò),已經(jīng)成為電信行業(yè)的共同追求。

而在硬幣的另一面,一些問題也隨之浮出了水面。比如AI特性的規(guī)模應(yīng)用面臨著模型泛化能力差、模型易老化、本地樣本少等諸多挑戰(zhàn),從而拖慢了AI在電信網(wǎng)絡(luò)中的整體普及速度。作為網(wǎng)絡(luò)轉(zhuǎn)型先驅(qū)者的華為,對此給出了“云地協(xié)同”這個答案。

“在將AI能力注入電信網(wǎng)絡(luò)的旅程中我們發(fā)現(xiàn),僅僅討論算法問題、考慮如何用數(shù)學(xué)解決業(yè)務(wù)問題是不夠的,還需要克服很多難點(diǎn)。比如一個模型如果不做管理和控制,半年時間精度就會下滑到原先的60%左右。我們希望‘把困難留給自己,把方便帶給客戶’,通過不斷創(chuàng)新來推動AI在電信行業(yè)的快速規(guī)模部署,這也是此次提出云地協(xié)同解決方案的初衷。”在華為全聯(lián)接大會2020期間的一場媒體圓桌上,華為網(wǎng)絡(luò)人工智能(NAIE)產(chǎn)品部總經(jīng)理韓雨發(fā)表示,云端與地端的聯(lián)動,將使AI模型越用越準(zhǔn)確。

活動上,他還發(fā)布了《AI使能自動駕駛網(wǎng)絡(luò)——華為iMaster NAIE網(wǎng)絡(luò)人工智能引擎技術(shù)白皮書》,該白皮書結(jié)合電信網(wǎng)絡(luò)智能化的市場趨勢大背景,闡述了華為在該領(lǐng)域的實(shí)踐落地,包括華為自動駕駛網(wǎng)絡(luò)解讀、NAIE網(wǎng)絡(luò)人工智能引擎以及典型應(yīng)用場景探索等。

大勢所趨:將AI引入電信行業(yè)

從18世紀(jì)至今300余年間,世界通過三次工業(yè)革命,完成了機(jī)械化、電氣化、信息化的改造,每一次變革都驅(qū)動人類社會邁向新的發(fā)展紀(jì)元。如果說在21世紀(jì)還有哪一種技術(shù)可以和歷次工業(yè)革命中的先導(dǎo)科技相提并論的話,那一定是AI技術(shù)。

作為一項通用目的技術(shù),AI在上世紀(jì)七十年代便與空間技術(shù)、能源技術(shù)一起被譽(yù)為“世界三大尖端技術(shù)”,同時亦與基因工程、納米科學(xué)一起被認(rèn)為是“21世紀(jì)三大尖端技術(shù)”。經(jīng)歷了60余年起起伏伏,近年來AI技術(shù)步入成熟增長期,越來越多地與現(xiàn)實(shí)世界產(chǎn)生了碰撞,并迅速成為適用于大部分經(jīng)濟(jì)活動的基本生產(chǎn)力。

AI在電信行業(yè)同樣廣受青睞,產(chǎn)業(yè)上下游紛紛圍繞于此展開布局。在國內(nèi),中國移動發(fā)布了九天人工智能平臺,匯聚內(nèi)外部優(yōu)秀AI能力,支撐移動各領(lǐng)域AI應(yīng)用;中國電信致力于打造智能化“隨愿網(wǎng)絡(luò)”,通過AI賦能平臺和傳統(tǒng)設(shè)備的AI升級,改善用戶體驗(yàn)、提升使用效率;中國聯(lián)通發(fā)布了網(wǎng)絡(luò)AI平臺Cube-AI智立方,以提升網(wǎng)絡(luò)智能水平、降本增效為目標(biāo)。

在海外,西班牙電信發(fā)布了網(wǎng)絡(luò)AI架構(gòu)與Fast OSS架構(gòu),逐步建立自身的AI用例開發(fā)及運(yùn)維能力;法國電信以AI/數(shù)據(jù)為核心推動網(wǎng)絡(luò)智能化、重塑用戶體驗(yàn),作為2025戰(zhàn)略的關(guān)鍵目標(biāo);德國電信則利用AI/ML建立了逐漸演進(jìn)、開源、非集中化、以自治網(wǎng)絡(luò)為目標(biāo)的AI Program。

從ALL IP、ALL Cloud到ALL Intelligence,華為在電信網(wǎng)絡(luò)架構(gòu)創(chuàng)新上的探索實(shí)踐從未停止。早在全云化戰(zhàn)略實(shí)施過程中便嘗試引入AI,以推動網(wǎng)絡(luò)的自動、自優(yōu)、自愈、自治。2018年9月,正式提出自動駕駛網(wǎng)絡(luò)(AND)和5級定義,將AI嵌入到底層網(wǎng)元、中間層網(wǎng)絡(luò)和上層云端乃至網(wǎng)絡(luò)的整個生命周期中,以此來實(shí)現(xiàn)網(wǎng)絡(luò)的“無人駕駛、永無故障”。2019年4月,正式發(fā)布iMaster NAIE網(wǎng)絡(luò)AI云服務(wù),成為邁向自動駕駛網(wǎng)絡(luò)過程中的重要里程碑。

各大電信行業(yè)組織亦已將AI的應(yīng)用推廣納入議程。比如TMF于2019年5月發(fā)布了自動駕駛網(wǎng)絡(luò)白皮書,并成立自治網(wǎng)絡(luò)工作組,今年2月對自動駕駛網(wǎng)絡(luò)技術(shù)架構(gòu)立項。CCSA、3GPP、GSMA、ETSI等組織也陸續(xù)發(fā)布了自動駕駛網(wǎng)絡(luò)相關(guān)的研究建議、白皮書、案例報告等。

云地協(xié)同:加速AI特性規(guī)模應(yīng)用

在產(chǎn)業(yè)界各方的積極推動下,AI技術(shù)已在電信網(wǎng)絡(luò)的規(guī)劃、建設(shè)、維護(hù)、優(yōu)化等各個環(huán)節(jié)開啟了使能之旅,目前主要聚焦解決感知預(yù)測、根因分析和優(yōu)化控制等問題。典型的AI特性應(yīng)用像是站點(diǎn)智能節(jié)能、故障識別及根因定位、Massive MIMO模式優(yōu)化,都已初見成效。

不過經(jīng)實(shí)踐發(fā)現(xiàn),AI在網(wǎng)絡(luò)中走向規(guī)模部署的過程中尚存不少挑戰(zhàn)。韓雨發(fā)例舉道,首先是模型泛化能力差,很多場景的AI模型都是一站一模型,如無線流量預(yù)測,每個站點(diǎn)的模型都需要根據(jù)本地個性化的數(shù)據(jù)進(jìn)行訓(xùn)練,而本地資源受限,導(dǎo)致AI模型規(guī)模應(yīng)用難。

其次,模型易老化。一些場景會發(fā)生因泛化或數(shù)據(jù)偏移而導(dǎo)致的模型精度下降問題,如無線流量預(yù)測、DC PUE優(yōu)化等,AI模型都需要進(jìn)行重訓(xùn)練。AI模型訓(xùn)練一般會占用較多系統(tǒng)資源,如在網(wǎng)元或網(wǎng)管實(shí)施重訓(xùn)練任務(wù),訓(xùn)練效率低,同時也可能會影響設(shè)備性能。

第三,樣本少,不出局。部分場景單局點(diǎn)樣本量少,不足以支撐模型訓(xùn)練。以核心網(wǎng)KPI異常檢測為例,由于單局點(diǎn)發(fā)生異常頻率很少,訓(xùn)練需要的樣本量不夠。需要能夠匯聚所有局點(diǎn)的全量樣本信息,可能還需輔以聯(lián)邦學(xué)習(xí)等技術(shù),才能訓(xùn)練得到滿足業(yè)務(wù)精度要求的AI模型。

最后,試錯成本高。設(shè)計的模型如果直接在真實(shí)環(huán)境上使用,可能存在較大風(fēng)險。比如數(shù)據(jù)中心設(shè)計方案,一旦落地,結(jié)果基本不可逆。

針對于此,華為基于iMaster NAIE創(chuàng)造性地提出云地協(xié)同解決方案,以加速AI特性的規(guī)模應(yīng)用。韓雨發(fā)介紹說,云地協(xié)同是指在運(yùn)行狀態(tài)下,云端和地端一起協(xié)作完成數(shù)據(jù)樣本上云、模型狀態(tài)管理、模型重訓(xùn)練、模型/知識下發(fā)、擇優(yōu)更新等一系列的閉環(huán)任務(wù),同時把云端匯聚的全局網(wǎng)絡(luò)知識經(jīng)驗(yàn)、全量數(shù)據(jù)訓(xùn)練得到的高精度模型,持續(xù)注入地端,支撐電信網(wǎng)絡(luò)智能迭代升級,讓網(wǎng)絡(luò)越來越聰明。其中,云端是指部署在公有云、合營云或HCS上的NAIE云端智能;地端是指集成在網(wǎng)絡(luò)管控單元的網(wǎng)絡(luò)AI,以及網(wǎng)元設(shè)備中的網(wǎng)元AI。

他告訴C114,云地協(xié)同在實(shí)際部署中有三個階段,針對不同場景可以選擇合適的階段,最終大幅提高網(wǎng)絡(luò)的資源效率。

階段一是云端進(jìn)行初始模型的訓(xùn)練,運(yùn)行態(tài)由地端根據(jù)新增的樣本進(jìn)行在線學(xué)習(xí),持續(xù)保持模型的精度。這種模式主要適用于模型相對簡單、算法結(jié)構(gòu)比較穩(wěn)定的場景,僅需要根據(jù)本地數(shù)據(jù)進(jìn)行在線學(xué)習(xí),優(yōu)化調(diào)整模型參數(shù),比如核心網(wǎng)變更在線機(jī)器值守等。階段二是云端進(jìn)行模型的分發(fā),然后在地端根據(jù)新增樣本進(jìn)行在線學(xué)習(xí)。一般適合模型相對復(fù)雜,華為會持續(xù)進(jìn)行模型算法結(jié)構(gòu)優(yōu)化的場景,比如無線KPI異常檢測等。階段三是云地實(shí)時協(xié)同,模型可以自動化演進(jìn)。適用于模型復(fù)雜、需要用到華為云端高質(zhì)量標(biāo)注數(shù)據(jù)、知識圖譜以及仿真等知識能力進(jìn)行模型優(yōu)化的場景,比如IP RAN/PTN智能告警、DC PUE優(yōu)化等。

打破桎梏:云地協(xié)同關(guān)鍵價值詳解

對癥下藥、打破桎梏,為電信網(wǎng)絡(luò)鋪就一條智能升維之路,正是新方案的價值所在。在媒體圓桌上,韓雨發(fā)對此進(jìn)行了詳細(xì)的解讀。

其一是借助聯(lián)邦學(xué)習(xí),提升模型泛化能力和訓(xùn)練效率。聯(lián)邦學(xué)習(xí),即是將邊緣節(jié)點(diǎn)數(shù)據(jù)保留在本地,通過地端分布式訓(xùn)練和云端模型匯聚的云地協(xié)同機(jī)制,獲得全量數(shù)據(jù)集中訓(xùn)練方式等同的模型效果,最大的特點(diǎn)就是在地端數(shù)據(jù)不用出局的情況下提升模型的精度。其應(yīng)用場景包括,跨運(yùn)營商部署,運(yùn)營商的網(wǎng)絡(luò)業(yè)務(wù)數(shù)據(jù)不允許出局;運(yùn)營商內(nèi)不同子網(wǎng)之間的模型共享,同樣可以解決數(shù)據(jù)不出局的問題;運(yùn)營商內(nèi)網(wǎng)元管理帶寬受限,不適合上傳大量數(shù)據(jù)的場景。

品質(zhì)家寬是一個典型的案例。韓雨發(fā)分享道,家寬業(yè)務(wù)需要區(qū)分游戲、視頻、上網(wǎng)、應(yīng)用下載等,以進(jìn)行流量的精細(xì)化管理,提升用戶體驗(yàn)。但當(dāng)前各地樣本不同,導(dǎo)致新項目應(yīng)用識別精準(zhǔn)率低、上市周期長。T國某運(yùn)營商在每個邊緣端的SmartONT上進(jìn)行本地的模型訓(xùn)練,然后上傳模型參數(shù)到聯(lián)邦學(xué)習(xí)服務(wù)器進(jìn)行匯聚,生成出新的模型以后再下發(fā)給網(wǎng)絡(luò)中的終端(包括新建終端),從而在不需要上傳本地數(shù)據(jù)的前提下快速地提升模型的泛化能力,并可以提高模型訓(xùn)練的效率、加快新項目的上市。部署以后,對于應(yīng)用的識別準(zhǔn)確率在95%以上,保證了用戶在使用不同應(yīng)用時的體驗(yàn)。

其二是構(gòu)建云地協(xié)同構(gòu)建網(wǎng)絡(luò)知識庫,提升故障運(yùn)維輔助效率。借助知識圖譜,通過沉淀專家經(jīng)驗(yàn)和產(chǎn)品知識轉(zhuǎn)化形成故障傳播關(guān)系等,形成“網(wǎng)絡(luò)知識庫”,可用于故障運(yùn)維輔助、知識問答等。知識生產(chǎn)系統(tǒng)可部署在云端,包含建模、抽取、打包等,在起始階段,專業(yè)知識需要各個領(lǐng)域的專家編輯領(lǐng)域知識譜schema和推理規(guī)則(專家經(jīng)驗(yàn))。知識消費(fèi)系統(tǒng)客戶端部署到現(xiàn)場,地端圖譜引擎先從云端導(dǎo)入對應(yīng)產(chǎn)品的知識圖譜schema和推理規(guī)則,然后對接現(xiàn)網(wǎng)設(shè)備采集日志數(shù)據(jù),根據(jù)下載的schema模型重新組織存儲數(shù)據(jù),應(yīng)用推理規(guī)則進(jìn)行故障診斷,給出處理建議。

其三是建立云端仿真,模型及業(yè)務(wù)驗(yàn)證安全高效。云端仿真,即通過在云端構(gòu)建虛擬仿真環(huán)境,高效安全地進(jìn)行模型或業(yè)務(wù)驗(yàn)證,在避免現(xiàn)網(wǎng)性能或KPI受到影響的同時,支撐網(wǎng)絡(luò)問題的快速閉環(huán)。一方面仿真往往要求很多資源,云端的計算和存儲資源豐富,容易滿足仿真建立的環(huán)境要求;另一方面,在云端建立一個集中化的仿真平臺,可以供多個局點(diǎn)共享,而且很多仿真軟件是根據(jù)授權(quán)收費(fèi)模式,集中化的云端仿真可以大幅降低經(jīng)濟(jì)成本。目前NAIE主要支持兩種場景的仿真,DC節(jié)能仿真和無線網(wǎng)絡(luò)優(yōu)化仿真。目前NAIE主要支持兩種場景的仿真,DC節(jié)能仿真和無線網(wǎng)絡(luò)優(yōu)化仿真。

其四是提升模型版本管理效率,加速AI特性更新。傳統(tǒng)網(wǎng)管版本集成升級模式需要經(jīng)過多層多次的人工動作,往往需要1個月以上的時間才能完成一個版本的更新。如果采用云地協(xié)同的自動升級模式,讓AI模型市場跟地端網(wǎng)絡(luò)AI對接,模型訓(xùn)練完成后通過AI市場進(jìn)行發(fā)布,啟動局點(diǎn)自動下載升級,整個過程僅需1個小時即可完成。

“總體來看,云地協(xié)同可以實(shí)現(xiàn)一點(diǎn)生效、多點(diǎn)復(fù)制,AI的特性在一個局點(diǎn)成功實(shí)施后,快速地形成知識和經(jīng)驗(yàn),在其他局點(diǎn)進(jìn)行復(fù)制,從而實(shí)現(xiàn)全網(wǎng)規(guī)模應(yīng)用。”韓雨發(fā)如是總結(jié)道。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-09-26
對癥下藥、打破桎梏:華為NAIE云地協(xié)同為電信網(wǎng)絡(luò)鋪就智能升維之路
對癥下藥、打破桎梏:華為NAIE云地協(xié)同為電信網(wǎng)絡(luò)鋪就智能升維之路,C114訊 9月26日專稿(蔣均牧)隨著人類社會的數(shù)字化進(jìn)程不斷深入,聯(lián)網(wǎng)在今天已經(jīng)成為如衣食住行般

長按掃碼 閱讀全文