北郵教授顧仁濤:光+計(jì)算深度融合,大規(guī)模連接或成關(guān)鍵挑戰(zhàn)

7月18日消息(趙婷婷)今天下午,由CIOE中國(guó)光博會(huì)和C114通信網(wǎng)聯(lián)合舉辦的“2024中國(guó)光通信高質(zhì)量發(fā)展論壇”最后一場(chǎng)線上活動(dòng)“智能光網(wǎng)絡(luò):應(yīng)對(duì)算力新挑戰(zhàn)”順利召開(kāi)。

北京郵電大學(xué)教授、未來(lái)學(xué)院常務(wù)副院長(zhǎng)顧仁濤發(fā)表題為《智算光網(wǎng)絡(luò):面向“光+計(jì)算”探索與展望》的主題演講。他表示,隨著數(shù)字經(jīng)濟(jì)的迅猛發(fā)展,計(jì)算和網(wǎng)絡(luò)技術(shù)的深度融合變得愈發(fā)重要。在這個(gè)背景下,將智能算力與超大容量光網(wǎng)絡(luò)相結(jié)合,正在引領(lǐng)著未來(lái)網(wǎng)絡(luò)的發(fā)展方向。

“光+計(jì)算”將成為未來(lái)發(fā)展趨勢(shì)

顧仁濤表示,當(dāng)前,大模型市場(chǎng)的蓬勃發(fā)展與算力的快速增長(zhǎng)密不可分。算力不僅是支撐大模型發(fā)展的基礎(chǔ),更是驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)前進(jìn)的重要引擎。智算中心作為發(fā)展最快的一種算力供給形式,已經(jīng)成為全球人工智能算力的主要增量。同時(shí),算力的發(fā)展也對(duì)運(yùn)力提出了巨大挑戰(zhàn),預(yù)計(jì)骨干網(wǎng)帶寬將增加1000T以上,對(duì)樞紐間的帶寬運(yùn)力帶來(lái)了巨大壓力。

光網(wǎng)絡(luò)作為連接算力的重要基礎(chǔ)設(shè)施,其超高速率、超大容量和超長(zhǎng)距離傳輸?shù)奶匦允蛊涑蔀楫?dāng)前通信網(wǎng)絡(luò)的核心組成部分。隨著智算算力的快速發(fā)展,光網(wǎng)絡(luò)必須不斷提升其帶寬和傳輸效率,以滿足日益增長(zhǎng)的算力需求,確保數(shù)據(jù)的快速、可靠傳輸。

“光網(wǎng)絡(luò)將成為支撐算力業(yè)務(wù)的重要底座,是承載智算中心算內(nèi)和算間業(yè)務(wù)的基礎(chǔ)設(shè)施,‘光+計(jì)算’將成為未來(lái)的發(fā)展趨勢(shì)?!鳖櫲蕽f(shuō)道。

他指出,面向智算中心業(yè)務(wù),光網(wǎng)絡(luò)在大規(guī)模提升算力、高吞吐提高容量、低時(shí)延保障效率、高可靠保障訓(xùn)練和超遠(yuǎn)距離互聯(lián)五個(gè)方面提出了新的要求。

具體而言,面對(duì)大規(guī)模算力要求,光網(wǎng)絡(luò)高帶寬特性支持大規(guī)模數(shù)據(jù)傳輸,以支撐大規(guī)模GPU集群的需求;通過(guò)多波段擴(kuò)展、頻分復(fù)用、空分復(fù)用等技術(shù),光網(wǎng)絡(luò)可以提供大規(guī)模數(shù)據(jù)傳輸,提升網(wǎng)絡(luò)容量;在光模塊方面,LPO/LRO等新型封裝技術(shù)的出現(xiàn)可以提升光電轉(zhuǎn)換的處理速度,同時(shí)改善算力集群的功耗;光纖和光交換機(jī)作為傳輸設(shè)備和交換設(shè)備,因其低損耗的特性可以為智算網(wǎng)絡(luò)提供無(wú)損傳輸介質(zhì);此外,包括OTN在內(nèi)的傳送網(wǎng)絡(luò)因其大帶寬、低時(shí)延的特點(diǎn)、強(qiáng)保護(hù)的特點(diǎn),是算力拉遠(yuǎn)場(chǎng)景下的基礎(chǔ)支撐。

分智算中心內(nèi)部和智算中心之間兩個(gè)場(chǎng)景來(lái)看。就算內(nèi)而言,光電混合的智算中心會(huì)是未來(lái)的主要趨勢(shì)。電層負(fù)責(zé)突發(fā)性小顆粒傳輸,適用于需要快速響應(yīng)和局部連接任務(wù);光層則處理周期性的大顆粒傳輸,較長(zhǎng)距離的數(shù)據(jù)傳送需求。通過(guò)構(gòu)建光電混合智算中心,架構(gòu)實(shí)現(xiàn)了兩者的優(yōu)勢(shì)互補(bǔ)。

從算間來(lái)看,IP和光的協(xié)同會(huì)變得更為關(guān)鍵。為了實(shí)現(xiàn)計(jì)算資源和網(wǎng)絡(luò)資源的高效協(xié)同,將IP層的傳輸靈活性與光層的高速傳輸特性結(jié)合,形成了多鏈路IP+光的靈活可編程并行傳送網(wǎng)絡(luò)。

智算光網(wǎng)絡(luò)關(guān)鍵技術(shù)

接下來(lái),顧仁濤從算內(nèi)、算間、算間算內(nèi)一體化三方面介紹了智算光網(wǎng)絡(luò)的關(guān)鍵技術(shù)。

算內(nèi)方面,在器件上,當(dāng)前光模塊在算智中心的大數(shù)據(jù)量傳輸中可能會(huì)面臨帶寬瓶頸,同時(shí)對(duì)穩(wěn)定性和成本都有更高需求。光模塊的更新可以提高光電轉(zhuǎn)換的效率,從而滿足智算大帶寬低功耗的需求。例如LPO技術(shù)具備易插拔、易維護(hù)的優(yōu)點(diǎn),降低功耗和延時(shí)的同時(shí),還可節(jié)省50%的光學(xué)能耗和25%的交換機(jī)能耗。

在交換技術(shù)上,光交換機(jī)的提升方向主要集中在透明傳輸特質(zhì)的利用以及成本和性能的優(yōu)化上。與傳統(tǒng)的InfiniBand交換機(jī)方案相比,OCS方案具有更低的成本和功耗,另外3D-MEMS技術(shù)的光交換機(jī)憑借低成本以及優(yōu)秀的性能未來(lái)將更適用于智算中心。同時(shí),在智算中心內(nèi)部流量具有流數(shù)少、單流帶寬大的特征,長(zhǎng)短流場(chǎng)景下存在資源利用率低的問(wèn)題,需要一種能夠靈活應(yīng)對(duì)多粒度流量的技術(shù)。光電混合架構(gòu)不僅能處理單一流量,還能應(yīng)對(duì)多種流量類型,實(shí)現(xiàn)資源的高效利用。

“超大規(guī)模的訓(xùn)練過(guò)程中,一個(gè)計(jì)算中心可能在功耗、空間等等方面確實(shí)也不能滿足需求,所以算間互聯(lián)就成為一個(gè)必然的選擇?!彼f(shuō)道。

隨著算力業(yè)務(wù)的增加,算力部署也變得更加多樣化。分布式智算中心因其盈利能力、抗風(fēng)險(xiǎn)能力和算力設(shè)施的彈性,預(yù)計(jì)將成為未來(lái)的重要候選方案。在這種部署中,OTN等高速傳輸技術(shù)將扮演關(guān)鍵角色,提供了高帶寬、低延遲、靈活性和高可靠性的解決方案。

在傳輸上,新型光纖在智算網(wǎng)絡(luò)中心間互聯(lián)意義重大,其高速率低損耗特征,滿足大帶寬、低時(shí)延傳輸需求;可編程拉曼放大器作為長(zhǎng)距傳輸再生器,支持超寬譜增益的精準(zhǔn)調(diào)優(yōu),滿足波段擴(kuò)展帶來(lái)的新挑戰(zhàn)。

在組網(wǎng)上,算網(wǎng)協(xié)同管控是關(guān)鍵技術(shù)之一,網(wǎng)絡(luò)資源池化,滿足多維異構(gòu)網(wǎng)絡(luò)和算力資源的統(tǒng)一管控需求;支持“隱私保護(hù)”的多主體協(xié)作式資源分配,支持跨域任務(wù)需求;拓?fù)浣Y(jié)構(gòu)重構(gòu)也非常重要,找到最佳的IP+光網(wǎng)絡(luò)拓?fù)?,?shí)現(xiàn)根本性資源重構(gòu),保證網(wǎng)絡(luò)的靈活性和適應(yīng)性;采用基于感知的重構(gòu)式故障恢復(fù)方法,保障智算組網(wǎng)高可靠需求。

此外,端到端一體化的光網(wǎng)絡(luò)技術(shù)旨在構(gòu)建算內(nèi)和算間的一體化連接,滿足任務(wù)的定制化需求。端網(wǎng)協(xié)同的算內(nèi)算間一體化銜接可以實(shí)現(xiàn)端到端的全生命周期管控。通過(guò)多波段光網(wǎng)絡(luò)支持的虛擬網(wǎng)絡(luò)嵌入方法,實(shí)現(xiàn)業(yè)務(wù)的定制化需求。

發(fā)言最后,顧仁濤表示,面向未來(lái),數(shù)字孿生技術(shù)將成為智算光網(wǎng)絡(luò)發(fā)展的重要使能技術(shù),為面向“光+計(jì)算”的融合網(wǎng)絡(luò)提供數(shù)據(jù)基礎(chǔ)、模型基礎(chǔ)。另外,智算和自智之間會(huì)逐漸融合。自智的智算光網(wǎng)絡(luò)將通過(guò)“感知-決策-執(zhí)行-保障”閉環(huán),實(shí)現(xiàn)AI賦能的光+計(jì)算系統(tǒng)。

但與此同時(shí),智算光網(wǎng)絡(luò)還面臨很多挑戰(zhàn)。在算內(nèi),如何實(shí)現(xiàn)高效、低成本和多粒度的交換模式還是一個(gè)問(wèn)題。在算間方面,如何在超長(zhǎng)距離下解決擁塞控制和沖突、通過(guò)優(yōu)化TCP/UDP來(lái)保障吞吐量等都是亟待解決或者明確的問(wèn)題。面對(duì)大規(guī)模的邏輯上“All-to-all”連接,如何利用算力和網(wǎng)絡(luò)之間的耦合關(guān)系降低網(wǎng)絡(luò)部署成本,也是一個(gè)值得深入挖掘的領(lǐng)域。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-07-18
北郵教授顧仁濤:光+計(jì)算深度融合,大規(guī)模連接或成關(guān)鍵挑戰(zhàn)
北郵教授顧仁濤:光+計(jì)算深度融合,大規(guī)模連接或成關(guān)鍵挑戰(zhàn),C114訊 7月18日消息(趙婷婷)今天下午,由CIOE中國(guó)光博會(huì)和C114通信網(wǎng)聯(lián)合舉辦的“202

長(zhǎng)按掃碼 閱讀全文