1月16日消息(顏翊)AI時代已經(jīng)來臨。大模型等新興AI應(yīng)用需求海量的算力支撐,一座座智算中心拔地而起,規(guī)模龐大的萬卡集群逐漸投入商用。如何更好地實現(xiàn)智算中心互聯(lián),服務(wù)AI應(yīng)用創(chuàng)新發(fā)展,業(yè)界做了大量研究工作。
1月16日,作為“2025中國光通信高質(zhì)量發(fā)展論壇”的開篇之作,“智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座”線上研討會順利召開,邀約產(chǎn)業(yè)鏈專家代表,圍繞智算中心間跨地域、跨層級、跨主體、高可靠的算力協(xié)同與調(diào)度,以及智算中心互聯(lián)關(guān)鍵技術(shù)等話題展開了深入探討。
中國聯(lián)通研究院副院長、首席科學(xué)家唐雄燕應(yīng)邀作了題為《構(gòu)建算力智聯(lián)網(wǎng)AINet,推進算網(wǎng)協(xié)同》的主題報告。在報告中,唐雄燕結(jié)合中國聯(lián)通正在建設(shè)的算力智聯(lián)網(wǎng)AINet,探討了對于智算中心互聯(lián)網(wǎng)的認(rèn)識,并介紹中國聯(lián)通開展的相關(guān)工作。
打造算力智聯(lián)網(wǎng)AINet
智能計算的發(fā)展對帶寬和網(wǎng)絡(luò)質(zhì)量提出了越來越高的要求,主要體現(xiàn)在高通量、低時延、高可靠三個方面。為了更好地支撐智算互聯(lián)的需要,2024年,中國聯(lián)通正式發(fā)布算力智聯(lián)網(wǎng)AINet,通過IP+光融合打造新質(zhì)運力,實現(xiàn)算力服務(wù)與網(wǎng)絡(luò)服務(wù)協(xié)同,構(gòu)建算力互聯(lián)網(wǎng)的新底座。
唐雄燕指出,AINet具備三個重要特征,即“三高”核心能力,分別是高通量、高性能、高智能。其中,高通量主要是針對數(shù)據(jù)傳輸管道,構(gòu)建高通量廣域網(wǎng)能力,提升承載計算任務(wù)的數(shù)量,保障海量計算任務(wù)高效率、差異化、分布式流通,使能算的多;高性能是指要確保智算中心網(wǎng)絡(luò)實現(xiàn)零丟包、無阻塞、低時延運營,保障算得快;高智能則是通過算網(wǎng)大腦實現(xiàn)算力和運力之間協(xié)同編排和調(diào)度,提供算力與連接的融合服務(wù),促進算得優(yōu)。
對于廣域網(wǎng)來說,主要是通過IP+光技術(shù)形成高通量能力,即打造大帶寬、低時延、無損的高通量廣域承載網(wǎng)絡(luò),提供高效靈活算力數(shù)據(jù)傳輸服務(wù)。當(dāng)前,主要依靠建設(shè)超大容量、端到端高速直達(dá)的400G全光網(wǎng)絡(luò),實現(xiàn)高速可靠的海量數(shù)據(jù)傳送。
在智算中心網(wǎng)絡(luò)中,對網(wǎng)絡(luò)性能要求非常高,需使用IB、RoCE等無損電交換技術(shù),同時逐步引入光交換,實現(xiàn)光電融合。此外,智能管控也非常關(guān)鍵,中國聯(lián)通研發(fā)了智算中心管控平臺“智馭”,能夠?qū)崿F(xiàn)算網(wǎng)、光電一體化管理以及智算流量端到端優(yōu)化調(diào)度,并能實時呈現(xiàn)網(wǎng)絡(luò)狀態(tài)。
在算網(wǎng)大腦層面,主要是實現(xiàn)算力和連接的協(xié)同編排和智能調(diào)度,提供“算力+連接”的算網(wǎng)融合服務(wù)。
光網(wǎng)絡(luò)演進支撐智算網(wǎng)絡(luò)發(fā)展
唐雄燕表示,光網(wǎng)絡(luò)是構(gòu)建AINet“三高”能力的關(guān)鍵底座。AINet部署了雙平面立體組網(wǎng)的400G ROADM全光智算網(wǎng)絡(luò),同時部署了智算網(wǎng)關(guān),實現(xiàn)網(wǎng)絡(luò)與智算的高效連接。
對于光網(wǎng)絡(luò)未來如何更好支撐智算網(wǎng)絡(luò),他表示,過去幾十年來,光網(wǎng)絡(luò)的演進方向一直朝著提高速率和增強智能兩個方向發(fā)展。
在智算廣域網(wǎng)方面,光網(wǎng)絡(luò)的速率和容量快速增長是演進特征。骨干光網(wǎng)絡(luò)已邁入單波超400G速率時代,并朝著800G方向發(fā)展。容量提升上,已經(jīng)實現(xiàn)了C6T+L6T寬頻譜系統(tǒng),未來還可通過繼續(xù)擴展頻譜進一步提升容量。同時,AINet是基于G.654.E新型光纖,可更好支撐400G和800G超高速傳輸要求。
在智算中心內(nèi)部,光交換扮演著越來越重要的角色。智算中心內(nèi)互聯(lián)架構(gòu)正在從電交換向光電混合/光交換演進,可以充分發(fā)揮光連接和光交換的大帶寬低時延低功耗等優(yōu)勢。LightCounting數(shù)據(jù)顯示,光交換機OCS出貨量2023年為1萬臺,預(yù)計2029年將超過5萬臺。同時,智算中心內(nèi)新型光模塊不斷涌現(xiàn),LPO、CPO等技術(shù)未來發(fā)展前景良好,尤其是在1.6T之后,光電共封裝對于降低功耗、降低成本重要性凸顯。
另外,在光纖技術(shù)方面,新型光纖空芯光纖近年得到快速發(fā)展。其具有更低時延、更低損耗和更小非線性,尤其是時延能降低30%,對于智算互聯(lián)網(wǎng)來說有著非常重要的價值。例如,微軟去年就宣布要部署15000公里空芯光纖。我國也在積極開展空芯光纖相關(guān)實驗驗證工作。不過,空芯光纖的應(yīng)用仍然面臨著多方面挑戰(zhàn)。
針對三大典型場景開展試驗
唐雄燕介紹,針對入算、訓(xùn)練、推理這三大典型智算業(yè)務(wù)場景,去年中國聯(lián)通開展了一些重要實驗。
一是海量數(shù)據(jù)入算場景,主要提供任務(wù)式數(shù)據(jù)傳遞服務(wù),通過構(gòu)建高通量數(shù)據(jù)網(wǎng)來增大有效帶寬、提高單位帶寬下數(shù)據(jù)傳輸通量,解決低帶寬等不起、高帶寬用不起等問題。去年聯(lián)通開展了從上海到寧夏3000公里長距RDMA流量傳輸驗證,通過無損流控技術(shù)以及端網(wǎng)協(xié)同擁塞控制等技術(shù),端口帶寬利用率從20%提升到90%。
二是存算分離拉遠(yuǎn)訓(xùn)練場景,政務(wù)、醫(yī)療、金融等行業(yè)租用智算中心算力進行大模型訓(xùn)練,因涉及敏感信息,為最大限度地防止數(shù)據(jù)泄露,需要隱私訓(xùn)練數(shù)據(jù)“不落盤”,進行存算分離拉遠(yuǎn)訓(xùn)練。為此,中國聯(lián)通完成業(yè)界首例跨地市(杭州-金華)、存算分離200 km 的AI大模型拉遠(yuǎn)訓(xùn)練,即杭州存儲、金華計算,通過廣域RDMA無損高吞吐傳輸,保障存儲與計算跨廣域模型高效訓(xùn)練,實測訓(xùn)練效率大于95%(與本地數(shù)據(jù)本地訓(xùn)的效率相比損失5%)。
三是跨DC協(xié)同訓(xùn)練場景,超大規(guī)模的訓(xùn)練和算力租賃業(yè)務(wù)帶來智算新需求,需要進行跨DC協(xié)同訓(xùn)練,這也是技術(shù)挑戰(zhàn)最大的應(yīng)用場景,由于跨DC涉及時延問題,往往難以保障參數(shù)面拉遠(yuǎn)下的等效算力。為驗證這個場景,在中國聯(lián)通臨港智算中心采用了光傳送網(wǎng)OTN技術(shù),成功完成AI大模型300公里分布式協(xié)同訓(xùn)練技術(shù)驗證,充分驗證了跨DC協(xié)同訓(xùn)練技術(shù)的商用可行性,實現(xiàn)了300公里跨域協(xié)同訓(xùn)練保持等效算力95%以上,為AI大模型訓(xùn)練模式提供了全新的解決方案。
最后,唐雄燕指出,中國聯(lián)通通過打造算力智聯(lián)網(wǎng)AINet,可為人工智能發(fā)展提供多樣性服務(wù),包括高效入算、靈活聯(lián)算、算力互聯(lián)、數(shù)據(jù)快遞、數(shù)據(jù)高鐵、算網(wǎng)一體服務(wù)等服務(wù)形式,更好地賦能人工智能產(chǎn)業(yè)發(fā)展。
- 中國電信傅志仁:加速邁入以AIDC為核心的云網(wǎng)融合3.0新階段
- 昇思MindSpore核心貢獻者超3.7萬,下載用戶超1100萬
- 2024年裝機量超500萬套:openEuler開創(chuàng)中國開源新模式
- 為世界構(gòu)建新的選擇:華為計算產(chǎn)業(yè)2024年進展顯著
- 利用物聯(lián)網(wǎng)和自動化的力量實現(xiàn)可持續(xù)建筑
- 立訊技術(shù)周小丹:發(fā)力低功耗AI光互聯(lián) 開發(fā)多款LPO/LRO新品
- 騰訊李方超:光電融合創(chuàng)新解決方案全力支持MegaScaleOut
- 新鮮出爐!烽火通信喜獲“FTTR技術(shù)創(chuàng)新獎”
- 喜訊!江波龍榮獲 “智能座艙技術(shù)創(chuàng)新獎”
- 喜訊!佰維存儲特存數(shù)通行業(yè)寬溫SSD客制化SSD寬溫解決方案榮獲“智能模組優(yōu)秀解決方案”
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。