萬(wàn)卡時(shí)代:國(guó)產(chǎn)智算生態(tài)如何解鎖高端芯片束縛

年初,規(guī)模15000卡的國(guó)產(chǎn)單池萬(wàn)卡液冷集群落地上海臨港;

4月初,"萬(wàn)卡級(jí)別“的青海三江源國(guó)家綠色智算算力調(diào)度平臺(tái)立項(xiàng);

中國(guó)電信京津冀國(guó)產(chǎn)萬(wàn)卡液冷算力池將于6月份建成;

中國(guó)移動(dòng)董事長(zhǎng):打造一批萬(wàn)卡級(jí)智算集群……

隨著AI技術(shù)的飛速發(fā)展,特別是AI大模型對(duì)算力的需求快速增長(zhǎng),算力集群的規(guī)模正以前所未有的速度擴(kuò)張,從千卡到萬(wàn)卡,再到未來(lái)的十萬(wàn)卡、百萬(wàn)卡,這一趨勢(shì)已成為智算產(chǎn)業(yè)發(fā)展的必然。

據(jù)《2023年中國(guó)智能算力行業(yè)發(fā)展白皮書(shū)》報(bào)告顯示,AI大模型相關(guān)行業(yè)占中國(guó)智能算力總需求的58.8%。近日,華為副總裁周躍峰博士在一次會(huì)議上表示,AI大模型集群規(guī)模已邁入萬(wàn)卡、十萬(wàn)卡時(shí)代。

然而,這一進(jìn)步的背后,國(guó)產(chǎn)智算產(chǎn)業(yè)卻面臨著高端AI芯片獲取的難題。在中美科技對(duì)抗的國(guó)際大背景下,如何突破高端芯片的束縛,成為國(guó)產(chǎn)智算產(chǎn)業(yè)必須深入探討的緊迫話(huà)題。

算力集群擴(kuò)張的必然與挑戰(zhàn)

算力集群的擴(kuò)張并非簡(jiǎn)單的數(shù)量堆砌,而是AI技術(shù)進(jìn)步的必然結(jié)果。這一擴(kuò)張趨勢(shì)在國(guó)際科技巨頭的行動(dòng)中得到印證,如微軟計(jì)劃為GPT-6訓(xùn)練規(guī)劃一個(gè)包含10萬(wàn)張H100的算力集群。

然而,芯片數(shù)量的增加并非與性能呈線性關(guān)系,而是帶來(lái)了更大的不穩(wěn)定性和協(xié)作難度,尤其是在分布式計(jì)算系統(tǒng)的并行加速比優(yōu)化方面。特別是在當(dāng)前的產(chǎn)業(yè)環(huán)境下,國(guó)內(nèi)的AI芯片種類(lèi)繁雜、架構(gòu)不一,不同類(lèi)型芯片和算力設(shè)備之間的協(xié)作難度更上一層。

圖片1.png

國(guó)產(chǎn)智算產(chǎn)業(yè)面臨著雙重挑戰(zhàn)

在這一背景下,國(guó)產(chǎn)智算產(chǎn)業(yè)面臨著雙重挑戰(zhàn):一方面,需要提升芯片的算力和效率,以支撐穩(wěn)定高效的訓(xùn)練;另一方面,如何更好地解決多元異構(gòu)算力的協(xié)作,實(shí)現(xiàn)不同類(lèi)型、不同版本的異構(gòu)集群的高效聯(lián)合。這不僅是技術(shù)層面的挑戰(zhàn),更是對(duì)產(chǎn)業(yè)生態(tài)的一次大考。

國(guó)產(chǎn)智算的生態(tài)構(gòu)建與實(shí)踐

面對(duì)挑戰(zhàn),國(guó)產(chǎn)智算產(chǎn)業(yè)并非無(wú)計(jì)可施。技術(shù)創(chuàng)新、產(chǎn)業(yè)政策支持、市場(chǎng)需求驅(qū)動(dòng)、自主研發(fā)、國(guó)際合作以及人才培養(yǎng)等多方面的努力,正在逐步推動(dòng)國(guó)產(chǎn)芯片技術(shù)的不斷進(jìn)步。然而,要真正解鎖AI算力問(wèn)題,關(guān)鍵在于構(gòu)建一個(gè)良好的產(chǎn)業(yè)生態(tài)。

鄭緯民院士曾指出:“目前國(guó)內(nèi)已經(jīng)有30多家公司推出了國(guó)產(chǎn)AI芯片,但用戶(hù)不太喜歡用,核心問(wèn)題就是生態(tài)不好。”而國(guó)內(nèi)當(dāng)前無(wú)論是在底層的基礎(chǔ)設(shè)施建設(shè),還是軟件層面的編譯、加速等等方面,都缺乏一個(gè)可以支撐智算產(chǎn)業(yè)發(fā)展的完整生態(tài)體系。

在這樣的認(rèn)識(shí)下,國(guó)產(chǎn)智算廠商開(kāi)始強(qiáng)化AI生態(tài)賦能。例如,百度的文心4.0通過(guò)百度智能云的萬(wàn)卡集群進(jìn)行訓(xùn)練,支持模型的穩(wěn)定高效迭代進(jìn)化。百度智能云上萬(wàn)卡訓(xùn)練集群的加速比和有效訓(xùn)練時(shí)間,達(dá)到95%以上。

中國(guó)移動(dòng)則發(fā)布了《面向超萬(wàn)卡集群的新型智算技術(shù)白皮書(shū)》,其中強(qiáng)調(diào)了實(shí)現(xiàn)超萬(wàn)卡集群中的高效訓(xùn)練和長(zhǎng)期穩(wěn)定性所面臨的挑戰(zhàn),如算力發(fā)揮、網(wǎng)絡(luò)穩(wěn)定性、故障排查修復(fù)等。白皮書(shū)提出了一系列創(chuàng)新的設(shè)計(jì)原則和關(guān)鍵技術(shù),旨在推動(dòng)智算中心向更高效、穩(wěn)定和綠色的方向發(fā)展。

此外,寧暢提出的“全局智算”戰(zhàn)略、中科曙光的“立體計(jì)算”體系、浪潮信息發(fā)布的“元腦企智(EPAI)”平臺(tái)等,都是對(duì)軟件生態(tài)的有益探索。通過(guò)“軟硬兼施”的均衡能力,國(guó)產(chǎn)智算產(chǎn)業(yè)正在逐步構(gòu)建起一個(gè)更加完善的產(chǎn)業(yè)生態(tài)。

國(guó)產(chǎn)智算的機(jī)遇與展望

萬(wàn)卡時(shí)代的來(lái)臨,為國(guó)產(chǎn)智算產(chǎn)業(yè)帶來(lái)了前所未有的機(jī)遇。隨著AI技術(shù)的深入應(yīng)用,每個(gè)行業(yè)、每家公司都可能訓(xùn)練自己的大模型,帶來(lái)充沛、高效、穩(wěn)定的AI算力需求。在這一過(guò)程中,十萬(wàn)百萬(wàn)級(jí)集群、多元異構(gòu)的算卡,將以高效一致的步伐進(jìn)行協(xié)作,這將成為中國(guó)智算行業(yè)的關(guān)鍵挑戰(zhàn)。

然而,挑戰(zhàn)與機(jī)遇總是并存的。通過(guò)技術(shù)創(chuàng)新和產(chǎn)業(yè)生態(tài)的構(gòu)建,國(guó)產(chǎn)智算產(chǎn)業(yè)有望在萬(wàn)卡時(shí)代實(shí)現(xiàn)跨越式發(fā)展,迎來(lái)更加廣闊的發(fā)展前景。據(jù)科智咨詢(xún)最新發(fā)布《2023-2024年中國(guó)IDC行業(yè)發(fā)展研究報(bào)告》顯示,2023年中國(guó)傳統(tǒng)IDC業(yè)務(wù)市場(chǎng)規(guī)模為1456.4億元,同比增長(zhǎng)6.4%。伴隨人工智能帶動(dòng)的智算需求爆發(fā),預(yù)計(jì)到2028年,相關(guān)市場(chǎng)規(guī)模將超2500億元。

圖片2.png

2019-2028中國(guó)傳統(tǒng)IDC業(yè)務(wù)市場(chǎng)規(guī)模

未來(lái),國(guó)產(chǎn)智算產(chǎn)業(yè)需要繼續(xù)深化技術(shù)創(chuàng)新,加強(qiáng)產(chǎn)業(yè)政策支持,激發(fā)市場(chǎng)需求驅(qū)動(dòng),推動(dòng)自主研發(fā),拓展國(guó)際合作,重視人才培養(yǎng),特別是在軟件生態(tài)建設(shè)上下大力氣。只有這樣,國(guó)產(chǎn)智算產(chǎn)業(yè)才能在萬(wàn)卡時(shí)代解鎖高端芯片的束縛,實(shí)現(xiàn)跨越式發(fā)展,迎來(lái)更加廣闊的發(fā)展前景。

為進(jìn)一步推動(dòng)智算產(chǎn)業(yè)的生態(tài)構(gòu)建與合作,中國(guó)IDC圈將于2024年6月18日在深圳舉辦“中國(guó)智算生態(tài)發(fā)展大會(huì)”,大會(huì)將邀請(qǐng)?jiān)菏繉?zhuān)家、政府主管部門(mén)、大模型企業(yè)、智能算力供應(yīng)商、云廠商、電信運(yùn)營(yíng)商以及芯片企業(yè)、服務(wù)器企業(yè)的專(zhuān)業(yè)人士參與,共促產(chǎn)業(yè)鏈上下游交流與共贏。大會(huì)官網(wǎng)地址:http://www.idcquan.com/Special/2024CICEDC/

圖片3.jpg

中國(guó)智算生態(tài)發(fā)展大會(huì)

掃描下方二維碼可報(bào)名,關(guān)于大會(huì)的更多信息,請(qǐng)聯(lián)系:李女士13693541767

圖片4.png

掃碼報(bào)名

近期會(huì)議

中國(guó)智算生態(tài)發(fā)展大會(huì)

時(shí)間:6月18日

地點(diǎn):深圳

中國(guó)智算綠色科技大會(huì)

時(shí)間:7月18日

地點(diǎn):上海

中國(guó)智算與產(chǎn)業(yè)服務(wù)峰會(huì)

時(shí)間:9月5日

地點(diǎn):北京

合作聯(lián)系:李女士13693541767

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-06-04
萬(wàn)卡時(shí)代:國(guó)產(chǎn)智算生態(tài)如何解鎖高端芯片束縛
隨著AI技術(shù)的飛速發(fā)展,特別是AI大模型對(duì)算力的需求快速增長(zhǎng),算力集群的規(guī)模正以前所未有的速度擴(kuò)張,從千卡到萬(wàn)卡,再到未來(lái)的十萬(wàn)卡、百萬(wàn)卡,這一趨勢(shì)已成為智算產(chǎn)業(yè)發(fā)展的必然。

長(zhǎng)按掃碼 閱讀全文