10月17日,美國加強(qiáng)了面向中國市場的AI芯片禁令。其中明確將性能、密度作為出口管制標(biāo)準(zhǔn),將單芯片超過300teraflops算力,以及性能密度超過每平方毫米370 gigaflops的芯片都納入了禁止出口行列。
雖然在這一禁令下,AMD、英特爾等公司提供的高端AI芯片也受到影響。但由于英偉達(dá)在全球AI芯片領(lǐng)域一家獨(dú)大,本次禁令涉及A100、H100等主流AI訓(xùn)練用英偉達(dá)GPU,因此這次的芯片禁令也被稱為“英偉達(dá)禁令”。
消息一出,立刻引起了AI產(chǎn)業(yè)的熱議。但討論大多集中在禁令何時(shí)施行,是否有緩沖地帶,具體涉及哪些GPU型號(hào),禁令期限是多久等。這就導(dǎo)致一個(gè)顯而易見的宏觀背景被忽略了:自貿(mào)易摩擦發(fā)生以來,中美經(jīng)貿(mào)關(guān)系雖然時(shí)有波動(dòng),但面向中國的芯片管控卻始終有增無減。尤其是高端AI芯片禁令,在諸多爭議中依舊被堅(jiān)定推行。
至此,AI行業(yè)似乎已經(jīng)必須形成一個(gè)基本的共識(shí):拋棄幻想,準(zhǔn)備斗爭。
與其斤斤計(jì)較哪些GPU被禁,是否有解禁可能。不如重新審視在芯片鐵幕時(shí)代下,中國AI計(jì)算究竟何去何從?
本文希望從目前的產(chǎn)業(yè)局面出發(fā),和大家一起思考AI計(jì)算的前行之路。
目前的局面
首先我們必須了解一個(gè)問題,那就是為什么這次英偉達(dá)禁令出臺(tái)之后,大眾輿論與AI行業(yè)的反應(yīng)都沒有18、19年芯片封鎖剛開始時(shí)嚴(yán)重。似乎只有在消費(fèi)級(jí)顯卡RTX 4090是否被禁問題上,引發(fā)了游戲玩家和相關(guān)商家的一些爭論。
這背后的宏觀邏輯在于,行業(yè)是非常不愿意看到高端AI芯片被禁售的,但其實(shí)也對(duì)這種局面早有預(yù)料。一方面是美國對(duì)華芯片封鎖推動(dòng)多年,此前英偉達(dá)部分高端GPU已經(jīng)被禁,產(chǎn)業(yè)界的反饋早就從驚愕調(diào)整為了泰然處之。加上ChatGPT爆火之后今年全球高端GPU行情陡然看漲,隨之而來的是美國方面屢次表態(tài)要推動(dòng)對(duì)華整體性的高端AI芯片禁售。虛虛實(shí)實(shí)幾個(gè)月之后,最終落下一錘也不外如是。
為了應(yīng)對(duì)這次可預(yù)見的禁令,同時(shí)也有大模型發(fā)展的客觀推動(dòng),去年年底到今年上半年大量中國科技、金融、汽車等領(lǐng)域的企業(yè)集中囤貨英偉達(dá)高端GPU,已經(jīng)造成了市面上一卡難求的局面。換句話說,對(duì)于很多中國中小型科技企業(yè)、AI創(chuàng)業(yè)公司來說,高端GPU本就買不到,禁售之后并沒有太多改變。
另外一個(gè)真實(shí)情況是,高端AI芯片并非無法國產(chǎn)化。早在18、19年貿(mào)易摩擦開始之后,國內(nèi)AI芯片產(chǎn)業(yè)加速發(fā)展。這就導(dǎo)致在AI訓(xùn)練需求上,英偉達(dá)高端GPU雖然很難被替代,但并非不可替代。
加上AI芯片并不像手機(jī)芯片那樣事關(guān)大眾消費(fèi)者,且華為已經(jīng)在手機(jī)芯片上完成了突破。種種跡象合在一起,導(dǎo)致無論是大眾還是行業(yè),都對(duì)這次禁令產(chǎn)生了一種坦然,甚至有點(diǎn)見怪不怪的心態(tài)。
但必須客觀看到的是,這次禁令絕非對(duì)中國AI行業(yè)沒有傷害。一方面短期內(nèi)更換英偉達(dá)GPU,無論在芯片產(chǎn)能、生態(tài)兼容性等問題上都非常困難。并且禁令還將直接在AI服務(wù)器等領(lǐng)域,給大規(guī)模使用英偉達(dá)產(chǎn)品的廠商造成傷害。
而更關(guān)鍵的問題在于未來,如果禁令長期存在,中國AI計(jì)算將逐漸與全球高端芯片脫鉤,那么可能帶來的長期負(fù)面影響是非常復(fù)雜的,比如說:
1.英偉達(dá)高端GPU代表的AI芯片在更新迭代之后,是否會(huì)造成中國AI算力的發(fā)展脫節(jié)?
2.底層算力出現(xiàn)發(fā)展分歧后,中國AI產(chǎn)業(yè)是否會(huì)在大模型等軟件技術(shù)發(fā)展中掉隊(duì)?
3.本次AI芯片禁令,已經(jīng)呈現(xiàn)出大規(guī)模封鎖的特征。這種科技封鎖真的只會(huì)停留在AI芯片領(lǐng)域嗎?通用算力、存儲(chǔ)、基礎(chǔ)軟件等數(shù)字化基礎(chǔ)能力是否將成為接下來的打擊目標(biāo)?
總而言之,這次的AI芯片禁令,對(duì)中國來說是一次有準(zhǔn)備的博弈,而非一場奇襲。想要成功度過這一關(guān),也需要將手中的每一張牌都打好,打出配合,從而降低傷害烈度,提升長期發(fā)展的勝率。
而就目前來看,中國AI計(jì)算有三項(xiàng)必須同時(shí)發(fā)力的“突圍方案”。
方案1:用好“買家”身份
有個(gè)簡單的道理,商業(yè)市場的行為邏輯是由供需決定的。但在以芯片為代表的中美科技貿(mào)易中,我們經(jīng)常會(huì)陷入一個(gè)思維誤區(qū):認(rèn)為絕大部分游戲規(guī)則是由美國政府和企業(yè)制定的,他們想賣我們就買,他們不想買我們就無奈。
作為全球芯片市場的最大“買家”,中國企業(yè)卻沒有話語權(quán),這是非?;闹嚨?。
事實(shí)上,針對(duì)中國市場的AI芯片禁令,最直接傷害的就是以英偉達(dá)為代表的美國科技巨頭。目前,英偉達(dá)AI芯片方面最大市場需求來自中國。此前英偉達(dá)CEO黃仁勛就明確表示,“如果被剝奪了中國市場,我們是沒有應(yīng)急措施的,世界上沒有另一個(gè)中國”。
在這種情況下,我們能看到追求商業(yè)利益的美國科技公司,與追求政治利益的美國政府之間有著鮮明的矛盾。美國科技企業(yè)總是想方設(shè)法尋求反對(duì)禁令和繞過禁令,比如英偉達(dá)就從去年開始推出了應(yīng)對(duì)禁運(yùn)政策的中國特供版GPU。
中國市場,消化了美國科技企業(yè)約三分之一的產(chǎn)能,二者之間的供需紐帶是無法長期割裂的。面對(duì)美國愈發(fā)明顯的整體性科技封禁,中國市場也應(yīng)該積極用好“買家”身份,讓自身的行為更具鮮明立場與可預(yù)測性。
避免造成一種“賣了就歡迎,不賣只能無奈”的表現(xiàn)和印象。
“買家身份”應(yīng)該是一種有立場、有力量且會(huì)憤怒的身份。
方案2:以云代卡,算力集中
在可見的較長時(shí)間里,美國對(duì)中國的AI芯片封禁恐怕都只會(huì)加強(qiáng),而這個(gè)時(shí)機(jī)恰好對(duì)應(yīng)上AI大模型發(fā)展的關(guān)鍵階段。很多業(yè)內(nèi)人士認(rèn)為,大模型發(fā)展雖快,但沒有呈現(xiàn)出此前其他科技風(fēng)口的迅猛局面,投資缺錢,計(jì)算缺卡是主要原因。
那么如何解決中國AI產(chǎn)業(yè)在禁令之下的算力缺口問題呢?首先的應(yīng)急方案就是企業(yè)加大云端AI算力的配置和投入,推進(jìn)以云代卡。
事實(shí)上,在高端AI芯片可能被禁的大趨勢下,中國幾大公有云廠商都做出了加強(qiáng)囤積英偉達(dá)高端GPU的動(dòng)作。這一方面是因?yàn)樵茝S商自身要加大大模型投入,打開MaaS市場,所以對(duì)AI算力有直接需求。另一方面也是因?yàn)镚PU轉(zhuǎn)化為云資源池之后可以長期復(fù)用,對(duì)于云廠商來說是一個(gè)進(jìn)可攻,退可守的局面。因此,今年上半年一度出現(xiàn)了市面上高端AI芯片全都流向云廠商,中小企業(yè)一卡難求的局面。
客觀來看,這種高端AI芯片集中向云的舉動(dòng),對(duì)整個(gè)中國市場統(tǒng)籌應(yīng)對(duì)AI芯片禁令是有利的,并且也符合東數(shù)西算的戰(zhàn)略思路。
另一個(gè)利好云端AI算力的趨勢在于,隨著大模型參數(shù)和使用數(shù)據(jù)量的不斷加大。本地化的卡池訓(xùn)練已經(jīng)愈發(fā)吃緊。必須在云端發(fā)生的千卡、萬卡訓(xùn)練成為未來主要的發(fā)展方向,因此企業(yè)用戶天然會(huì)更積極走向云端。
同時(shí),云端AI算力也不會(huì)僅僅停留在囤積英偉達(dá)GPU的層面。接下來,國產(chǎn)的自主AI算力駛?cè)朐贫耸谴髣菟?。在相關(guān)政策的推動(dòng)下,云廠商正在加大自主AI芯片的采購力度。根據(jù)IDC數(shù)據(jù),2023年上半年中國AI服務(wù)器已經(jīng)使用了50萬塊自主開發(fā)的AI加速器芯片。在自主AI算力的服務(wù)化方面,華為云已經(jīng)推出了昇騰AI云服務(wù)。云端化與自主化結(jié)合的AI算力,將在AI芯片禁令背景下得到極大發(fā)展。
加上近些年在東數(shù)西算大背景下,各地陸續(xù)建立了大量采用自主AI算力的AI計(jì)算中心,整體來看中國的云端AI算力是供給穩(wěn)定、保障可靠的。
而很多企業(yè)依舊傾向于采購本地AI算力。這一方面是因?yàn)橛ミ_(dá)GPU市場緊缺,保值性特別好,甚至能作為企業(yè)的核心資產(chǎn)。另一方面是因?yàn)樵贫薃I算力往往會(huì)有排隊(duì)、宕機(jī)、軟件服務(wù)缺失等問題。
如何進(jìn)一步提高開發(fā)者的云端AI算力使用體驗(yàn),是公有云廠商接下來需要發(fā)力的方向。
方案3:讓國產(chǎn)AI算力爆發(fā)式成長
面對(duì)新一輪AI芯片禁令,中國AI產(chǎn)業(yè)最大的底氣是什么?是多年之后的習(xí)以為常,還是大量屯卡之后的家有余糧?都不是。最關(guān)鍵的節(jié)點(diǎn)在于經(jīng)過多年發(fā)展,中國AI芯片產(chǎn)業(yè)已經(jīng)得到了巨大發(fā)展。英偉達(dá)的高端GPU確實(shí)依舊重要,但已經(jīng)不是毫無替代選項(xiàng)可言。
根據(jù)IDC此前發(fā)布的數(shù)據(jù),2022年中國AI加速卡出貨量約為109萬張,其中英偉達(dá)市場份額達(dá)到了85%,華為昇騰實(shí)市場占有率10%,百度昆侖為2%,寒武紀(jì)和燧原科技均為1%。
從中可以看出,國產(chǎn)AI算力已經(jīng)實(shí)現(xiàn)了一定程度的市場占比,而不僅僅是概念與理論中的“紙上談兵”。同時(shí)也應(yīng)該看到,國產(chǎn)AI芯片在核心性能、軟件生態(tài)以及出貨能力上依舊不理想,還有很長的路要走。在英偉達(dá)禁令的客觀條件倒逼下,國產(chǎn)AI算力必須在短期內(nèi)跨越這些困難,加速自身的成長與成熟周期。
為了實(shí)現(xiàn)這個(gè)目標(biāo),有幾件事非常重要:
1.形成產(chǎn)業(yè)共識(shí),避免概念混淆。
提起AI芯片,我們經(jīng)常會(huì)說它有非常多的實(shí)現(xiàn)方式,有很多自主品牌參與這個(gè)市場,看上去一片繁榮。比如AI芯片有GPU、FPGA、ASIC、存算一體和類腦芯片等,國產(chǎn)AI加速芯片廠商有阿里、百度、華為、寒武紀(jì)、海光信息、燧原科技、天數(shù)智芯、壁仞科技、摩爾線程、龍芯中科等。
這種“繁榮”的表述,不僅在大眾輿論和投資市場上具有迷惑性,還經(jīng)常出現(xiàn)在一些行業(yè)報(bào)告與政策分析當(dāng)中。但其中蘊(yùn)藏的問題在于,普遍過分拓展了AI芯片的定義。比如說,類腦芯片在可見的未來中都僅僅是技術(shù)暢想,如果每次討論國產(chǎn)AI芯片都把類腦加上,那只會(huì)浪費(fèi)時(shí)間,分散精力。再比如,有些AI芯片廠商只能做自用芯片,無法面向市場出貨。有些廠商目前還不具備商業(yè)化能力,處在早期建設(shè)階段,他們短期內(nèi)對(duì)于AI計(jì)算自主化的貢獻(xiàn)也就非常之小。
為了應(yīng)對(duì)英偉達(dá)高端GPU禁售問題,我們需要把目光集中在可行、有效的GPU替代品上,而不是進(jìn)行過多聯(lián)想和發(fā)散。只有形成了這一產(chǎn)業(yè)共識(shí),才能聚集力量解決問題。
2.走向規(guī)?;逃?,避免PPT造芯。
事實(shí)上,無論從AI加速芯片還是服務(wù)器整機(jī)來看,國內(nèi)目前能夠出貨的AI芯片廠商都寥寥無幾。主要集中在華為、百度兩家,燧原科技、海光信息也有一定的出貨。而大量半導(dǎo)體廠商與AI企業(yè),更多還停留在打造芯片的計(jì)劃與愿景上。這就導(dǎo)致大量受到政策支持與投資市場期待的國產(chǎn)AI芯片停滯不前,甚至有停留在這一階段享受金融市場紅利的嫌疑。
接下來的產(chǎn)業(yè)導(dǎo)向,應(yīng)該從AI芯片的立項(xiàng)走向出貨,幫助AI芯片廠商獲得直接的商業(yè)回饋,產(chǎn)品與產(chǎn)能接受市場檢驗(yàn),逐步塑造正向的現(xiàn)金流。
3.加強(qiáng)軟件生態(tài),強(qiáng)化遷移能力。
英偉達(dá)GPU之所以重要,不僅在于硬件性能,更在以CUDA、PyTorch為核心的軟件生態(tài)能力,因此發(fā)展國產(chǎn)AI芯片絕不能低估軟件的能力。在強(qiáng)化自主軟件生態(tài)建設(shè)的同時(shí),也要重視基于英偉達(dá)生態(tài)打造AI模型的遷移能力與遷移成本。
為此,已經(jīng)有大量廠商進(jìn)行了探索,比如海光信息的DCU,就在生態(tài)、編程環(huán)境等方面與CUDA高度相似,CUDA用戶可以以較低代價(jià)快速遷移至海光的ROCm平臺(tái)。而在此前,PyTorch2.1 版本宣布支持華為昇騰??梢妵a(chǎn)AI芯片已經(jīng)具備了一定的規(guī)?;绊懥Γ梢愿嗳谌肴蜍浖鷳B(tài)當(dāng)中。
未來想要實(shí)現(xiàn)國產(chǎn)AI計(jì)算的爆發(fā),是無法離開國產(chǎn)AI基礎(chǔ)軟件生態(tài)爆發(fā)的。
4、加大對(duì)“主品牌”支持,形成規(guī)模化效應(yīng)。
對(duì)于美國AI芯片,除了英偉達(dá)GPU,你還知道哪些?這個(gè)問題即使是問一些AI開發(fā)者,答案也很大程度是不清楚,或者沒試過。從中可見,AI計(jì)算就像通用計(jì)算、圖形計(jì)算一樣,極大概率是會(huì)最終出現(xiàn)一到兩個(gè)“主品牌”的。這屬于客觀的市場規(guī)律,沒有必要以揠苗助長的方式實(shí)現(xiàn)“百花齊放”的局面。
甚至就目前中國AI計(jì)算必須加速成熟,完成自主化替代的目標(biāo)來說,盡快實(shí)現(xiàn)一超多強(qiáng)的局面是件好事。這可以避免生態(tài)割裂,避免產(chǎn)業(yè)在搖擺形成大量IT投資浪費(fèi)。這個(gè)過程理應(yīng)交給市場選擇,慢慢成型。但在芯片禁令的大背景下,國產(chǎn)AI計(jì)算崛起已經(jīng)時(shí)不我待,與其讓100種AI芯片慢慢成熟,慢慢洗牌,比如加速形成“主品牌”快速替代的局面。
而從目前局面看,昇騰是最有可能成為國產(chǎn)AI算力主品牌的一支力量。科大訊飛創(chuàng)始人、董事長劉慶峰此前表示,華為GPU已經(jīng)對(duì)標(biāo)英偉達(dá)A100。根據(jù)數(shù)據(jù)顯示,昇騰310整數(shù)精度算力達(dá)到了16TOPS,昇騰910整數(shù)精度算力達(dá)到640TOPS。這意味著昇騰910性能已經(jīng)接近英偉達(dá)A100。
同時(shí),昇騰也是目前唯一穩(wěn)定占據(jù)市場份額的國產(chǎn)AI算力,并且在軟件上孵化了類似英偉達(dá)CUDA的異構(gòu)計(jì)算架構(gòu)CANN和AI計(jì)算框架MindSpore。在核心性能、軟件生態(tài)與市場占有率三項(xiàng)指標(biāo)來看,昇騰都已經(jīng)具備了可以加快成長,實(shí)現(xiàn)AI算力大規(guī)模國產(chǎn)化替代的可行性。
規(guī)范行業(yè)標(biāo)準(zhǔn),強(qiáng)化軟件建設(shè),提高自主品牌支持,是短期內(nèi)推動(dòng)國產(chǎn)AI算力快速成長的主要途徑。
英偉達(dá)禁令,是一個(gè)中國AI行業(yè)普遍不愿意看到,盡量避免,甚至到今天也有些諱莫如深的問題。但形勢比人強(qiáng),在不斷加速的逆全球化進(jìn)程與AI競賽中,類似禁令未來大概率只多不少。
逃避、迂回、噤若寒蟬,都無法解決問題,只有坦然應(yīng)對(duì),奮力自強(qiáng),才能從根本上解決受制于人的問題。
禁令之下,中國AI計(jì)算何去何從?
答案是我們已別無選擇,所以要給世界第二個(gè)選擇。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 微信又“爆改”:微信朋友圈實(shí)況照片不再默認(rèn)播放,你滿意嗎?
- 2024年全球智能手機(jī)市場復(fù)蘇:蘋果引領(lǐng),三星和小米緊隨其后
- AI搜索爆了,小紅書、百度都急了
- 在小紅書冒充TikTok難民的殺豬盤,被反詐中心盯上了
- 雙面劉雯:靠“正義”引流,割韭菜發(fā)財(cái)
- TikTok美國熬過生死局,玩家多平臺(tái)布局避險(xiǎn)
- 輸血、輸血、輸血!微創(chuàng)機(jī)器人終于學(xué)會(huì)了造血?
- 2025電商年貨大戰(zhàn):安靜得可怕?
- 華為小米vivo向上,蘋果榮耀OPPO向下
- 三個(gè)支撐點(diǎn),春節(jié)旅游“新年俗”正在成型?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。