科技云報(bào)道原創(chuàng)。
在19世紀(jì)的淘金熱中,最賺錢(qián)的并不是挖金礦的,反而是那些賣鏟子、賣牛仔褲的人。正如賣鏟人在淘金熱中成為最大贏家,在當(dāng)今AIGC時(shí)代,AI Infra也扮演著類似的角色。
如果用云計(jì)算三層構(gòu)架做類比,AI Infra與PaaS層級(jí)相似,是鏈接算力和應(yīng)用的中間層基礎(chǔ)設(shè)施,包括硬件、軟件、工具鏈和優(yōu)化方法等,為大模型應(yīng)用開(kāi)發(fā)提供一站式模型算力部署和開(kāi)發(fā)工具平臺(tái)。算力、算法、數(shù)據(jù)可以看作IaaS層,各種開(kāi)源和閉源模型則是SaaS在大模型時(shí)代的新演變,即MaaS。
隨著大模型應(yīng)用落地的進(jìn)程不斷加速,AI Infra的價(jià)值潛力被進(jìn)一步釋放。中金數(shù)據(jù)預(yù)測(cè),目前,AI Infra產(chǎn)業(yè)處于高速增長(zhǎng)的發(fā)展早期,未來(lái)3-5年內(nèi)各細(xì)分賽道空間或保持30%的高速增長(zhǎng)。
當(dāng)大模型進(jìn)入大規(guī)模應(yīng)用落地時(shí)期,提供大模型訓(xùn)練、部署和應(yīng)用時(shí)所需的基礎(chǔ)設(shè)施成為關(guān)鍵一環(huán),AI Infra成為大模型應(yīng)用爆發(fā)背后“掘金賣鏟”的最佳生意。
中臺(tái)模式解鎖AI生產(chǎn)力
從ICT產(chǎn)業(yè)的演進(jìn)軌跡來(lái)看,三層架構(gòu)似乎是宿命般的終極圖景。在傳統(tǒng)的本地部署階段,操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件等基礎(chǔ)軟件通過(guò)控制硬件交互、存儲(chǔ)管理數(shù)據(jù)、網(wǎng)絡(luò)通信調(diào)度等功能,解決底層硬件系統(tǒng)的復(fù)雜性難題,讓上層應(yīng)用開(kāi)發(fā)者能專注于業(yè)務(wù)邏輯進(jìn)行創(chuàng)新。
在云定義一切的時(shí)代,也形成了IaaS、PaaS、SaaS協(xié)同進(jìn)化的經(jīng)典架構(gòu),其中PaaS層提供應(yīng)用開(kāi)發(fā)環(huán)境和數(shù)據(jù)分析管理等服務(wù),為云計(jì)算加速滲透奠定了堅(jiān)實(shí)基礎(chǔ)。
經(jīng)歷了漫長(zhǎng)的蟄伏期后,AIGC按下了人工智能通用化進(jìn)程的快進(jìn)鍵,整個(gè)產(chǎn)業(yè)在狂飆突進(jìn)的氛圍中急速重構(gòu)。算力與應(yīng)用無(wú)疑是最耀眼的主角,但二者之間的鴻溝堪比天塹,大模型面臨“懸浮”或“踏空”的風(fēng)險(xiǎn)。
從這個(gè)意義上講,AI Infra猶如一座橋,可以承擔(dān)類似基礎(chǔ)軟件或PaaS曾經(jīng)扮演的角色——通過(guò)構(gòu)建新型的軟件棧及綜合服務(wù),賦能算力挖潛、模型優(yōu)化和應(yīng)用開(kāi)發(fā),成為連接算力與應(yīng)用的中堅(jiān)力量。
AI Infra涵蓋一切跟開(kāi)發(fā)部署相關(guān)的工具和流程。隨著云計(jì)算的不斷發(fā)展,又逐漸衍生出了DataOps、ModelOps、DevOps、MLOps、LLMOps等一些XOps的概念。
從宏觀的角度來(lái)看,所有XOps本質(zhì)上是為了開(kāi)發(fā)部署生命周期的提效。比如DataOps是為IaaS層的存儲(chǔ)和PaaS層的數(shù)據(jù)處理提效的,DevOps、MLOps實(shí)際上是為PaaS層開(kāi)發(fā)部署提效的,LLMOps是為MaaS層提效的。
事實(shí)上,在AIGC風(fēng)起云涌之前,關(guān)于AI中臺(tái)的理論與實(shí)踐就已如火如荼地展開(kāi)。但當(dāng)時(shí)的AI中臺(tái)更像是“救火隊(duì)員”,功能比較龐雜,干了不少“臟活”、“累活”,卻難以獲得上下游的認(rèn)可。
大模型為AI平臺(tái)化搭建起更寬廣的舞臺(tái),也讓AI Infra“掘金賣鏟”的邏輯更具確定性,進(jìn)而贏得可觀的發(fā)展空間。相關(guān)機(jī)構(gòu)預(yù)測(cè)顯示,未來(lái)3~5年AI Infra產(chǎn)業(yè)將保持30%+的高速增長(zhǎng)。
就像“三明治”的兩片面包間可以有無(wú)數(shù)種夾層選擇,身處算力與應(yīng)用之間的AI Infra同樣不拘一格。從廣義上看,AI Infra涵蓋人工智能基礎(chǔ)框架技術(shù),涉及大模型訓(xùn)練、部署領(lǐng)域的各種底層設(shè)施;狹義而言,基礎(chǔ)軟件棧是AI Infra的核心組成部分,優(yōu)化算力算法、促進(jìn)應(yīng)用落地是其主要目標(biāo)。
AI Infra定義的相對(duì)開(kāi)放為不同的路徑探索提供了更多可能?;诟髯缘馁Y源稟賦與市場(chǎng)定位,業(yè)界的資深廠商與新興玩家正在積極拓展AI Infra的疆界,不少做法值得借鑒。
AI Infra將是下一個(gè)應(yīng)用熱點(diǎn)?
相比模型價(jià)值,卷AI應(yīng)用成為行業(yè)共識(shí)。李彥宏堅(jiān)信,基礎(chǔ)模型之上將誕生數(shù)以百萬(wàn)計(jì)的應(yīng)用,它們對(duì)于現(xiàn)有業(yè)態(tài)的改造作用,比從0到1的顛覆作用更大。
如今AI應(yīng)用的供給在不斷增加,IDC在年初時(shí)預(yù)測(cè),2024年全球?qū)⒂楷F(xiàn)出超過(guò)5億個(gè)新應(yīng)用,這相當(dāng)于過(guò)去40年間出現(xiàn)的應(yīng)用數(shù)總和。
最近,視頻生成類模型產(chǎn)品扎堆出現(xiàn),快手的可靈、字節(jié)跳動(dòng)的即夢(mèng)、商湯的Vimi集體亮相,此外還有AI搜索產(chǎn)品、AI陪伴類產(chǎn)品等層出不窮。
大模型應(yīng)用爆發(fā)趨勢(shì)已然確定,根據(jù)InfoQ研究中心數(shù)據(jù),2030年AGI應(yīng)用市場(chǎng)規(guī)模將達(dá)4543.6億元,模型應(yīng)用層的巨大機(jī)會(huì)已經(jīng)吸引了幾乎各行各業(yè)的參與。
而在大模型應(yīng)用之下,AI Infra成為其爆發(fā)的隱藏推手。
目前,大模型產(chǎn)業(yè)鏈大致可以分為數(shù)據(jù)準(zhǔn)備、模型構(gòu)建、模型產(chǎn)品三個(gè)層次。在國(guó)外,AI大模型的產(chǎn)業(yè)鏈比較成熟,形成了數(shù)量眾多的AI Infra(架構(gòu))公司,但這一塊市場(chǎng)在國(guó)內(nèi)還相對(duì)空白。
在充滿不確定性的道路上,率先找到清晰的賽道,快速建立顯著的里程碑尤為重要。AI Infra市場(chǎng)尚處于混沌期,每個(gè)科技巨頭都希望在自己的生態(tài)中形成閉環(huán)。
在國(guó)內(nèi),巨頭們都有一套自己的訓(xùn)練架構(gòu)。
比如,華為的模型采用的是三層架構(gòu),其底層屬于通識(shí)性大模型,具備超強(qiáng)的魯棒性的泛化性,在這之上是行業(yè)大模型和針對(duì)具體場(chǎng)景和工作流程的部署模型。這種構(gòu)架的好處是,當(dāng)訓(xùn)練好的大模型部署到垂類行業(yè)時(shí),可以不必再重復(fù)訓(xùn)練,成本僅是上一層的5%~7%。
阿里則是為AI打造了一個(gè)統(tǒng)一底座,無(wú)論是CV、NLP、還是文生圖大模型都可以放進(jìn)去這個(gè)統(tǒng)一底座中訓(xùn)練,阿里訓(xùn)練M6大模型需要的能耗僅是GPT-3的1%。
百度和騰訊也有相應(yīng)的布局,百度擁有覆蓋超50億實(shí)體的中文知識(shí)圖譜,騰訊的熱啟動(dòng)課程學(xué)習(xí)可以將萬(wàn)億大模型的訓(xùn)練成本降低到冷啟動(dòng)的八分之一。
整體來(lái)看,各個(gè)大廠之間的側(cè)重點(diǎn)雖然有所不同,但主要特點(diǎn)就是降本增效,而能夠?qū)崿F(xiàn)這一點(diǎn),很大程度上就是受益于“一手包辦”的閉環(huán)訓(xùn)練體系。
反觀國(guó)外,成熟的AI產(chǎn)業(yè)鏈形成了數(shù)量眾多的AI Infra公司。
如果把開(kāi)發(fā)AI應(yīng)用看成建房子,那么AI Infra就是提供水泥鋼筋的施工隊(duì)。AI Infra施工隊(duì)的價(jià)值點(diǎn)在于它是一個(gè)集成平臺(tái),將下層的算力芯片層與上層的AI應(yīng)用層打通,讓開(kāi)發(fā)者實(shí)現(xiàn)一鍵調(diào)用,并且實(shí)現(xiàn)降低算力成本、提升開(kāi)發(fā)效率并且保持模型優(yōu)秀性能的效果。
讓?xiě)?yīng)用更簡(jiǎn)單,讓AI落地更便捷,是AI Infra的使命??梢哉f(shuō),AI應(yīng)用的市場(chǎng)有多大,AI Infra的機(jī)會(huì)就有多大。
AI Infra公司有的專門(mén)做數(shù)據(jù)標(biāo)注、做數(shù)據(jù)質(zhì)量、或者模型架構(gòu)等。這些企業(yè)的專業(yè)性,能夠讓他們?cè)谀骋粋€(gè)單一環(huán)節(jié)的效率、成本、質(zhì)量上都要比大廠親自下場(chǎng)做得更好。
比如,數(shù)據(jù)質(zhì)量公司Anomalo就是Google Cloud和Notion的供應(yīng)商,它可以通過(guò)ML自動(dòng)評(píng)估和通用化數(shù)據(jù)質(zhì)量檢測(cè)能力,來(lái)實(shí)現(xiàn)數(shù)據(jù)深度觀察和數(shù)據(jù)質(zhì)量檢測(cè)。
這些公司就像汽車行業(yè)的Tier 1,通過(guò)專業(yè)的分工,能夠讓大模型企業(yè)不必重復(fù)造輪子,而只需要通過(guò)整合供應(yīng)商資源,就能快速地搭建起自己模型構(gòu)架,從而降低成本。
但國(guó)內(nèi)在這一方面并不成熟,原因在于:一方面國(guó)內(nèi)大模型的主要玩家都是大廠,他們都有一套自己的訓(xùn)練體系,外部供應(yīng)商幾乎沒(méi)有機(jī)會(huì)進(jìn)入;另一方面,國(guó)內(nèi)也缺乏足夠龐大的創(chuàng)業(yè)生態(tài)和中小企業(yè),AI供應(yīng)商也很難在大廠之外找到生存的空間。
以谷歌為例,谷歌愿意將自己訓(xùn)練的數(shù)據(jù)結(jié)果分享給它的數(shù)據(jù)質(zhì)量供應(yīng)商,幫助供應(yīng)商提高數(shù)據(jù)處理能力,供應(yīng)商能力提升之后,又會(huì)反過(guò)來(lái)給谷歌提供更多高質(zhì)量數(shù)據(jù),從而形成一種良性循環(huán)。
國(guó)內(nèi)AI Infra生態(tài)的不足,直接導(dǎo)致的就是大模型創(chuàng)業(yè)門(mén)檻的拔高。如果將在中國(guó)做大模型比喻成吃上一頓熱乎飯,那必須從挖地、種菜開(kāi)始。
目前,在AI 2.0的熱潮中,一個(gè)重要的特點(diǎn)就是“兩極化”:最熱門(mén)的要么是大模型層、要么就是應(yīng)用層。而類似AI Infra的中間層,反而是很大的真空地帶,也可能是下一個(gè)機(jī)遇所在。
鏟子難賣,金礦難挖
盡管在大模型應(yīng)用爆發(fā)的當(dāng)下,AI Infra層潛藏著巨大的生意。但是對(duì)于這些做AI Infra的公司來(lái)說(shuō),即使他們?cè)谧约旱膶I(yè)領(lǐng)域如此強(qiáng)大,在潮水的變化面前依然脆弱。
英偉達(dá)CUDA生態(tài)已經(jīng)發(fā)展了20年,在AI領(lǐng)域,最先進(jìn)的模型和應(yīng)用都首先在CUDA上跑起來(lái)。
每個(gè)硬件之間都有不同的接口,CUDA統(tǒng)一了不同接口之間的語(yǔ)言,讓使用者能夠用一套標(biāo)準(zhǔn)語(yǔ)言去使用不同硬件。在模型開(kāi)發(fā)過(guò)程中,開(kāi)發(fā)者勢(shì)必會(huì)趨同于在同一個(gè)語(yǔ)言體系中去完成自己的開(kāi)發(fā)。而這實(shí)際上就構(gòu)成了英偉達(dá)CUDA生態(tài)厚度。
目前,CUDA生態(tài)在AI算力市場(chǎng)占據(jù)了90%以上的份額。不過(guò)隨著AI模型的標(biāo)準(zhǔn)化,模型之間結(jié)構(gòu)差異變小,不再需要調(diào)度多種大小模型,英偉達(dá)CUDA生態(tài)厚度在變薄。
即使如此,英偉達(dá)在算力市場(chǎng)也是絕對(duì)王者。據(jù)業(yè)內(nèi)人士預(yù)測(cè),英偉達(dá)在接下來(lái)的3~5年當(dāng)中,還會(huì)是整個(gè)AI硬件提供商中絕對(duì)的領(lǐng)頭羊,市場(chǎng)發(fā)展占有率不會(huì)低于80%。
對(duì)AI Infra層的賣鏟廠商來(lái)說(shuō),外有英偉達(dá)守礦人,堵在門(mén)口賣門(mén)票與鏟子,好不容易找到一條進(jìn)入金礦的小路,卻發(fā)現(xiàn),里面的挖礦人已經(jīng)習(xí)慣“徒手”挖礦,不再接受新鏟子。
在國(guó)內(nèi),企業(yè)為軟件付費(fèi)意愿低,且大多習(xí)慣集成式服務(wù)。國(guó)內(nèi)SaaS投資已經(jīng)降到冰點(diǎn),如果AI Infra層廠商單靠賣硬件或軟件難以實(shí)現(xiàn)商業(yè)化。
伴隨AI應(yīng)用的快速發(fā)展,未來(lái)誰(shuí)能夠?yàn)槎鄻踊膽?yīng)用場(chǎng)景提供高效便捷的大模型一站式部署方案,誰(shuí)就有可能在這場(chǎng)競(jìng)爭(zhēng)中勝出。而這其中,底層技術(shù)、中層平臺(tái)、上層應(yīng)用缺一不可,只有讓各方面能力得到更全面、均衡地發(fā)展,才能在AI之路上走得更遠(yuǎn)、更穩(wěn)健。
放眼未來(lái),人工智能重塑千行百業(yè)的進(jìn)程剛拉開(kāi)帷幕,Al Infra鋪就的厚雪長(zhǎng)坡有助于這個(gè)超級(jí)賽道行穩(wěn)致遠(yuǎn)。今年,數(shù)據(jù)基礎(chǔ)設(shè)施已在頂層設(shè)計(jì)中“獨(dú)立門(mén)戶”,人工智能基礎(chǔ)設(shè)施戰(zhàn)略地位的躍遷亦不遙遠(yuǎn)。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 2024年劇集氪金力大盤(pán)點(diǎn)
- “共創(chuàng)”、“造?!背身斄鳎瑐鹘y(tǒng)品牌緣何要花式出圈?
- 人形機(jī)器人瘋狂進(jìn)廠打工!銀河通用、智元、樂(lè)聚機(jī)器人怕是都瘋了
- 折疊手機(jī)猛增三成,但是卻也到了崩盤(pán)邊緣,違背人性必被拋棄
- 因?yàn)樗投Y電商!2025微信、抖音、淘寶又撕破了臉
- 中國(guó)手機(jī)市場(chǎng)成績(jī)單:華為增長(zhǎng)最快,蘋(píng)果跌幅最大
- 原以為微軟、亞馬遜、阿里云云計(jì)算大局已定!沒(méi)想到有這四大變數(shù)
- 崖州灣之旅:看見(jiàn)海與智能,聯(lián)想到了未來(lái)
- 榮耀換帥,一艘AI巨輪的舵手更替會(huì)帶來(lái)什么?
- 泳池機(jī)器人Aiper,從價(jià)值鏈高處“游”進(jìn)全球庭院
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。