行業(yè)大模型的突圍之戰(zhàn)

大模型的創(chuàng)新,不僅僅需要單點的創(chuàng)新,更要圍繞AI-Native開展系統(tǒng)性地創(chuàng)新;不僅要在場景上廣泛探索,更要在技術(shù)上形成突圍。

重塑一切的理想主義AI

大模型已成為當下IT產(chǎn)業(yè)無可爭議的最大風口。

人工智能從概念提出至今已有半個多世紀,繼“深藍”和AlphaGo曇花一現(xiàn)之后,Transformer架構(gòu)及ChatGPT的橫空出世,再一次點燃全世界的熱情,人工智能以更具象、接地氣的方式呈現(xiàn),大模型和生成式AI也開始走入更多人的視野。

過去的一年來,從互動問答、語音對話到文生視頻,OpenAI屢次刷新熱度;Google、Meta入局推出開源大模型,圖謀一席之地;微軟將GPT4.0集成到辦公軟件中,成為生產(chǎn)力工具;華為和蘋果將手機語音助手接入大模型,加速端側(cè)智能化。

AI產(chǎn)業(yè)的拐點已經(jīng)來到,大模型正在重塑一切辦公、生產(chǎn)和生活。

大模型火熱的背后,英偉達成為最大的受益方。隨著業(yè)界對AI算力的需求快速增長,GPU卡洛陽紙貴、一卡難求,其24/25Q1季報同比增長近4倍,達到260億美金。受持續(xù)提升的業(yè)績數(shù)據(jù)和不斷放大的市場需求支撐,2024年6月18日英偉達市值達到3.35萬億美金,連續(xù)超越微軟、蘋果,成為全球市值最大的公司。

一切都在向著人們期待的方向發(fā)展,甚至有人喊出了“第四次工業(yè)革命已來”。

盛名之下,其實難副

這波大模型浪潮并不如表面呈現(xiàn)的那樣光鮮亮麗,幾家歡喜幾家愁。

根據(jù)紅杉資本發(fā)布的報告,英偉達僅在2023年的芯片訂單就高達500億美元,賺得盆滿缽滿,而整個生成式AI企業(yè)的銷售收入才30億美元,多數(shù)企業(yè)距離盈利依然遙遙無期,甚至一些企業(yè)已經(jīng)瀕臨破產(chǎn)的邊緣。

如果淘金者持續(xù)淘不到金子,賣鏟子的生意也終將不可持續(xù)。

不管是OpenAI、微軟還是谷歌,這些AI的先行者都還沒有找到穩(wěn)定且持續(xù)的商業(yè)模式,更多的是為資本描繪了一副宏大的藍圖,以支撐市場的預期。

在國內(nèi),10億參數(shù)規(guī)模以上大模型數(shù)量已遠超100個。但還未形成成熟商業(yè)模式的大模型產(chǎn)業(yè),已經(jīng)開始卷起了價格,模型免費、Token降價、算力打折,多么熟悉的味道。在群雄混戰(zhàn)的早期通過低價圈定一波用戶和開發(fā)者無可厚非,適當?shù)母偁幱欣诋a(chǎn)業(yè)的良性發(fā)展,但無序的競爭將導致惡性循環(huán),讓大模型產(chǎn)業(yè)陷入死亡螺旋。

2023年底,Gartner發(fā)布AI新興技術(shù)成熟度曲線,大模型和生成式AI正處在技術(shù)炒作周期的最高點,Gartner對生成式AI做出了極高的評價,認為它將AI的熱度推向了一個新高潮,但也表達了對繁榮之下所掩蓋的潛在風險的擔憂。

市場最終要回歸理性,只有真正為用戶創(chuàng)造價值才能實現(xiàn)商業(yè)閉環(huán)、有更長遠未來。

理想很豐滿,現(xiàn)實很骨感!大模型從趨勢到全面落地依然任重道遠。

化整為零,圍繞行業(yè)穿插作戰(zhàn),實現(xiàn)戰(zhàn)略突圍

在這一波AI浪潮中,中國發(fā)展得怎么樣?當網(wǎng)絡上ChatGPT、Sora、英偉達的新聞鋪天蓋地襲來時,很多人不免產(chǎn)生焦慮:我們又落后了?

必須承認,我國在算力、算法和數(shù)據(jù)領(lǐng)域其實并不具備優(yōu)勢:高端算力卡被英偉達卡脖子無法供應,短時間內(nèi)自有制程和設(shè)計又無法跟上;算法領(lǐng)域,雖然模型數(shù)量眾多,但大多數(shù)是基于國外開源架構(gòu)優(yōu)化,缺乏自主性和領(lǐng)先性;數(shù)據(jù)領(lǐng)域,我們的開放數(shù)據(jù)和國外不在一個數(shù)量級上,中文語料嚴重不足。

AI的三要素,每一條都是致命傷!

但從另一個角度看,我國有全球唯一的全工業(yè)門類、最多的金融消費人群以及最大規(guī)模的政務和城市體系,產(chǎn)生了豐富的場景和私有數(shù)據(jù),這些都成為發(fā)展行業(yè)大模型的天然土壤。于是,我們沒有走大兵團正面突擊的道路,而是化整為零圍繞行業(yè)穿插作戰(zhàn),通過大模型賦能一個個行業(yè)細分場景,最終形成戰(zhàn)略突圍。

近兩年,在用戶和廠商的共同努力下,一些行業(yè)大模型已經(jīng)開花結(jié)果。大模型已經(jīng)逐步應用政務導辦、公文檢索、事件分撥等場景,幫助政府提升政務服務效率和城市管理效率;在礦山領(lǐng)域,大模型和云邊協(xié)同幫助礦山實現(xiàn)增安提效,加速產(chǎn)業(yè)集群智能化;在鐵路,基于視覺大模型的TFDS火車故障軌邊圖像檢測系統(tǒng),實現(xiàn)不停車的實時圖像采集和分析,自動識別各種不同類型的鐵路貨車故障;基于大模型的氣象預測方案,計算速度相比傳統(tǒng)HPC的數(shù)值計算提升一萬倍,更精準預測臺風路徑。

還有醫(yī)藥、制造、鋼鐵、金融等更多行業(yè)的場景在持續(xù)落地,我們正在走一條和國外不一樣的務實之路,不跟風不冒進,沿著清晰的目標和節(jié)奏逐個打磨場景,這種涓涓細流,終將匯聚成智能化的汪洋大海。

行業(yè)大模型加速落地建議

行業(yè)大模型建設(shè),知易行難。

政企業(yè)務場景復雜多樣,很難用通用大模型去應對。此時我們應該意識到,卷參數(shù)量、卷Token數(shù)、卷集群規(guī)模、卷價格都毫無意義,行業(yè)大模型落地更需要關(guān)注工程化的問題。

一、軟硬協(xié)同發(fā)展

除了模型本身外,大模型還涉及開發(fā)平臺、開發(fā)框架、計算架構(gòu)以及各類工具,以及多樣性算力、高性能存儲和高帶寬網(wǎng)絡等硬件基礎(chǔ)設(shè)施。在分層解耦架構(gòu)的基礎(chǔ)上,需要從性能、可靠性、可維護性以及兼容性等方面,進行端到端的集成設(shè)計和驗證。比如軟硬件全鏈路可視化運維、算網(wǎng)協(xié)同的低時延大帶寬網(wǎng)絡、基于親和性的算子加速等,確保系統(tǒng)不僅跑得好,更要跑得穩(wěn)。

二、采用AI-Native的云基礎(chǔ)設(shè)施

AI-Native的云基礎(chǔ)設(shè)施正成為越來越多企業(yè)的優(yōu)先選擇?;诠性朴柧毣A(chǔ)大模型,在本地私有云中結(jié)合私有數(shù)據(jù)通過二次訓練和微調(diào),這種混合云方案兼顧效率與安全,已成為大模型建設(shè)的新范式,同時云邊協(xié)同的架構(gòu)還可以有效簡化海量邊緣的管理,應對工業(yè)場景海量邊緣接入的需求。它相比非云的部署模式,還能提供對通用算力和AI算力的統(tǒng)一調(diào)度,并基于其豐富技術(shù)棧覆蓋數(shù)據(jù)、模型和應用開發(fā)全流程,降低開發(fā)門檻。

三、建立AI開發(fā)工作流,促進模型確定性交付

大模型是一個系統(tǒng)工程,其交付過程涉及數(shù)據(jù)管理、模型開發(fā)環(huán)境、模型訓練、推理部署的全流程數(shù)十個環(huán)節(jié),傳統(tǒng)的開發(fā)機制很難解決跨團隊協(xié)作和迭代開發(fā)的難題。要降低模型開發(fā)過程的不確定性,需要建立一站式AI開發(fā)工作流,幫助企業(yè)快速構(gòu)建跨團隊協(xié)同開發(fā)、高效迭代的機制,同時通過標準化、自動化的流程提高模型的交付效率與交付質(zhì)量。

四、重視數(shù)據(jù)工程,打造優(yōu)質(zhì)數(shù)據(jù)集

模型性能是由數(shù)據(jù)質(zhì)量和算法設(shè)計共同決定的,當前AI訓練數(shù)據(jù)缺乏系統(tǒng)化的治理工具,甚至部分工作需要人為處理,存在集成、清洗和標注效率低,以及價值觀的問題。打造高質(zhì)量的AI大模型,必須構(gòu)筑核心的數(shù)據(jù)工程能力,為大模型高質(zhì)量供數(shù)。一方面可以借助開放的數(shù)據(jù)授權(quán)運營平臺,獲取高質(zhì)量的數(shù)據(jù);另一方面,針對內(nèi)部數(shù)據(jù)需要引入自動化和智能化的手段,構(gòu)建數(shù)據(jù)清洗、標注和質(zhì)量評估體系;同時通過數(shù)據(jù)質(zhì)量分析、成分分析、場景配比和智能配比能力,建立數(shù)據(jù)配比到模型效果的反饋優(yōu)化機制,基于應用效果反饋持續(xù)調(diào)優(yōu),實現(xiàn)價值觀對齊。

五、建立賦能機制,繁榮產(chǎn)業(yè)生態(tài)

生態(tài)是發(fā)展大模型不可或缺的一環(huán)。需要從技術(shù)生態(tài)、數(shù)據(jù)生態(tài)、模型生態(tài)和應用生態(tài)四個層面,去構(gòu)建AI時代開放、可閉環(huán)、有質(zhì)量的生態(tài)體系。這個過程中,政府和行業(yè)頭部企業(yè)的作用不可忽視,可以帶頭建立如聯(lián)創(chuàng)實驗室、模型和應用商城、需求對接會、創(chuàng)新大賽等,并通過資金贊助、人才培養(yǎng)、政策扶持等多方面的牽引,通過行政手段打造中立的區(qū)域性賦能平臺;行業(yè)頭部企業(yè)在開展自身業(yè)務創(chuàng)新的同時,也可以通過技術(shù)、數(shù)據(jù)、模型和應用賦能行業(yè)和產(chǎn)業(yè)鏈上下游,從單企智能化走向行業(yè)智能化。

六、開展持續(xù)運營

大模型落地面臨缺經(jīng)驗、缺人才、缺能力的挑戰(zhàn),大多數(shù)企業(yè)都是邊實踐、邊總結(jié)。需要將這些經(jīng)驗和能力固化下來,逐步形成覆蓋了大模型落地的全流程的工程能力,包括前期的頂層設(shè)計、POC測試、規(guī)劃實施,中期構(gòu)建優(yōu)質(zhì)數(shù)據(jù)集、開展場景分析和模型開發(fā),以及后期的運維運營等。大模型運營和建設(shè)同樣重要,缺少運營機制,大模型平臺很難持續(xù)發(fā)揮價值。因此,需要打造適合企業(yè)的流程、組織和人才隊伍,持續(xù)開展技術(shù)、生態(tài)、用戶運營,不會斷優(yōu)化老場景、發(fā)掘新場景,最終實現(xiàn)全面智能化。

欲木之長者,必固其根本

大模型創(chuàng)新,歸根結(jié)底是技術(shù)之爭,根深才能葉茂。

大模型的創(chuàng)新,不僅僅需要單點的創(chuàng)新,更要圍繞AI-Native開展系統(tǒng)性地創(chuàng)新,不僅要在場景上廣泛探索,更要在技術(shù)上形成突圍。

近年來,國內(nèi)涌現(xiàn)了一批代表性的科技企業(yè),如寒武紀、地平線、壁仞科技、訊飛、摩爾線程、華為、阿里、百度等,他們堅持投入人工智能創(chuàng)新,推動AI產(chǎn)業(yè)升級。

2023年,百度 “文心一言”、阿里 “通義千問”和訊飛 “星火”陸續(xù)推出,華為也發(fā)布盤古大模型3.0,提出“AI for industries”的理念,并基于華為云Stack推出了業(yè)界首個大模型混合云。近期HDC2024上,華為云盤古大模型5.0升級亮相,打造全系列、多模態(tài)和強思維能力,進一步詮釋“解難題、做難事”的愿景,同時發(fā)布大模型混合云十大創(chuàng)新技術(shù),通過AI-Native的系統(tǒng)性創(chuàng)新,加速企業(yè)專屬大模型落地。

創(chuàng)新者往往孤獨,但注定不凡。

不僅需要沉下心,更要有“板凳要坐十年冷”的戰(zhàn)略耐性。

我們終將迎來AI的黃金時代。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-06-24
行業(yè)大模型的突圍之戰(zhàn)
大模型的創(chuàng)新,不僅僅需要單點的創(chuàng)新,更要圍繞AI-Native開展系統(tǒng)性地創(chuàng)新;不僅要在場景上廣泛探索,更要在技術(shù)上形成突圍。重塑一切的理...

長按掃碼 閱讀全文