何許人也?敢把大模型價格“打骨折”?

科技云報道原創(chuàng)。

云計算價格戰(zhàn)的硝煙尚未散去,全球AI大模型也卷出了“骨折價”。

今年以來,OpenAI、Mistral AI、通義千問、智譜AI、文心一言紛紛祭出降價“撒手锏”。

在海外,法國人工智能企業(yè)Mistral AI大模型Mistral Large的輸入、輸出價格比GPT-4 Turbo便宜約20%。OpenAI推出新一代旗艦AI模型GPT-4o,其API價格下降50%。

國產(chǎn)大模型在降價上也“不甘落后”。通義千問2.5性能基本追平GPT-4 Turbo,個人用戶可從App、官網(wǎng)和小程序免費使用。

智譜AI將入門級大模型GLM-3 Turbo調(diào)用價格下調(diào)80%,1元就可以購買100萬tokens。字節(jié)跳動豆包大模型開啟對外服務,根據(jù)火山引擎公布的價格計算,1塊錢就能買到豆包主力模型的125萬Tokens。

究竟是什么原因引發(fā)了大模型這輪波瀾壯闊的降價潮?降價后大模型將往何處去?值得我們研究。

全球大模型掀起降價潮原因幾何?

任何技術最終的落腳點都是實用性、易用性和性價比的三者統(tǒng)一,沒有例外。

無論是當初的電商、外賣、手機,還是如今的新能源汽車、大模型,當技術發(fā)展到一定階段,競爭到最后都會遵循價格第一的鐵律。目前,全球大模型產(chǎn)業(yè)不約而同地掀起“降價潮”,也正印證了一個規(guī)律:性價比是商業(yè)最高真諦,貴不等于值得,劃算才是。

在新技術或新產(chǎn)品追求大規(guī)模商業(yè)化落地過程中,“降價”策略得以使新技術和產(chǎn)品得到最快速度、最大限度的普及,也成為科技企業(yè)技術商業(yè)化的必然路徑。

全球大模型頭部企業(yè)OpenAI于近日宣布最新GPT-4o多模態(tài)大模型,其在保持與GPT-4同等智能水平的基礎上,實現(xiàn)了文本、圖像和語音處理的全面提升,同時GPT-4o將免費開放給所有用戶,整體API價格相比于前代也下降了50%。

事實上,這已不是OpenAI在商業(yè)化道路上的第一次降價。以GPT-3.5系列的輸入成本為例,2023年3月首次降價90%,6月再次降價25%,到了2024年2月,進行第三次降價50%。

反觀國內(nèi),以具有代表性的大模型頭部企業(yè)智譜AI為例,去年6月,在科技媒體The Information的盤點中,智譜AI被視為最有可能成為“中國OpenAI”的5家企業(yè)之一,其一舉一動在業(yè)內(nèi)具有風向標性質(zhì)。

智譜AI的大模型開放平臺bigmodel.cn于近日上線了全新的價格體系。新注冊用戶可以獲得額度從500萬tokens大幅提升4倍,至2500萬tokens,入門級產(chǎn)品GLM-3Turbo模型產(chǎn)品的調(diào)用價格更是斷崖式下降80%,從5元/百萬tokens直接降至1元/百萬tokens,堪稱“價格屠夫”。

我們看來,降價并非簡單粗暴的價格戰(zhàn),而是充分釋放讓利空間,是技術、規(guī)模帶來的正循環(huán)。目前,大模型應用發(fā)展仍處于早期階段。QuestMobile數(shù)據(jù)顯示,截至今年3月,基于大模型的AIGC行業(yè)用戶量為7380萬,盡管同比增長了8倍,也僅占移動互聯(lián)網(wǎng)用戶量的6%。而降低成本是推動大模型快進到“價值創(chuàng)造階段”的一個關鍵因素。

“數(shù)據(jù)飛輪”在大模型進化過程中的作用不可忽視,通過客戶在應用程序中輸入的提示詞這樣的數(shù)據(jù)反饋,使大模型快速迭代。

通過降價,一方面用戶不僅感受到了大模型應用帶來的便利和高效,大模型企業(yè)還可以更快速地吸引用戶,通過用戶反饋數(shù)據(jù)加速大模型迭代升級,另一方面幫助大模型企業(yè)搶占市場份額提高營收,以對沖高昂的研發(fā)投入,真正實現(xiàn)“技術-場景-盈利”的商業(yè)化閉環(huán),同時隨著大模型應用場景的開拓,還會衍生出更多的微調(diào)及推理等需求,進一步帶動國內(nèi)AI應用的繁榮發(fā)展。

從這個角度來講,大模型降價這事無論對于個人用戶還是企業(yè)用戶都是一種雙贏。

大模型邁入“普惠時代”

通過對比通義千問、文心一言、百川、MiniMax、月之暗面等入門級產(chǎn)品API調(diào)用價格不難發(fā)現(xiàn),智譜AI此次降價幅度之大前所未有。

價格調(diào)整后,使用GLM-3 Turbo創(chuàng)作一萬條小紅書文案(以350字計)將僅需約1元錢,足以讓更多企業(yè)和個人都能用上這款入門級產(chǎn)品。

除了個人版GLM-3Turbo,智譜AI的企業(yè)級產(chǎn)品GLM-4/GLM-4V價格尚未出現(xiàn)大幅波動,仍維持在0.1元/千tokens,百萬tokens的價格為100元。作為一款能力逼近GPT-4的國內(nèi)領先大模型,GLM-4這一價格還是具有明顯優(yōu)勢。

再與OpenAI價格進行對比,其最新模型GPT-4 Turbo每100萬tokens輸入/輸出價格分別是10/30美元。Claude 3 Opus則更貴,每百萬tokens輸入/輸出價格15/75美元。

在這輪降價潮中,我們可以隱約看到“摩爾定律”也在深深影響著大模型行業(yè)。伴隨大模型價格下降的是性能的大幅提升。

今年3月,清華大學基礎模型研究中心聯(lián)合中關村實驗室發(fā)布的《SuperBench大模型綜合能力評測報告》顯示,GLM-4已然闖入第一梯隊,與GPT-4、Claude-3等國際一流模型水平接近,且差距已經(jīng)逐漸縮小。

2023年3月,智譜AI推出千億開源基座對話模型ChatGLM系列,并在過去一年內(nèi)完成4次升級,于2024年1月推出新一代基座大模型GLM-4系列,整體性能相比上一代提升了60%,已經(jīng)逼近GPT-4。

它能夠支持128k的上下文窗口長度,與GPT-4 Turbo相當,同時具備更強多模態(tài)能力,效果超過開源SD模型,逼近DALLE-3。

為進一步降低大模型使用門檻,智譜AI推出智能體定制功能,用戶只需使用簡單的提示詞指令,就可以創(chuàng)建屬于自己的智能體。

任何人都可以自由運用GLM-4模型,即使沒有任何編程基礎,也能便捷地進行大模型開發(fā)。正是得益于GLM模型的強大的智能體能力,GLM-4實現(xiàn)了自主根據(jù)用戶意圖,自動理解、規(guī)劃復雜指令,從而完成更加復雜的任務。

技術的持續(xù)進步為降低開發(fā)大模型成本提供了現(xiàn)實可能。智譜AI通過模型推理算子優(yōu)化、模型壓縮及硬件高效適配、高性能系統(tǒng)實現(xiàn),以及精細化集群調(diào)度等技術,將GLM-3 Turbo推理成本進行大幅壓縮。

自大模型開放平臺上線以來,在模型效果和推理性能不斷提升的情況下,已累計降價超過百倍,這無疑也給了智譜AI將API調(diào)用價格打至“冰點”的底氣。

一直以來,大模型給外界的印象是貴、小眾。事實也確實如此,在行業(yè)發(fā)展初期,由于還未形成規(guī)模效應,廠商的成本一直居高不下,很多企業(yè)和開發(fā)者只能望洋興嘆。

但智譜AI等大模型廠商此次調(diào)價向行業(yè)和公眾宣告這樣一個事實:優(yōu)質(zhì)的大模型,不一定要花大價錢,“技術普惠時代”已經(jīng)到來。

所謂的“技術普惠”,就是堅持致力于突破技術壁壘,讓更多前沿科技以大眾更能接受的價格走進生活,讓更多人有機會享受到科技帶來的便利。

“強性能+好價格”是技術普惠的最大特征,智譜AI正在沿著這條路前行,其開放平臺上已經(jīng)聚集了超過數(shù)十萬的企業(yè)和開發(fā)者,并且在持續(xù)快速增長,過去的半年每日的token消耗增長超過一百倍。

比如官方開發(fā)的三個調(diào)用工具,網(wǎng)頁檢索、函數(shù)調(diào)用以及知識庫,自從1月上線以來調(diào)用次數(shù)已經(jīng)超過3億次。

智譜AI CEO張鵬曾表示:“雖然目前技術已經(jīng)非??焖俚卦诔尸F(xiàn),但仍有很多問題值得去探索。智譜著眼于通用人工智能(AGI),這里的每一個問題的突破都有可能實現(xiàn)飛躍式發(fā)展,我們還遠未達到技術的天花板,但曙光已現(xiàn),2024年是向AGI發(fā)起沖鋒的起始年份?!倍溯喠鑵柕慕祪r,預示著智譜AI吹響了向AGI發(fā)起沖鋒的號角。

商業(yè)化先行者已立潮頭

雖說大模型這兩年很火,但質(zhì)疑之聲仍不絕于耳。

其中一個很重要的原因,就因為現(xiàn)階段做大模型每天的投入可能成百上千萬,但很多的產(chǎn)品目前商業(yè)化程度并不高,有點像“砸錢賺吆喝”。

雖然“高投入”依然是主流大模型賽道玩家的主色調(diào),但近兩年,基礎大模型及上層應用服務商的盈利能力明顯在增強。同時,大模型應用在C端涌現(xiàn)出了不少現(xiàn)象級產(chǎn)品,但很多仍處于以免費模式獲客到商業(yè)轉化的階段,營收規(guī)模并不突出。

在這其中,OpenAI較早開始商業(yè)化嘗試,2022年對外的營收是2800萬美元,2023年ARR增至16億美元,激起了業(yè)內(nèi)的無限聯(lián)想。不過,OpenAI爆發(fā)式的營收增長和其豐富的業(yè)務線、市場占有率、以及B端、C端的雙布局也有很大關系。

對比國外,國內(nèi)企業(yè)級大模型服務的滲透更快,發(fā)展勢頭也更猛。在B端需求井噴以及客戶群較高的付費能力的推動下,《中國AIGC應用全景報告》預測,國內(nèi)AIGC應用市場2024年底有望增至200億規(guī)模,預計2030年可達萬億規(guī)模。

從目前來看,底層通用大模型賽道多采用開放API接口的形式,擴大客群,最終按實際消耗或調(diào)用的tokens量收費。對于主流的大模型應用來說,按訂閱費、調(diào)用費以及定制化收費顯得更常見。

比如OpenAI的另一條業(yè)務線DALL-E 3,雖然沒有公布明確的商業(yè)計劃,不過它更多向ChatGPT的付費版/企業(yè)版用戶開放,充分放大了ChatGPT會員訂閱的吸引力。

反觀智譜AI,其大模型開放平臺bigmodel.cn,被視為公司今后大模型應用和商業(yè)化的重要接口之一,其平臺生態(tài)也日益壯大。截至目前,智譜AI已有超過2000家生態(tài)合作伙伴、1000家規(guī)?;瘧煤?00家深度共創(chuàng)客戶。

通過采用降價策略,智譜AI率先搶占市場一角,吸引大量企業(yè)和開發(fā)者對API的調(diào)用,當企業(yè)和開發(fā)者形成平臺粘性后,實現(xiàn)大規(guī)模營收也就是順理成章的事情了。

在大模型的激烈競爭中,智譜AI率先拿起“價格屠刀”,無疑將帶給行業(yè)不小的壓力,但也加速了整個行業(yè)的商業(yè)化進程。

對于大模型廠商而言,價格戰(zhàn)既是壓力也是前進的動力,但對于企業(yè)和開發(fā)者而言,則是實實在在的利益和價值,有助于加快大模型行業(yè)應用創(chuàng)新落地。

但最終市場蛋糕能做多大,將取決于能否落地合適的業(yè)務場景,打造商業(yè)閉環(huán),同時也是對大模型應用服務商自身的產(chǎn)品和服務實力的深度考驗。

可以預見的是,未來大模型一定是技術、成本、性價比三者的平衡,國內(nèi)大模型廠商通過不斷在B端和C端進行持續(xù)探索,將為大模型打通商業(yè)化閉環(huán)提供了切實可行的路徑。盡管前路挑戰(zhàn)重重,但隨著技術的普惠發(fā)展,我們相信,大模型全民普及時代正加速到來,一個充滿機遇和創(chuàng)新的新紀元已為時不遠。

【關于科技云報道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領域Top10媒體。獲工信部權威認可,可信云、數(shù)博會、國家網(wǎng)安周與全球云計算等大型活動的官方指定傳播媒體之一。深入原創(chuàng)報道云計算、人工智能、大模型、網(wǎng)絡安全、大數(shù)據(jù)、區(qū)塊鏈等企業(yè)級科技領域。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2024-05-19
何許人也?敢把大模型價格“打骨折”?
科技云報道原創(chuàng)。云計算價格戰(zhàn)的硝煙尚未散去,全球AI大模型也卷出了“骨折價”。今年以來,OpenAI、Mistral AI、通義千問、智譜AI、文心...

長按掃碼 閱讀全文