5月20日,電商年中大促“618”正式開啟,各家電商平臺還在忙著統(tǒng)計首日戰(zhàn)報,大模型價格戰(zhàn)已經(jīng)率先打響,甚至比618還要猛烈。
21日上午,阿里云拋出重磅炸彈,通義千問GPT-4級主力模型Qwen-Long,API(應(yīng)用程序編程接口)輸入價格從0.02元/千Tokens降至0.0005元/千Tokens,直降97%,相當于GPT-4價格的約1/400。
上周,字節(jié)跳動發(fā)布豆包大模型,并宣布豆包通用模型pro-32k版的推理輸入價格為0.0008元/千Tokens,首次將大模型價格帶入“厘時代”。如今,通義千問的價格比豆包大模型還要便宜。
按照上述價格計算,1元能買到豆包主力模型的125萬Tokens,相當于3本《三國演義》,而1元也可以買到通義千問主力模型的200萬Tokens,相當于5本《新華字典》。
這還沒完,當天下午,百度直接宣布,旗下兩款大模型ERNIE Speed、ERNIE Lite免費。這兩款產(chǎn)品是今年3月百度推出的“輕量級”大模型,相比通用大模型,輕量級大模型的推理成本也會更低。
那么,問題來了,字節(jié)、阿里、百度三家大廠已相繼宣布大模型降價,騰訊會不會跟進?
日前,騰訊云副總裁、騰訊云智能負責人吳運聲在接受采訪時,沒有明確回答是否會加入大模型價格戰(zhàn),他表示,“騰訊更關(guān)注大模型能力的提升,致力于為行業(yè)提供能力和價格兼具的產(chǎn)品?!?/p>
從卷技術(shù)到卷價格
前兩年,大模型公司還沉浸在拼參數(shù)量、拼文本長度。今年以來,整個行業(yè)從卷技術(shù)到卷價格,大模型降價已成趨勢。
在字節(jié)等大廠紛紛宣布降價之前,已經(jīng)有不少廠商下調(diào)大模型使用價格。
5月6日,AI公司DeepSeek發(fā)布全新第二代MoE大模型DeepSeek-V2,該模型API定價為:每百萬Tokens輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一。
5月11日,智譜大模型官宣新的價格體系,入門級產(chǎn)品GLM-3 Turbo模型調(diào)用價格從5元/百萬Tokens降至1元/百萬Tokens,降幅高達80%。
這樣的趨勢,同樣在國外發(fā)生。今年2月底,法國AI公司Mistral AI發(fā)布最新大模型Mistral Large,該模型輸入、輸出價格比GPT-4 Turbo便宜約20%。
而自去年以來,OpenAI已經(jīng)進行了4次降價,其最新發(fā)布的多模態(tài)大模型GPT-4o,不僅性能有了很大提升,價格也下調(diào)了50%。
降價背后是大模型結(jié)構(gòu)、訓練等成本的持續(xù)優(yōu)化。李彥宏曾在Create 2024百度AI開發(fā)者大會上透露,與一年前相比,文心大模型推理性能實現(xiàn)了105倍增長,而推理成本卻降到了原來的1%。
今日,創(chuàng)新工場董事長兼CEO李開復在接受媒體采訪時表示,在一定程度上,整個行業(yè)每年降低10倍推理成本,這是可以期待的,而且是必然也應(yīng)該發(fā)生的。“今天可能是處在一個比較低的點,但是我覺得如果說以后大約有一年降價10倍來看的話,這是一個好消息,對整個行業(yè)都是好消息?!?/p>
此外,火山引擎總裁譚待也曾表示,市場對降價的呼聲比較高,平臺必須把試錯成本做到非常低,才能讓大家用起來。只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。
為什么要打價格戰(zhàn)?
現(xiàn)在,大模型還是一個高投入、低產(chǎn)出的行業(yè),為什么廠商還要打價格戰(zhàn)?答案也很簡單:加速商業(yè)化落地。
大模型卷到2024年,一個新的賽季已經(jīng)打響,應(yīng)用場景的落地成為競爭主旋律。大模型定價的持續(xù)走低有望帶來更快的商業(yè)化落地。
上周,OpenAI、谷歌、字節(jié)跳動、騰訊四家大廠相繼披露在大模型領(lǐng)域的最新進展,無一不聚焦在應(yīng)用側(cè)。
硬核如OpenAI,對于最新發(fā)布的多模態(tài)大模型GPT-4o,也沒有以往對參數(shù)指標的生硬強調(diào),而是選擇集中展示多場景下的用戶體驗。這被認為是OpenAI加速應(yīng)用落地的表現(xiàn)。
在騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會上,吳運聲在談及大模型商業(yè)化的問題時表示,技術(shù)的突破未來一定會帶來商業(yè)化的機會,而且會呈現(xiàn)跨越式的增長態(tài)勢。AI要真正落地實用,推理成本的降低、工程性能的極致優(yōu)化至關(guān)重要,是未來商業(yè)化取得突破的重要因素。
當天,騰訊集團副總裁蔣杰在大會上宣布,騰訊混元大模型通過持續(xù)迭代,目前整體性能已居國內(nèi)第一梯隊,部分中文能力已追平GPT-4。
值得一提的是,目前大模型的應(yīng)用還在早期階段,仍有很大的發(fā)展空間。QuestMobile數(shù)據(jù)顯示,截至今年3月,基于大模型的AIGC行業(yè)用戶量為7380萬,盡管同比增長了8倍,也僅占移動互聯(lián)網(wǎng)用戶量的6%。
海通證券5月17日研報指出,伴隨國產(chǎn)AI大模型的持續(xù)升級,2024年有望成國產(chǎn)AI大模型全面商業(yè)落地的元年,先進的AI大模型能力也將逐漸轉(zhuǎn)化為落地實際場景的產(chǎn)品應(yīng)用,從而帶動AI大模型在金融、教育、法律、醫(yī)療等眾多垂直行業(yè)的持續(xù)落地,AI2B與AI2C的需求天花板也有望全面打開,在這個過程中,AI的投資也從映射和跟隨,變?yōu)橐I(lǐng)。(周小白)
- 消息稱AI初創(chuàng)企業(yè)Perplexity尋求與TikTok美國業(yè)務(wù)合并
- 谷歌Gemini神乎其技:不寫一字,10萬字商業(yè)戰(zhàn)略書籍輕松搞定,僅用不足4小時
- 跨維科技新發(fā)布:DexForce W1機器人顛覆認知,34個動力單元感知真實世界,未來科技觸手可及
- 月之暗面引領(lǐng)革新,Kimi k1.5模型破繭而出,開啟SOTA級多模態(tài)推理新紀元
- AI揭秘:CEO抑郁成風,財報電話會議背后隱藏的職場心理健康問題
- DeepSeek R1模型驚艷發(fā)布:對標OpenAI o1版,引領(lǐng)深度搜索新潮流
- 谷歌推出新型 AI 模型架構(gòu):Titans 打破上下文限制,融合記憶與注意力,引領(lǐng)未來智能
- OpenAI尚未實現(xiàn)AGI?阿爾特曼呼吁:別再炒作了,冷靜點!
- 歐萊雅引領(lǐng)行業(yè)創(chuàng)新,攜手IBM開發(fā)AI化妝品基礎(chǔ)模型:開啟美妝新紀元
- 中國石化創(chuàng)新科技:AI數(shù)字員工引領(lǐng)自助加油新時代
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。