大模型慢半拍,字節(jié)甘做“嫁衣”?

采寫/王舒然

編輯/萬天南

在大模型甚囂塵上的當下,一向高舉高打的字節(jié),卻一反常態(tài),低調(diào)得讓人不太習慣。

當百度、阿里、華為、360等知名互聯(lián)網(wǎng)公司的一把手們親自掛帥,為大模型站臺,并不吝用“智能化時代的開端”、“科技和商業(yè)史上的革命性時刻”來贊譽它時,字節(jié)卻安靜得多。

相關(guān)的官宣只有兩個,一是4月11日,飛書宣布將推出AI助手“My AI”,二是4月18日,火山引擎推出大模型訓練云平臺,包括自研DPU(數(shù)據(jù)處理器)、新版機器學習平臺等系列云產(chǎn)品,以服務于大模型創(chuàng)業(yè)公司——字節(jié)自研大模型始終未露面。

相反的是,火山引擎總裁譚待公開“承諾”,火山引擎不做大模型,將化身賦能者,為大模型客戶提供算力等AI基礎(chǔ)設(shè)施,幫助其做好大模型開發(fā)。

此舉似乎表明,字節(jié)避開了大模型戰(zhàn)火,選擇以幕后賣水者的身份入局。

只是,在算力、算法、數(shù)據(jù)這大模型的三要素上均具備優(yōu)勢的字節(jié),為何會選擇“韜光養(yǎng)晦”?字節(jié)真的會徹底放棄大模型,甘為他人做“嫁衣”嗎?

慢一拍的字節(jié)大模型

火山引擎不做大模型,或許并不代表字節(jié)對大模型無動于衷,這可能是個文字游戲。

實際上,雖然字節(jié)從未大張旗鼓得官宣自研大模型,但已經(jīng)有所部署。

據(jù)36Kr在今年2月的報道,字節(jié)跳動在大模型上已有布局,會在語言和圖像兩方面發(fā)力,語言大模型團隊由字節(jié)搜索部門牽頭,目前團隊規(guī)模在十數(shù)人左右;圖片大模型團隊則由產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團隊牽頭。

另據(jù)《晚點LatePost》報道,張一鳴開始看人工智能論文,且時常會和一些字節(jié)人士分享論文心得和對ChatGPT的思考。

這表明,字節(jié)并不想缺席這場盛宴,但必須承認的是,字節(jié)在大模型上的反應確實有點“遲鈍”了。

民生證券4月9日發(fā)布的《當大模型不再稀缺》報告顯示,國內(nèi)至少已有30多家大模型亮相。大部分都在3~4月份官宣,比如3月16日的百度“文心一言”大模型,4月8日的華為盤古系列AI大模型,4月10日的商湯“日日新”大模型,4月11日的阿里“通義千問”大模型......

而據(jù)36Kr報道,字節(jié)語言大模型團隊今年初才成立,預期今年年中推出大模型,字節(jié)跳動相關(guān)技術(shù)負責人表示,技術(shù)中臺在這些領(lǐng)域的探索仍處于初期,尚未成熟。

事實上,大模型競賽的起點并非今天,而在更早的布局,這方面,字節(jié)有些晚了。

對比來看,百度、阿里、華為、騰訊等企業(yè)的大模型均在2019年~2021年間就已有雛形,比如,百度在2019年發(fā)布了文心大模型,阿里在2021年發(fā)布了M6大模型,同年華為發(fā)布盤古大模型,這些雛形可以視為近期發(fā)布的類ChatGPT大模型的“基座”。

而字節(jié)方面,雖然其AI布局不算晚,字節(jié)AI Lab早在2016年就成立,與騰訊同一年,但其似乎并未在大模型上下足功夫。

據(jù)《晚點LatePost》報道,一位字節(jié)人士稱,在去年底ChatGPT出現(xiàn)前,字節(jié)對大模型的投入還比較少,表現(xiàn)之一是,約有100人的字節(jié)AI Lab NLP(自然語言處理)組,只有不到10人在研究語言大模型,其他人主要在做翻譯和抖音安全等優(yōu)化。

知乎上一位字節(jié)AI Lab工程師的回答也印證了這一點,他表示,字節(jié)AI Lab的主要研究方向和業(yè)務應用有關(guān),比如抖音特效、視頻和圖片審核等。

簡單來說,字節(jié)對AI的探索比較務實,主要服務于自家業(yè)務,這種務實而非務遠的策略,或許反而成了其布局通用大模型的“阻礙”。

而除了晚一步之外,字節(jié)對大模型的野望似乎也不是很大。

據(jù)《晚點LatePost》報道,字節(jié)語言大模型的探索方向主要與搜索相關(guān),可能會在抖音、TikTok中推出類似微軟New Bing的功能;圖像大模型則主要服務商業(yè)化需求,以幫助字節(jié)的廣告客戶以更低成本制作視頻。

另據(jù)字母榜報道,有知情人士稱,飛書推出的“My AI”背后的大模型是由飛書自行操盤,而非字節(jié)大模型團隊負責。

從上述信息判斷,字節(jié)大模型似乎并不打算“大包大攬”,而是與自家部分業(yè)務緊密相關(guān),這與百度“文心一言”、阿里“通義千問”等通用大模型有所差別。

比如“文心一言”,在發(fā)布會現(xiàn)場,文心一言展示了五個使用場景,包括文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。

“通義千問”的功能則包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持等,阿里巴巴集團董事會主席兼首席執(zhí)行官張勇表示,阿里所有業(yè)務包括天貓、釘釘、高德地圖、淘寶、優(yōu)酷、盒馬等都將接入該模型,應用場景實屬廣泛。

另一個可以側(cè)面佐證這一點的是,百度和阿里均計劃依托自家云平臺,向外界開放大模型服務,打造大模型生態(tài)。

比如阿里云智能集團CTO周靖人表示,各行各業(yè)的生態(tài)伙伴都可以對千問大模型進行再訓練和精調(diào),打造行業(yè)專屬大模型;百度智能云事業(yè)群總裁沈抖也表示,文心一言的能力將通過百度智能云對外提供服務,會率先在媒體、文娛、企業(yè)軟件等行業(yè)落地,場景包括智能客服、員工培訓、巡檢日報、知識萃取等。

但字節(jié)云卻“反其道而行之”,火山引擎宣稱只做基礎(chǔ)設(shè)施服務,不對外輸出大模型能力。

這意味著,字節(jié)正在探索的大模型定位可能并非是開放生態(tài),而是為了增強現(xiàn)有業(yè)務的競爭力。

當然,這只是初期,字節(jié)大模型的全貌尚未揭開,在字節(jié)官宣之前,還是變數(shù)難料。

字節(jié)為何甘為他人做“嫁衣“?

值得探究的是,為何字節(jié)對百度、阿里那樣的通用大模型興趣不高?火山引擎又為何堅定得不做大模型?

背后原因或許與以下幾方面的權(quán)衡有關(guān):

其一,通用大模型燒錢,且距離商業(yè)落地“遙遠”。

訓練大模型的一大成本是算力,而算力的關(guān)鍵是芯片,那么,大模型訓練需要多少芯片?

參考ChatGPT,美國市場研究機構(gòu)TrendForce推算稱,處理ChatGPT的訓練數(shù)據(jù)需要2萬枚A100芯片。網(wǎng)上流傳的一份《AI芯片專家交流紀要》顯示,如果是對標ChatGPT的大模型,1萬顆A100芯片是入門券。

而據(jù)國盛證券估算,按單張A100芯片的價格為10萬元算,大模型訓練需要投入約10億元。

這還只是訓練階段的芯片成本,還有模型推出后的綜合運營成本,參考ChatGPT,半導體研究公司SemiAnalysis認為,GPT-3每天大規(guī)模服務用戶的運營成本高達70萬美元,一年則高達2.555億美元(約17.6億元人民幣),新一代的GPT-4模型只會更燒錢。

除此外,還有數(shù)據(jù)采集、人工標注等軟性成本,加起來可謂“天價”。

像字節(jié)這樣的大廠或許有資金實力,但麻煩的是,燒錢的結(jié)果面臨不確定性。

雖然大模型前景可瞻,但距離大規(guī)模的商業(yè)落地還有不小的距離,目前仍在摸索階段,除了像釘釘、飛書、印象筆記等辦公場景的具體落地外,其他的應用場景都還停留在展望階段。

創(chuàng)世伙伴CCV合伙人梁宇在接受《21世紀經(jīng)濟報道》采訪時表示,現(xiàn)在是通用人工智能商業(yè)化應用的前夜,AI大模型還沒有經(jīng)過大量的商業(yè)包裝和訓練,需要從業(yè)者像園藝師一樣去修剪,形成符合行業(yè)規(guī)律的商業(yè)化產(chǎn)品。

IDC中國研究總監(jiān)盧言霞則認為,大模型落地的不確定性在于,能不能成功落地,是否真的能產(chǎn)出比之前的AI更好的效果,需要多久才能落地等等。

通用大模型投入產(chǎn)出比的不確定性,或許會讓“ROI至上”的字節(jié)有所顧慮。

其二,時間就是力量,在過去幾年內(nèi),阿里、百度等企業(yè)已將大模型“基座”迭代過幾輪,而字節(jié)幾乎是從“零”開始,先發(fā)優(yōu)勢已失,追趕不易,不如務實一點。

如今,字節(jié)大模型聚焦搜索、視頻生成等場景,離自身的業(yè)務落地更近,在算法和數(shù)據(jù)的儲備上極具優(yōu)勢,可操作性更高。

火山引擎定位基礎(chǔ)設(shè)施的服務也是同理,其2021年開始切入IaaS(基礎(chǔ)設(shè)施服務)模式,至今也有一定積累。

且網(wǎng)上流傳的一份《阿里云AI專家交流紀要0401》顯示,在國內(nèi)大廠的AI算力儲備中,字節(jié)排名第二,僅次于阿里。

更重要的是,火山引擎該定位的商業(yè)落地十分明確,更容易保障正向現(xiàn)金流。

這是因為大模型訓練需要巨大算力支持,而云廠商是公認的算力等基礎(chǔ)設(shè)施的最佳載體。

正如阿里巴巴集團董事會主席兼首席執(zhí)行官張勇所言,大模型是一場“AI+云計算”的全方位競爭,超萬億參數(shù)的大模型研發(fā),是囊括了算法、底層龐大算力、網(wǎng)絡(luò)、大數(shù)據(jù)、機器學習等諸多領(lǐng)域的復雜系統(tǒng)性工程,需要超大規(guī)模AI基礎(chǔ)設(shè)施的支撐。

微軟便是先例,微軟Azure作為OpenAI的獨家云供應商,為ChatGPT提供算力和超級計算系統(tǒng)。除了OpenAI,微軟2023財年二季度財報電話會議顯示,安盛、聯(lián)邦快遞和H&R Block等公司也都選擇Azure來部署和管理其模型。

像微軟這樣的云廠商被喻為大模型時代的“賣水人”,意為在大模型淘金的人未必能賺到錢,但為淘金人提供基礎(chǔ)服務的肯定能賺到。

硅谷知名風投A16Z的研究印證了這一點:生成式AI的大量資金最終都穩(wěn)定地流向了基礎(chǔ)設(shè)施層,預計生成式AI總收入的10%~20%都流向了云提供商。

總之,商業(yè)落地風險小,自身又擅長,無怪乎火山引擎如此定位,而抓住這股“紅利”,有機會為其帶來新的市場增量。

在目前的云市場中,火山引擎還排不上名次,IDC最新發(fā)布的《中國公有云服務市場(2022 下半年)跟蹤》報告顯示,目前公有云服務市場的市場份額排名前五名分別為:阿里云、華為云、中國電信天翼云、騰訊云和AWS,它們總共占據(jù)了72%以上的市場份額,其余的云服務廠家份額有限。

或許,以基礎(chǔ)服務切入大模型戰(zhàn)場的火山引擎,未來有機會借此一搏新的市場格局。

火山引擎或遇天花板

目前看,火山引擎這條路走得還算順利。火山引擎總裁譚待表示,目前國內(nèi)有數(shù)十家做大模型的企業(yè),七成已經(jīng)在火山引擎云上,包括AI技術(shù)公司MiniMax、智譜AI、昆侖萬維、毫末智行等。

關(guān)于“七成”的數(shù)據(jù)口徑,譚待的解釋是,該“七成”是火山引擎相關(guān)客戶與第三方機構(gòu)統(tǒng)計的大模型企業(yè)數(shù)量之比,而能獲得這么多客戶是因為機器學習平臺解決了算力輔助的問題。

這些客戶案例表明,火山引擎在大模型訓練領(lǐng)域已有一定立足之地。

不過,從長遠看,火山引擎也面臨挑戰(zhàn)。

一方面,有能力做大模型的公司畢竟是少數(shù),客戶規(guī)模的天花板很明顯。

據(jù)譚待透露,在火山引擎的大模型客戶中,通用大模型公司占比大約為三分之一,垂直行業(yè)公司占比約為三分之二。

分別來看,在通用大模型方面,雖然目前創(chuàng)業(yè)者眾,但大浪淘沙,最終留下的能有幾何?

一位互聯(lián)網(wǎng)投資人認為,中國版ChatGPT只會在5家公司里產(chǎn)生:BAT+字節(jié)+華為,因為大廠有錢有人有場景。

北京航空航天大學人工智能研究院教授吳文峻也有類似觀點,其在接受《中新經(jīng)緯》采訪時表示,在目前宣布進軍大模型的三四十家企業(yè)中,最后能做成的或許不超過一半。

當客戶數(shù)量有明顯的天花板時,火山引擎的前景可能也有了“瓶頸”。

而在垂直行業(yè)模型方面,客戶數(shù)量雖然很多,但也可能面臨阿里云、百度云等平臺的“狙擊”。

原因在于,阿里云、百度云均自帶通用大模型輸出的能力,基于此,企業(yè)可更方便的生成垂直模型。

比如阿里云,阿里云智能集團CTO周靖人在此前的媒體采訪中表示,阿里云會為企業(yè)提供一個專屬數(shù)據(jù)空間,企業(yè)將相關(guān)信息存入,且不需要做任何數(shù)據(jù)預處理,便可調(diào)用“通義千問”,一鍵式生成自己的行業(yè)專屬大模型。

而如果在沒有大模型的火山引擎上做垂直模型訓練,企業(yè)要操心的事顯然更多。

上述投資人認為,垂直模型企業(yè)一般很少會自己從頭做,而是找一個還不錯的Pre-Train過的大模型,在此基礎(chǔ)上做Instruction Tuning(指令微調(diào))。

在此方面,阿里云等平臺可能更有優(yōu)勢。

另一方面,未來云廠商的模式可能是賣模型+賣算力,而不只是賣算力。

Maas模型即服務的時代已經(jīng)到來,阿里云、百度云不僅支持專屬行業(yè)模型的生成,還支持中小企業(yè)甚至個人基于大模型直接開發(fā)應用,這就好比個人開發(fā)者基于安卓操作系統(tǒng)開發(fā)App。

換句話說,模型層在未來可能成為新的基礎(chǔ)設(shè)施。

李彥宏在36Kr專訪中更是斷言,未來企業(yè)在購買云計算時,不看底層算力,而是看大模型的優(yōu)劣。

這可能給火山引擎帶來一定沖擊,因為當大量中小企業(yè)或個人基于阿里云、百度云開發(fā)應用時,云廠商背后的算力也得到了間接調(diào)用,從而規(guī)模效應平攤了算力成本,最終使其基礎(chǔ)設(shè)施層面的服務也更具價格優(yōu)勢,這頗有點“降維打擊”的意思。

事實上,“價格戰(zhàn)”已經(jīng)開始了。

4月26日,在2023阿里云合作伙伴大會上,阿里云推出了史上最大規(guī)模的降價:核心產(chǎn)品價格全線下調(diào),降幅最高至50%。

不過,火山引擎對此好像比較樂觀,至少現(xiàn)階段如此。

其邏輯在于,一來火山引擎拿到的時間窗口還比較長,譚待認為,國內(nèi)距離全球最高水平的大模型還需要比較長的時間,現(xiàn)階段不可能用三四十分的模型去做應用,也不可能做好應用。

二來,火山引擎堅信未來是多云多模型時代,企業(yè)會避免單一依賴,而選擇使用多家云服務,同時,各行業(yè)都有自己高質(zhì)量的私有語料,會形成多模型生態(tài)。

言下之意可能是,市場很大,火山引擎總會有立足之地。

總而言之,大模型市場的未來撲朔迷離,參與其中的任何一員的前途均可能有變數(shù),“缺失”大模型的火山引擎如此,走務實路線的字節(jié)大模型也如此。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-05-04
大模型慢半拍,字節(jié)甘做“嫁衣”?
采寫/王舒然 編輯/萬天南 在大模型甚囂塵上的當下,一向高舉高打的字節(jié),卻一反常態(tài),低調(diào)得讓人不太習慣。 當百度、阿里、華為、36...

長按掃碼 閱讀全文