圍繞大模型的創(chuàng)業(yè)熱潮方興未艾,百度、阿里、360等互聯(lián)網(wǎng)巨頭均已下場,張一鳴開始抓大模型的消息也傳了許久,雖然字節(jié)跳動還沒有發(fā)布通用大模型產(chǎn)品,但其在大模型上的布局一直在進(jìn)行。
6月28日,字節(jié)跳動公布大模型業(yè)務(wù)最新進(jìn)展,旗下火山引擎發(fā)布大模型服務(wù)平臺“火山方舟”。這是一項針對B端的大模型業(yè)務(wù),其運(yùn)營模式是,火山引擎與大模型生產(chǎn)方合作,讓它們在平臺上提供大模型服務(wù),企業(yè)可同步試用多個大模型,選用更適合自身業(yè)務(wù)需要的模型組合?;鹕揭孀约翰蛔龃竽P?。
圖片來自火山引擎官網(wǎng)
本質(zhì)上,火山方舟還是一個MaaS(Model-as-a-Service)平臺,最終服務(wù)的是模型應(yīng)用方,也就是廣大企業(yè)客戶?;鹕揭嬷悄芩惴ㄘ?fù)責(zé)人吳迪認(rèn)為,火山方舟是一個精品店,里面是優(yōu)選的大模型服務(wù)。
而就在一個多星期以前,騰訊公布了行業(yè)大模型研發(fā)進(jìn)展,依托騰訊云TI平臺打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務(wù),助力客戶構(gòu)建專屬大模型及智能應(yīng)用。
更早之前,百度、阿里等大廠已經(jīng)官宣伙伴計劃和工具鏈,聲稱要讓每一個行業(yè)都能夠用上自己的大模型。
同為To B的大模型服務(wù),意圖都在加速大模型應(yīng)用落地,火山方舟和騰訊等推出的行業(yè)大模型服務(wù)有何不同?
“大家首先理念就不一致?!被鹕揭婵偛米T待向TechWeb等說到,“很多友商推出模型平臺,模型是自己做的,模型平臺是自己做的,各種體系也是自己做的,所以是很封閉的端到端?!薄盎鹕椒街凼且粋€開放的MaaS,行業(yè)這些模型都可以放在上面。”
火山引擎多次強(qiáng)調(diào)自己不做大模型,卻推出了大模型服務(wù)平臺,內(nèi)部是如何決定的?
為什么要做大模型服務(wù)平臺?
根據(jù)譚待的講述,他在過去半年接觸了很多企業(yè),絕大多數(shù)企業(yè)對大模型仍有困惑,不知道該如何使用。他認(rèn)為,選擇性價比合適的很重要。比如,有20個博士學(xué)位的人看上去很厲害,但是工資特別高,你要解一道小學(xué)數(shù)學(xué)題,可能并不需要這樣的人。
譚待認(rèn)為,企業(yè)使用大模型,未來可能會呈現(xiàn)“1+N”的模式,即通過自研或深度合作,形成1個主力模型,同時由于成本和場景復(fù)雜多元等原因,在主力模型之外,還會有N個模型同時應(yīng)用。
“大模型市場未來的發(fā)展趨勢一定是多云多模型,即少數(shù)超級大模型+多個大模型+更多個行業(yè)/垂類模型?!被谶@樣的判斷,火山引擎要做的就是把平臺做好。
火山方舟的多模型架構(gòu)支持企業(yè)同步試用多個大模型,選用更適合自身業(yè)務(wù)需要的模型組合,并提供模型精調(diào)、評測、推理等多項服務(wù)。
目前,“火山方舟”已經(jīng)集成了百川智能、出門問問、復(fù)旦大學(xué)MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI(以拼音首字母排序)等多家AI科技公司及科研院所的大模型,并已啟動邀測,首批邀測企業(yè)分布在金融、消費、汽車等眾多行業(yè)。
據(jù)悉,目前抖音集團(tuán)內(nèi)部已有十多個業(yè)務(wù)團(tuán)隊試用“火山方舟”,主要用于代碼糾錯等研發(fā)提效場景,文本分類、總結(jié)摘要等知識管理場景,以及數(shù)據(jù)標(biāo)注、歸因分析等方面。
如何服務(wù)好大模型企業(yè)?
話說回來,火山引擎自己沒有從0到1做過大模型,要如何服務(wù)好大模型企業(yè)來做這件事?
譚待坦言,這個顧慮是有道理的,但好在我們現(xiàn)在從0到1服務(wù)了很多企業(yè),所以不擔(dān)心了。
今年4月,火山引擎發(fā)布大模型訓(xùn)練云平臺,支持萬卡級大模型訓(xùn)練、微秒級延遲網(wǎng)絡(luò)。當(dāng)時,譚待對外披露,火山引擎已經(jīng)拿下國內(nèi)70%的大模型玩家。
MiniMax作為合作方,在分享中表示,火山引擎這一套機(jī)器學(xué)習(xí)平臺,已經(jīng)部署到了MiniMax的文本、視覺、聲音三個模態(tài)大模型訓(xùn)練和推理場景中。有穩(wěn)健的大模型基礎(chǔ)設(shè)施,MiniMax從零開始自主完整地跑通了大模型與用戶交互的迭代閉環(huán)。
“因為在訓(xùn)練端和這些大模型企業(yè)建立了很強(qiáng)的合作關(guān)系和信任感,它們也愿意把推理放到火山上?!弊T待表示,而訓(xùn)練和推理放在一起,可以大大節(jié)省企業(yè)的運(yùn)營成本。
長期來看,模型的推理開銷會超過訓(xùn)練開銷,降低推理成本會是大模型應(yīng)用落地的重要因素。吳迪補(bǔ)充說,“一個經(jīng)過良好精調(diào)的中小規(guī)格模型,在特定工作上的表現(xiàn)可能不亞于通用的、巨大的基座模型,而推理成本可以降低到原來的十分之一?!?/p>
據(jù)吳迪介紹,火山方舟已經(jīng)上線基于安全沙箱的大模型安全互信計算方案,利用計算隔離、存儲隔離、網(wǎng)絡(luò)隔離、流量審計等方式,實現(xiàn)了模型的機(jī)密性、完整性和可用性保證,適用于對訓(xùn)練和推理延時要求較低的客戶。
在算力方面,據(jù)《晚點 LatePost》報道,字節(jié)跳動今年向英偉達(dá)訂購了超過10億美元的GPU。對于AI算力的儲備情況,譚待回應(yīng)稱,“涉及商業(yè)機(jī)密,不方便披露。”
此前,火山引擎宣布與字節(jié)國內(nèi)業(yè)務(wù)并池?;趦?nèi)外統(tǒng)一的云原生基礎(chǔ)架構(gòu),抖音等業(yè)務(wù)的空閑計算資源可極速調(diào)度給火山引擎客戶使用,離線業(yè)務(wù)資源分鐘級調(diào)度10萬核CPU,在線業(yè)務(wù)資源也可潮汐復(fù)用。
字節(jié)通用大模型還在路上
雖然火山引擎不做大模型,但在研發(fā)大模型這件事上,字節(jié)是相當(dāng)認(rèn)真的,因為其創(chuàng)始人張一鳴非常重視AI相關(guān)產(chǎn)業(yè)。
早在2021年5月,張一鳴在內(nèi)部信中表示,“大家更容易關(guān)注商業(yè)模式的變化和品牌渠道的更新,很少注意到技術(shù)變革已經(jīng)在醞釀中。虛擬現(xiàn)實、生命科學(xué)、科學(xué)計算對人類生活的影響都已現(xiàn)黎明之曙光”。
2022年11月,AI聊天機(jī)器人ChatGPT橫空問世,引發(fā)全球新一輪AI熱潮,國內(nèi)外科技巨頭紛紛入局大模型。今年2月,36氪爆料,字節(jié)在大模型上已有布局,分別在語言和圖像兩種模態(tài)上發(fā)力。
其中,語言大模型團(tuán)隊由字節(jié)搜索部門牽頭,目前團(tuán)隊規(guī)模在十?dāng)?shù)人左右。圖片大模型團(tuán)隊則由產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團(tuán)隊牽頭。對此,字節(jié)方面承認(rèn)技術(shù)中臺在這些領(lǐng)域有探索,但還很初期,不成熟。
今年4月,張一鳴在2023公開信中強(qiáng)調(diào),“字節(jié)跳動無法錯過AGI?!彼_信AGI是抖音TikTok在全球發(fā)現(xiàn)新的增長機(jī)遇不可或缺的伙伴,可以解決字節(jié)跳動的第二曲線增長困境。
為了研究大模型,張一鳴做了大量功課。今年5月,《中國企業(yè)家雜志》報道稱,張一鳴最近在看OpenAI的一系列論文,并且常常讀至深夜。他想搞明白,太平洋對岸究竟發(fā)生了什么。
幾天后,張一鳴在香港成立了一家個人投資基金,名為Cool River Venture。據(jù)消息人士透露,該基金的主要投資方向是科技相關(guān)行業(yè)。
6月初,Tech星球消息稱,字節(jié)正在內(nèi)部測試一款A(yù)I對話類產(chǎn)品,目前暫時稱作“Grace”,該產(chǎn)品處于測試完善的階段。字節(jié)確認(rèn)了這一消息,稱Grace是一個AI對話類測試項目的內(nèi)部代號,目前還處于初級階段,僅用于內(nèi)部體驗測試。
由此來看,字節(jié)發(fā)布大模型產(chǎn)品只是時間問題。譚待表示,火山引擎不做大模型,字節(jié)內(nèi)部其他團(tuán)隊如果做好了模型,也會放到火山方舟上,對外提供服務(wù)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )