圍繞大模型的創(chuàng)業(yè)熱潮方興未艾,百度、阿里、360等互聯(lián)網巨頭均已下場,張一鳴開始抓大模型的消息也傳了許久,雖然字節(jié)跳動還沒有發(fā)布通用大模型產品,但其在大模型上的布局一直在進行。
6月28日,字節(jié)跳動公布大模型業(yè)務最新進展,旗下火山引擎發(fā)布大模型服務平臺“火山方舟”。這是一項針對B端的大模型業(yè)務,其運營模式是,火山引擎與大模型生產方合作,讓它們在平臺上提供大模型服務,企業(yè)可同步試用多個大模型,選用更適合自身業(yè)務需要的模型組合?;鹕揭孀约翰蛔龃竽P汀?/p>
圖片來自火山引擎官網
本質上,火山方舟還是一個MaaS(Model-as-a-Service)平臺,最終服務的是模型應用方,也就是廣大企業(yè)客戶?;鹕揭嬷悄芩惴ㄘ撠熑藚堑险J為,火山方舟是一個精品店,里面是優(yōu)選的大模型服務。
而就在一個多星期以前,騰訊公布了行業(yè)大模型研發(fā)進展,依托騰訊云TI平臺打造行業(yè)大模型精選商店,為客戶提供MaaS(Model-as-a-Service)一站式服務,助力客戶構建專屬大模型及智能應用。
更早之前,百度、阿里等大廠已經官宣伙伴計劃和工具鏈,聲稱要讓每一個行業(yè)都能夠用上自己的大模型。
同為To B的大模型服務,意圖都在加速大模型應用落地,火山方舟和騰訊等推出的行業(yè)大模型服務有何不同?
“大家首先理念就不一致?!被鹕揭婵偛米T待向TechWeb等說到,“很多友商推出模型平臺,模型是自己做的,模型平臺是自己做的,各種體系也是自己做的,所以是很封閉的端到端。”“火山方舟是一個開放的MaaS,行業(yè)這些模型都可以放在上面?!?/p>
火山引擎多次強調自己不做大模型,卻推出了大模型服務平臺,內部是如何決定的?
為什么要做大模型服務平臺?
根據(jù)譚待的講述,他在過去半年接觸了很多企業(yè),絕大多數(shù)企業(yè)對大模型仍有困惑,不知道該如何使用。他認為,選擇性價比合適的很重要。比如,有20個博士學位的人看上去很厲害,但是工資特別高,你要解一道小學數(shù)學題,可能并不需要這樣的人。
譚待認為,企業(yè)使用大模型,未來可能會呈現(xiàn)“1+N”的模式,即通過自研或深度合作,形成1個主力模型,同時由于成本和場景復雜多元等原因,在主力模型之外,還會有N個模型同時應用。
“大模型市場未來的發(fā)展趨勢一定是多云多模型,即少數(shù)超級大模型+多個大模型+更多個行業(yè)/垂類模型?!被谶@樣的判斷,火山引擎要做的就是把平臺做好。
火山方舟的多模型架構支持企業(yè)同步試用多個大模型,選用更適合自身業(yè)務需要的模型組合,并提供模型精調、評測、推理等多項服務。
目前,“火山方舟”已經集成了百川智能、出門問問、復旦大學MOSS、IDEA研究院、瀾舟科技、MiniMax、智譜AI(以拼音首字母排序)等多家AI科技公司及科研院所的大模型,并已啟動邀測,首批邀測企業(yè)分布在金融、消費、汽車等眾多行業(yè)。
據(jù)悉,目前抖音集團內部已有十多個業(yè)務團隊試用“火山方舟”,主要用于代碼糾錯等研發(fā)提效場景,文本分類、總結摘要等知識管理場景,以及數(shù)據(jù)標注、歸因分析等方面。
如何服務好大模型企業(yè)?
話說回來,火山引擎自己沒有從0到1做過大模型,要如何服務好大模型企業(yè)來做這件事?
譚待坦言,這個顧慮是有道理的,但好在我們現(xiàn)在從0到1服務了很多企業(yè),所以不擔心了。
今年4月,火山引擎發(fā)布大模型訓練云平臺,支持萬卡級大模型訓練、微秒級延遲網絡。當時,譚待對外披露,火山引擎已經拿下國內70%的大模型玩家。
MiniMax作為合作方,在分享中表示,火山引擎這一套機器學習平臺,已經部署到了MiniMax的文本、視覺、聲音三個模態(tài)大模型訓練和推理場景中。有穩(wěn)健的大模型基礎設施,MiniMax從零開始自主完整地跑通了大模型與用戶交互的迭代閉環(huán)。
“因為在訓練端和這些大模型企業(yè)建立了很強的合作關系和信任感,它們也愿意把推理放到火山上?!弊T待表示,而訓練和推理放在一起,可以大大節(jié)省企業(yè)的運營成本。
長期來看,模型的推理開銷會超過訓練開銷,降低推理成本會是大模型應用落地的重要因素。吳迪補充說,“一個經過良好精調的中小規(guī)格模型,在特定工作上的表現(xiàn)可能不亞于通用的、巨大的基座模型,而推理成本可以降低到原來的十分之一?!?/p>
據(jù)吳迪介紹,火山方舟已經上線基于安全沙箱的大模型安全互信計算方案,利用計算隔離、存儲隔離、網絡隔離、流量審計等方式,實現(xiàn)了模型的機密性、完整性和可用性保證,適用于對訓練和推理延時要求較低的客戶。
在算力方面,據(jù)《晚點 LatePost》報道,字節(jié)跳動今年向英偉達訂購了超過10億美元的GPU。對于AI算力的儲備情況,譚待回應稱,“涉及商業(yè)機密,不方便披露?!?/p>
此前,火山引擎宣布與字節(jié)國內業(yè)務并池?;趦韧饨y(tǒng)一的云原生基礎架構,抖音等業(yè)務的空閑計算資源可極速調度給火山引擎客戶使用,離線業(yè)務資源分鐘級調度10萬核CPU,在線業(yè)務資源也可潮汐復用。
字節(jié)通用大模型還在路上
雖然火山引擎不做大模型,但在研發(fā)大模型這件事上,字節(jié)是相當認真的,因為其創(chuàng)始人張一鳴非常重視AI相關產業(yè)。
早在2021年5月,張一鳴在內部信中表示,“大家更容易關注商業(yè)模式的變化和品牌渠道的更新,很少注意到技術變革已經在醞釀中。虛擬現(xiàn)實、生命科學、科學計算對人類生活的影響都已現(xiàn)黎明之曙光”。
2022年11月,AI聊天機器人ChatGPT橫空問世,引發(fā)全球新一輪AI熱潮,國內外科技巨頭紛紛入局大模型。今年2月,36氪爆料,字節(jié)在大模型上已有布局,分別在語言和圖像兩種模態(tài)上發(fā)力。
其中,語言大模型團隊由字節(jié)搜索部門牽頭,目前團隊規(guī)模在十數(shù)人左右。圖片大模型團隊則由產品研發(fā)與工程架構部下屬的智能創(chuàng)作團隊牽頭。對此,字節(jié)方面承認技術中臺在這些領域有探索,但還很初期,不成熟。
今年4月,張一鳴在2023公開信中強調,“字節(jié)跳動無法錯過AGI?!彼_信AGI是抖音TikTok在全球發(fā)現(xiàn)新的增長機遇不可或缺的伙伴,可以解決字節(jié)跳動的第二曲線增長困境。
為了研究大模型,張一鳴做了大量功課。今年5月,《中國企業(yè)家雜志》報道稱,張一鳴最近在看OpenAI的一系列論文,并且常常讀至深夜。他想搞明白,太平洋對岸究竟發(fā)生了什么。
幾天后,張一鳴在香港成立了一家個人投資基金,名為Cool River Venture。據(jù)消息人士透露,該基金的主要投資方向是科技相關行業(yè)。
6月初,Tech星球消息稱,字節(jié)正在內部測試一款AI對話類產品,目前暫時稱作“Grace”,該產品處于測試完善的階段。字節(jié)確認了這一消息,稱Grace是一個AI對話類測試項目的內部代號,目前還處于初級階段,僅用于內部體驗測試。
由此來看,字節(jié)發(fā)布大模型產品只是時間問題。譚待表示,火山引擎不做大模型,字節(jié)內部其他團隊如果做好了模型,也會放到火山方舟上,對外提供服務。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )