(計育青/文)如今各行各業(yè)都對AI大模型非常關(guān)注,期待著越來越多好用易用、低成本的AI應(yīng)用能夠改變我們的工作和生活。近日,零一萬物公司發(fā)布了多款AI模型,以其突出的表現(xiàn)吸引了業(yè)界的廣泛關(guān)注。
零一萬物此次發(fā)布了具有千億參數(shù)規(guī)模的閉源模型Yi-Large,在斯坦福最新的AlpacaEval 2.0全球大模型排行榜上贏率名列第一。零一萬物還推出了多款參數(shù)規(guī)模較小的開源模型,這些模型在多種第三方測試中都做到了同等級別模型SOTA性能最佳。零一萬物CEO李開復(fù)表示,零一萬物的目標(biāo)是打造普惠型、全球化的AI大模型,讓人人都能從中受益。
Yi-Large躋身全球SOTA頂級大模型行列
2023年11月,零一萬物曾發(fā)布了Yi-34B大模型,雖然參數(shù)規(guī)模并不大,但評測結(jié)果卻超越了Llama2-70B、Falcon-180B等大規(guī)模模型,成為當(dāng)時全球最強(qiáng)的開源基礎(chǔ)模型之一。時隔半年,零一萬物又推出了千億參數(shù)規(guī)模的Yi-Large,性能表現(xiàn)更是經(jīng)驗。
據(jù)李開復(fù)介紹,第三方權(quán)威評測結(jié)果表明,零一萬物Yi-Large的中英文雙語表現(xiàn)都非常出色。在最新的斯坦福AlpacaEval 2.0榜單上,Yi-Large模型的英語能力主要指標(biāo)“控制回復(fù)的長度”名列世界第二,僅次于GPT-4 Turbo。在此之前,國內(nèi)大模型僅有零一萬物和Qwen曾經(jīng)登上此榜單的前20名。在中文能力方面,SuperCLUE發(fā)布的四月評測報告中,Yi-Large位列國產(chǎn)大模型之首,而且綜合中英雙語能力都表現(xiàn)優(yōu)異。在更全面的綜合評測中,Yi-Large有多數(shù)指標(biāo)超越了GPT4、Claude3、Google Gemini 1.5等同級模型,在通用能力、代碼生成、數(shù)學(xué)推理、指令遵循等方面都位居領(lǐng)先,穩(wěn)列全球第一梯隊。
李開復(fù)表示,一系列權(quán)威測評表明,Yi-Large是當(dāng)前可用的最好的AI大模型,不過零一萬物仍在繼續(xù)創(chuàng)新,正在訓(xùn)練規(guī)模更大的新模型Yi-XLarge。Yi-XLarge將是一種混合專家大模型(MoE),雖然尚未完成最終訓(xùn)練,但是在一些權(quán)威評測中仍然做到了與Claude-3-Opus、GPT4-0409最新旗艦級模型互有勝負(fù),非常值得期待。
Yi-1.5開源大模型實現(xiàn)普惠式服務(wù)
Yi-Large是面向商用市場的閉源大模型,不過零一萬物此次也帶來了新升級的開源系列模型Yi-1.5,包括34B、9B、6B 三個不同規(guī)模的版本和Yi-1.5-Chat微調(diào)模型。測評結(jié)果表明,Yi-1.5系列模型在數(shù)學(xué)推理、代碼能力、指令遵循等方面表現(xiàn)很突出,遠(yuǎn)勝同參數(shù)規(guī)模的其它模型,也優(yōu)于近期發(fā)布的Llama-3-8B-Instruct模型。
李開復(fù)表示,很多學(xué)生、創(chuàng)業(yè)者、老師、科研人員、公益組織都需要學(xué)習(xí)、探索和使用大模型,但是可能無法承擔(dān)GPT-4、Yi-Large等商業(yè)閉源大模型的成本,因此推出開源的AI大模型非常重要。零一萬物的策略是以開源模型構(gòu)建生態(tài)、提供普惠式服務(wù),吸引科研院校、學(xué)生、開發(fā)者、創(chuàng)業(yè)者在此基礎(chǔ)上開展教學(xué)和創(chuàng)新,豐富生態(tài)、拓展應(yīng)用;同時,以閉源模型展開前沿探索,服務(wù)對先進(jìn)AI大模型有迫切需求的前沿企業(yè)。開源閉源雙軌體系構(gòu)成了良好的生態(tài)環(huán)境,加快AI技術(shù)和應(yīng)用的迭代進(jìn)步。
為幫助業(yè)界快速接入全球領(lǐng)先的AI大模型,零一萬物此次不僅發(fā)布了閉源、開源的系列模型,還推出了面向個人用戶的“萬知”服務(wù)、賦能行業(yè)伙伴的“API 開放平臺”。李開復(fù)表示,使用“萬知”服務(wù)很方便,一是在微信上搜索“萬知”小程序,二是登錄wanzhi.com。“萬知”的作用不僅僅是一個對話工具,它也可以分析海量數(shù)據(jù),處理文字、圖表等信息,自動生成PPT等文檔,成為一種高效的工作助手、生產(chǎn)力工具。零一萬物的“API 開放平臺”面向商用市場,不過設(shè)計非常周到,既有調(diào)用大規(guī)模AI模型的Yi-Large-RAG API和Yi-Large-Turbo API,也有調(diào)用中小規(guī)模AI模型的Yi-Medium API、Yi-Vision API,以及調(diào)用超小規(guī)模模型的Yi-Spark API,成本從高到低,客戶可以各取所需。
“零一萬物API的特色是既追求最高的性能,又追求很好的性價比。”李開復(fù)說。
發(fā)展AI大模型也要講求成本收益
人們通常認(rèn)為,AI大模型就是要靠越來越復(fù)雜的算法、越來越強(qiáng)的算力基礎(chǔ)設(shè)施來支撐,這導(dǎo)致每一家AI模型開發(fā)企業(yè)都在持續(xù)投入巨資建設(shè)算力,而收益卻遠(yuǎn)遠(yuǎn)跟不上。李開復(fù)認(rèn)為,AI大模型的競爭不是一場短程賽跑,更像是一場比拼耐力的長跑,每一個身處其間的選手都應(yīng)該關(guān)注投資和收益,設(shè)法降低訓(xùn)練成本、用戶調(diào)用API的價格,并且根據(jù)實際應(yīng)用需求,務(wù)實地壓縮模型規(guī)模。
零一萬物有自己的獨特優(yōu)勢,比如全球化布局,模型與算力架構(gòu)綜合研發(fā)能力等。零一萬物是一家面對全世界開展服務(wù)的AI企業(yè),在美歐等市場都開展業(yè)務(wù),因此可以發(fā)展更快的國外經(jīng)驗引入國內(nèi)市場,包括成本優(yōu)化、模型規(guī)模調(diào)整、市場策略等,從而使得在國內(nèi)開發(fā)的產(chǎn)品從一開始就能很好地適應(yīng)市場需求,并且能很快獲得收益。李開復(fù)告訴記者,零一萬物已經(jīng)有產(chǎn)品在海外市場上線了九個月,贏得了千萬級用戶規(guī)模,在行業(yè)市場上也與部分世界500強(qiáng)企業(yè)達(dá)成了深度合作關(guān)系。另一方面,零一萬物不僅僅從事大模型開發(fā),同時也有自己的專業(yè)算力架構(gòu)團(tuán)隊,能夠從底層算力的層面對模型進(jìn)行優(yōu)化,因此整體訓(xùn)練成本比只做大模型開發(fā)的企業(yè)低一半左右,而且可以用有限的算力資源來打造性能極致的大模型產(chǎn)品。
李開復(fù)表示,美國一些先進(jìn)的企業(yè)可以大量堆砌先進(jìn)GPU算力,中國企業(yè)則沒有這個條件,必須采取更加務(wù)實的策略,加強(qiáng)對AI+算力架構(gòu)的綜合開發(fā),這其實也是美國AI研發(fā)企業(yè)的共識??偟膩碚f,就是做AI模型研究必須要“向下走”,具備一定的計算效率優(yōu)化能力。經(jīng)過優(yōu)化,零一萬物千億參數(shù)模型的訓(xùn)練成本同比降幅達(dá)一倍之多。以“萬知”服務(wù)為例,零一萬物利用自研的基于全導(dǎo)航圖的新型向量數(shù)據(jù)庫笛卡爾訓(xùn)練,大大縮減了“萬知”的訓(xùn)練速度和成本,與采用第三方的向量數(shù)據(jù)庫相比,節(jié)約成本超過80%。
從2023年9月開始,零一萬物先后在海外推出了4款產(chǎn)品,面向個人用戶的大模型產(chǎn)品也成功打通了用戶訂閱制的商業(yè)模式。李開復(fù)最后強(qiáng)調(diào),AI大模型的推廣應(yīng)用將是一個長期的過程,不能依靠免費推廣、持續(xù)大投入研發(fā)升級的模式來爭奪市場。一個更合理的模式是發(fā)展性能優(yōu)異、規(guī)模合理、高性價比的AI大模型產(chǎn)品體系,以不同層次的閉源大模型賦能產(chǎn)業(yè)伙伴、服務(wù)商業(yè)客戶,以適當(dāng)性能的開源模型促進(jìn)生態(tài)建設(shè)、激活應(yīng)用需求?!敖酉聛?,零一萬物將立足全球市場,亦不斷升級的大模型應(yīng)用助力中國建設(shè)普惠型AI時代?!崩铋_復(fù)說。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 消息稱OpenAI新模型GPT-5研發(fā)未達(dá)到預(yù)期:成本高昂 效果欠佳
- OpenAI宣布o(jì)3系列大模型:能力較o1大幅提升 Codeforces測試強(qiáng)于OpenAI首席科學(xué)家
- 豆包大模型全面升級,相關(guān)概念股瘋漲,字節(jié)發(fā)布緊急警示
- 奇富科技發(fā)布AI產(chǎn)品小奇等金融AI大模型成果
- 揭秘:OpenAI 即將推出 o3,新一代AI推理王者,能否顛覆業(yè)界?
- “蘋果智能”引發(fā)討論:AI總結(jié)新聞?wù)龃箦e
- Grammarly重磅新功能:收購AI公司Coda,推出大模型LLM助手,語法檢查更高效
- 谷歌攜手Apptronik引領(lǐng)人形機(jī)器人商業(yè)化浪潮:AI+機(jī)器人新紀(jì)元揭幕
- AI初創(chuàng)公司Perplexity完成新一輪融資 估值從年初5億美元升至90億美元
- 哥倫比亞大學(xué)研究:大語言模型能否超越人類大腦引發(fā)深思
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。