9月19日消息,2024云棲大會(huì)上,阿里云CTO周靖人發(fā)布通義千問(wèn)新一代開(kāi)源模型Qwen2.5,旗艦?zāi)P蚎wen2.5-72B性能超越Llama 405B,再登全球開(kāi)源大模型王座。
Qwen2.5全系列涵蓋多個(gè)尺寸的大語(yǔ)言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,每個(gè)尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本,總計(jì)上架100多個(gè)模型,刷新業(yè)界紀(jì)錄。
據(jù)介紹,Qwen2.5全系列模型都在18T tokens數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,相比Qwen2,整體性能提升18%以上,擁有更多的知識(shí)、更強(qiáng)的編程和數(shù)學(xué)能力。Qwen2.5-72B模型在MMLU-rudex基準(zhǔn)(考察通用知識(shí))、MBPP 基準(zhǔn)(考察代碼能力)和MATH基準(zhǔn)(考察數(shù)學(xué)能力)的得分高達(dá)86.8、88.2、83.1。
Qwen2.5支持高達(dá)128K的上下文長(zhǎng)度,可生成最多8K內(nèi)容。模型擁有強(qiáng)大的多語(yǔ)言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 種以上語(yǔ)言。模型能夠絲滑響應(yīng)多樣化的系統(tǒng)提示,實(shí)現(xiàn)角色扮演和聊天機(jī)器人等任務(wù)。在指令跟隨、理解結(jié)構(gòu)化數(shù)據(jù)(如表格)、生成結(jié)構(gòu)化輸出(尤其是JSON)等方面Qwen2.5都進(jìn)步明顯。
語(yǔ)言模型方面,Qwen2.5開(kāi)源了7個(gè)尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,它們?cè)谕葏?shù)賽道都創(chuàng)造了業(yè)界最佳成績(jī),型號(hào)設(shè)定充分考慮下游場(chǎng)景的不同需求,3B是適配手機(jī)等端側(cè)設(shè)備的黃金尺寸;32B是最受開(kāi)發(fā)者期待的“性?xún)r(jià)比之王”,可在性能和功耗之間獲得最佳平衡,Qwen2.5-32B的整體表現(xiàn)超越了Qwen2-72B。
在MMLU-redux等十多個(gè)基準(zhǔn)測(cè)評(píng)中,Qwen2.5-72B表現(xiàn)超越Llama3.1-405B
72B是Qwen2.5系列的旗艦?zāi)P?,其指令跟隨版本Qwen2.5-72B-Instruct在MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E等權(quán)威測(cè)評(píng)中表現(xiàn)出色,在多個(gè)核心任務(wù)上,以不到1/5的參數(shù)超越了擁有4050億巨量參數(shù)的Llama3.1-405B,繼續(xù)穩(wěn)居“全球最強(qiáng)開(kāi)源大模型”的位置。
專(zhuān)項(xiàng)模型方面,用于編程的 Qwen2.5-Coder 和用于數(shù)學(xué)的 Qwen2.5-Math都比前代有了實(shí)質(zhì)性進(jìn)步。Qwen2.5-Coder 在多達(dá)5.5T tokens 的編程相關(guān)數(shù)據(jù)上作了訓(xùn)練,當(dāng)天開(kāi)源1.5B和7B版本,未來(lái)還將開(kāi)源32B版本;Qwen2.5-Math支持使用思維鏈和工具集成推理(TIR) 解決中英雙語(yǔ)的數(shù)學(xué)題,是迄今為止最先進(jìn)的開(kāi)源數(shù)學(xué)模型系列,本次開(kāi)源了1.5B、7B、72B三個(gè)尺寸和一款數(shù)學(xué)獎(jiǎng)勵(lì)模型Qwen2.5-Math-RM。
多模態(tài)模型方面,廣受期待的視覺(jué)語(yǔ)言模型Qwen2-VL-72B正式開(kāi)源,Qwen2-VL能識(shí)別不同分辨率和長(zhǎng)寬比的圖片,理解20分鐘以上長(zhǎng)視頻,具備自主操作手機(jī)和機(jī)器人的視覺(jué)智能體能力。日前權(quán)威測(cè)評(píng)LMSYS Chatbot Arena Leaderboard發(fā)布最新一期的視覺(jué)模型性能測(cè)評(píng)結(jié)果,Qwen2-VL-72B成為全球得分最高的開(kāi)源模型。
Qwen2-VL-72B在權(quán)威測(cè)評(píng)LMSYS Chatbot Arena Leaderboard成為成為全球得分最高的開(kāi)源視覺(jué)理解模型
自從2023年8月開(kāi)源以來(lái),通義在全球開(kāi)源大模型領(lǐng)域后來(lái)居上,成為開(kāi)發(fā)者尤其是中國(guó)開(kāi)發(fā)者的首選模型。性能上,通義大模型日拱一卒,逐步趕超美國(guó)最強(qiáng)開(kāi)源模型Llama,多次登頂Hugging Face全球大模型榜單;生態(tài)上,通義從零起步、開(kāi)疆拓土,與海內(nèi)外的開(kāi)源社區(qū)、生態(tài)伙伴、開(kāi)發(fā)者共建生態(tài)網(wǎng)絡(luò),截至2024年9月中旬,通義千問(wèn)開(kāi)源模型下載量突破4000萬(wàn),Qwen系列衍生模型總數(shù)超過(guò)5萬(wàn)個(gè),成為僅次于Llama的世界級(jí)模型群。
HuggingFace數(shù)據(jù)顯示,截至9月中旬Qwen系列原生模型和衍生模型總數(shù)超過(guò)5萬(wàn)個(gè)
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 一汽大眾宣布高層調(diào)整:潘占福不再擔(dān)任黨委書(shū)記、總經(jīng)理
- 2024年新能源汽車(chē)行業(yè)發(fā)展迅猛,關(guān)鍵技術(shù)加速落地
- 周鴻祎談o3大模型:關(guān)于A(yíng)GI 的定義,可能得改改了
- 小米汽車(chē)與蔚來(lái)達(dá)成充電補(bǔ)能網(wǎng)絡(luò)合作
- 辛巴淚撒直播間自曝患病
- 美團(tuán):定制“擦邊騎手服”惡意博流量,將依法追究責(zé)任
- 王化辟謠“小米年底大規(guī)模裁員”:造謠者缺乏起碼的常識(shí)
- 螞蟻集團(tuán)進(jìn)行全面架構(gòu)升級(jí),CTO線(xiàn)大規(guī)模調(diào)整
- 蔚來(lái)智能駕駛重大調(diào)整:組織架構(gòu)重組,力推端到端解決方案
- 三星將向國(guó)內(nèi)手機(jī)廠(chǎng)商提供多樣化高端屏幕,本土廠(chǎng)商競(jìng)爭(zhēng)加劇
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。