阿里云大模型開源!通義千問7B參數(shù)模型上線魔搭,免費(fèi)可商用

通義千問開源!8月3日,AI模型社區(qū)魔搭ModelScope上架兩款開源模型Qwen-7B和Qwen-7B-Chat,阿里云確認(rèn)其為通義千問70億參數(shù)通用模型和對(duì)話模型,兩款模型均開源、免費(fèi)、可商用。在多個(gè)權(quán)威測(cè)評(píng)中,通義千問7B模型取得了遠(yuǎn)超國(guó)內(nèi)外同等尺寸模型的效果,成為當(dāng)下業(yè)界最強(qiáng)的中英文7B開源模型。

今年4月,阿里云推出自研大模型通義千問,引發(fā)井噴式的市場(chǎng)需求。此次小型化模型版本開源,有望抹平模型使用門檻,讓海量中小企業(yè)和AI開發(fā)者更早、更快地用上通義千問。這一舉動(dòng)也讓阿里云成為國(guó)內(nèi)首個(gè)加入大模型開源行列的大型科技企業(yè)。

Qwen-7B是支持中、英等多種語言的基座模型,在超過2萬億token數(shù)據(jù)集上訓(xùn)練,上下文窗口長(zhǎng)度達(dá)到8k。Qwen-7B-Chat是基于基座模型的中英文對(duì)話模型,已實(shí)現(xiàn)與人類認(rèn)知對(duì)齊。開源代碼支持對(duì)Qwen-7B和Qwen-7B-Chat的量化,支持用戶在消費(fèi)級(jí)顯卡上部署和運(yùn)行模型。

用戶既可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺(tái)訪問和調(diào)用Qwen-7B和Qwen-7B-Chat,阿里云為用戶提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的全方位服務(wù)。

阿里云大模型開源!通義千問7B參數(shù)模型上線魔搭,免費(fèi)可商用.jpg

通義千問7B預(yù)訓(xùn)練模型在多個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)中表現(xiàn)出色,中英文能力遠(yuǎn)超國(guó)內(nèi)外同等規(guī)模開源模型,部分能力甚至“躍級(jí)”趕超12B、13B尺寸開源模型。

在英文能力測(cè)評(píng)基準(zhǔn)MMLU上,通義千問7B模型得分超過一眾7B、12B、13B主流開源模型。該基準(zhǔn)包含57個(gè)學(xué)科的英文題目,考驗(yàn)人文、社科、理工等領(lǐng)域的綜合知識(shí)和問題解決能力。

在中文常識(shí)能力測(cè)評(píng)基準(zhǔn)C-Eval上,通義千問在驗(yàn)證集和測(cè)試集中都是得分最高的7B開源模型,展現(xiàn)了扎實(shí)的中文能力。相比英文世界熱鬧的AI開源生態(tài),中文社區(qū)缺少優(yōu)秀的基座模型。通義千問的加入有望為開源社區(qū)提供更多選擇,推動(dòng)中國(guó)AI開源生態(tài)建設(shè)。

阿里云大模型開源!通義千問7B參數(shù)模型上線魔搭.jpg

在數(shù)學(xué)解題能力評(píng)測(cè)GSM8K、代碼能力評(píng)測(cè)HumanEval等基準(zhǔn)上,通義千問7B模型也有不俗表現(xiàn),勝過所有同等尺寸開源模型和和部分大尺寸開源模型。

阿里云表示,開源大模型可以幫助用戶簡(jiǎn)化模型訓(xùn)練和部署的過程,用戶不必從頭訓(xùn)練模型,只需下載預(yù)訓(xùn)練好的模型并進(jìn)行微調(diào),就可快速構(gòu)建高質(zhì)量的模型。

開源生態(tài)對(duì)促進(jìn)中國(guó)大模型的技術(shù)進(jìn)步與應(yīng)用落地至關(guān)重要。今年7月,阿里云宣布將促進(jìn)中國(guó)大模型生態(tài)的繁榮作為首要目標(biāo),向大模型創(chuàng)業(yè)公司提供智能算力、開發(fā)工具等全方位服務(wù)。2022年阿里云牽頭發(fā)起AI模型社區(qū)魔搭,以AI模型為核心服務(wù)AI開發(fā)者。目前,魔搭聚集了20多家頂尖人工智能機(jī)構(gòu)貢獻(xiàn)的1000多款開源模型,已經(jīng)成為中國(guó)大模型開源第一門戶。

附:開源地址

魔搭ModelScope:

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face:https://huggingface.co/Qwen

GitHub:https://github.com/QwenLM/Qwen-7B

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2023-08-03
阿里云大模型開源!通義千問7B參數(shù)模型上線魔搭,免費(fèi)可商用
通義千問開源!8月3日,AI模型社區(qū)魔搭ModelScope上架兩款開源模型Qwen-7B和Qwen-7B-Chat,阿里云確認(rèn)其為通義千問70億參數(shù)通用模型和對(duì)話模型,兩款模型均開源、免費(fèi)、可商用。

長(zhǎng)按掃碼 閱讀全文