通義千問開源!8月3日,AI模型社區(qū)魔搭ModelScope上架兩款開源模型Qwen-7B和Qwen-7B-Chat,阿里云確認其為通義千問70億參數(shù)通用模型和對話模型,兩款模型均開源、免費、可商用。在多個權威測評中,通義千問7B模型取得了遠超國內外同等尺寸模型的效果,成為當下業(yè)界最強的中英文7B開源模型。
今年4月,阿里云推出自研大模型通義千問,引發(fā)井噴式的市場需求。此次小型化模型版本開源,有望抹平模型使用門檻,讓海量中小企業(yè)和AI開發(fā)者更早、更快地用上通義千問。這一舉動也讓阿里云成為國內首個加入大模型開源行列的大型科技企業(yè)。
Qwen-7B是支持中、英等多種語言的基座模型,在超過2萬億token數(shù)據(jù)集上訓練,上下文窗口長度達到8k。Qwen-7B-Chat是基于基座模型的中英文對話模型,已實現(xiàn)與人類認知對齊。開源代碼支持對Qwen-7B和Qwen-7B-Chat的量化,支持用戶在消費級顯卡上部署和運行模型。
用戶既可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺訪問和調用Qwen-7B和Qwen-7B-Chat,阿里云為用戶提供包括模型訓練、推理、部署、精調等在內的全方位服務。
通義千問7B預訓練模型在多個權威基準測評中表現(xiàn)出色,中英文能力遠超國內外同等規(guī)模開源模型,部分能力甚至“躍級”趕超12B、13B尺寸開源模型。
在英文能力測評基準MMLU上,通義千問7B模型得分超過一眾7B、12B、13B主流開源模型。該基準包含57個學科的英文題目,考驗人文、社科、理工等領域的綜合知識和問題解決能力。
在中文常識能力測評基準C-Eval上,通義千問在驗證集和測試集中都是得分最高的7B開源模型,展現(xiàn)了扎實的中文能力。相比英文世界熱鬧的AI開源生態(tài),中文社區(qū)缺少優(yōu)秀的基座模型。通義千問的加入有望為開源社區(qū)提供更多選擇,推動中國AI開源生態(tài)建設。
在數(shù)學解題能力評測GSM8K、代碼能力評測HumanEval等基準上,通義千問7B模型也有不俗表現(xiàn),勝過所有同等尺寸開源模型和和部分大尺寸開源模型。
阿里云表示,開源大模型可以幫助用戶簡化模型訓練和部署的過程,用戶不必從頭訓練模型,只需下載預訓練好的模型并進行微調,就可快速構建高質量的模型。
開源生態(tài)對促進中國大模型的技術進步與應用落地至關重要。今年7月,阿里云宣布將促進中國大模型生態(tài)的繁榮作為首要目標,向大模型創(chuàng)業(yè)公司提供智能算力、開發(fā)工具等全方位服務。2022年阿里云牽頭發(fā)起AI模型社區(qū)魔搭,以AI模型為核心服務AI開發(fā)者。目前,魔搭聚集了20多家頂尖人工智能機構貢獻的1000多款開源模型,已經成為中國大模型開源第一門戶。
附:開源地址
魔搭ModelScope:
https://modelscope.cn/models/qwen/Qwen-7B/summary
https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary
Hugging Face:https://huggingface.co/Qwen
GitHub:https://github.com/QwenLM/Qwen-7B
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )