首屆通義千問AI挑戰(zhàn)賽開賽,參賽者可暢玩通義開源模型家族

12月1日,首屆“通義千問AI挑戰(zhàn)賽”開賽,參賽者可免費(fèi)暢玩通義開源模型家族,包括剛剛發(fā)布的720億參數(shù)模型Qwen-72B。主辦方為參賽者提供價(jià)值50萬元的免費(fèi)云上算力和豐厚獎金。賽事分為算法和Agent兩大賽道,前者聚焦通義千問大模型的微調(diào)訓(xùn)練,希望通過高質(zhì)量的數(shù)據(jù)探索開源模型的代碼能力上限,后者鼓勵開發(fā)者基于通義千問大模型和魔搭社區(qū)的Agent-Builder框架開發(fā)新一代AI應(yīng)用,促進(jìn)大模型在各行各業(yè)的落地應(yīng)用。即日起開發(fā)者可通過天池平臺報(bào)名參賽。

通義千問720億參數(shù)模型宣布開源,部分性能超越閉源GPT-4

新浪科技訊 12月1日午間消息,阿里云通義千問720億參數(shù)模型Qwen-72B今日宣布開源。該模型基于3T tokens高質(zhì)量數(shù)據(jù)訓(xùn)練,在10個權(quán)威基準(zhǔn)測評中奪得開源模型最優(yōu)成績,在部分測評中超越閉源的GPT-3.5和GPT-4。

在英語任務(wù)上,Qwen-72B在MMLU基準(zhǔn)測試取得開源模型最高分;中文任務(wù)上,Qwen-72B在C-Eval、CMMLU、GaokaoBench等基準(zhǔn)得分超越GPT-4;數(shù)學(xué)推理方面,Qwen-72B在GSM8K、MATH測評中斷層式領(lǐng)先其他開源模型;代碼理解方面,Qwen-72B在HumanEval、MBPP等測評中的表現(xiàn)大幅提升,代碼能力有了質(zhì)的飛躍。

據(jù)介紹,Qwen-72B可以處理最多32k的長文本輸入,在長文本理解測試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發(fā)團(tuán)隊(duì)優(yōu)化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游應(yīng)用集成。比如,Qwen-72B搭載了強(qiáng)大的系統(tǒng)指令(System Prompt)能力,用戶只用一句提示詞就可定制AI助手,要求大模型扮演某個角色或者執(zhí)行特定的回復(fù)任務(wù)。

隨著Qwen-72B的開源,通義千問還開源了18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。至此,通義千問共開源18億、70億、140億、720億參數(shù)的4款大語言模型,以及視覺理解、音頻理解兩款多模態(tài)大模型,實(shí)現(xiàn)“全尺寸、全模態(tài)”開源。

業(yè)界最強(qiáng)開源模型,填補(bǔ)中國LLM開源領(lǐng)域空白

在10大權(quán)威測評中,通義千問720億參數(shù)模型獲得開源模型最優(yōu)成績

通義千問720億開源模型部分成績超越閉源的GPT-3.5和GPT-4

用戶僅用一句提示詞就可創(chuàng)建自己的AI助手

此前,中國大模型市場還沒出現(xiàn)足以對標(biāo)Llama 2-70B的優(yōu)質(zhì)開源模型。Qwen-72B填補(bǔ)了國內(nèi)空白,以高性能、高可控、高性價(jià)比的優(yōu)勢,提供不亞于商業(yè)閉源大模型的選擇。基于Qwen-72B,大中型企業(yè)可開發(fā)商業(yè)應(yīng)用,高校、科研院所可開展AI for Science等科研工作。

從1.8B到72B,通義千問率先實(shí)現(xiàn)全尺寸開源

如果說Qwen-72B“向上摸高”,抬升了開源大模型的尺寸和性能天花板;發(fā)布會上的另一開源模型Qwen-1.8B則“向下探底”,成為尺寸最小的中國開源大模型,推理2K長度文本內(nèi)容僅需3G顯存,可在消費(fèi)級終端部署。

從18億、70億、140億到720億參數(shù)規(guī)模,通義千問成為業(yè)界首個“全尺寸開源”的大模型。用戶可在魔搭社區(qū)直接體驗(yàn)Qwen系列模型效果,也可通過阿里云靈積平臺調(diào)用模型API,或基于阿里云百煉平臺定制大模型應(yīng)用。阿里云人工智能平臺PAI針對通義千問全系列模型進(jìn)行深度適配,推出了輕量級微調(diào)、全參數(shù)微調(diào)、分布式訓(xùn)練、離線推理驗(yàn)證、在線服務(wù)部署等服務(wù)。

阿里云是國內(nèi)最早開源自研大模型的科技企業(yè),8月以來開源了Qwen-7B、Qwen-14B和視覺理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單,得到中小企業(yè)和個人開發(fā)者的青睞,累計(jì)下載量超過150萬,催生出150多款新模型、新應(yīng)用。發(fā)布會現(xiàn)場,多位開發(fā)者伙伴現(xiàn)身說法,分享了他們用Qwen開發(fā)專屬模型和特定應(yīng)用的實(shí)踐。

阿里云CTO周靖人表示,開源生態(tài)對促進(jìn)中國大模型的技術(shù)進(jìn)步與應(yīng)用落地至關(guān)重要,通義千問將持續(xù)投入開源,希望成為“AI時代最開放的大模型”,與伙伴們共同促進(jìn)大模型生態(tài)建設(shè)。

通義千問基座模型持續(xù)進(jìn)化,多模態(tài)探索業(yè)界領(lǐng)先

通義千問在多模態(tài)大模型領(lǐng)域的探索也領(lǐng)先業(yè)界一步,當(dāng)天,阿里云首次開源音頻理解大模型Qwen-Audio。

Qwen-Audio能夠感知和理解人聲、自然聲、動物聲、音樂聲等各類語音信號。用戶可以輸入一段音頻,要求模型給出對音頻的理解,甚至基于音頻進(jìn)行文學(xué)創(chuàng)作、邏輯推理、故事續(xù)寫等等。音頻理解能夠賦予大模型接近人類的聽覺能力。

通義大模型能“聽”也能“看”。通義千問8月開源出視覺理解大模型Qwen-VL,迅速成為國際開源社區(qū)最佳實(shí)踐之一。本次發(fā)布會又宣布了Qwen-VL的重大更新,大幅提升通用OCR、視覺推理、中文文本理解基礎(chǔ)能力,還能處理各種分辨率和規(guī)格的圖像,甚至能“看圖做題”。不論從權(quán)威測評成績還是真人體驗(yàn)的效果看,Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通義千問閉源模型也在持續(xù)進(jìn)化,一個月前發(fā)布的通義千問2.0版閉源模型,最近已進(jìn)階至2.1版,上下文窗口長度擴(kuò)展到32k,代碼理解生成能力、數(shù)學(xué)推理能力、中英文百科知識、幻覺誘導(dǎo)抵抗能力分別提升30%、10%、近5%和14%。用戶可以在通義千問APP免費(fèi)體驗(yàn)最新版本的閉源模型。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-12-01
首屆通義千問AI挑戰(zhàn)賽開賽,參賽者可暢玩通義開源模型家族
12月1日,首屆“通義千問AI挑戰(zhàn)賽”開賽,參賽者可免費(fèi)暢玩通義開源模型家族,包括剛剛發(fā)布的720億參數(shù)模型Qwen-72B。主辦方為參賽者提供價(jià)...

長按掃碼 閱讀全文