打上“業(yè)界最強(qiáng)”標(biāo)簽:阿里通義千問(wèn)沖擊國(guó)產(chǎn)大模型No.1

極客網(wǎng)·人工智能(海剛)每個(gè)時(shí)代都有自己的主旋律,下一個(gè)十年的主旋律就是AI

自ChatGPT橫空出世以后,國(guó)內(nèi)的各種大模型也如雨后春筍般涌現(xiàn),能叫得上號(hào)就不下十余個(gè),其中就包括大名鼎鼎的華為盤(pán)古大模型、百度文心一言大模型、訊飛星火大模型、抖音云雀大模型,以及今天的主角阿里通義千問(wèn)大模型。

據(jù)極客網(wǎng)不完全統(tǒng)計(jì),國(guó)內(nèi)擁有10億參數(shù)規(guī)模以上大模型的廠商及機(jī)構(gòu)已接近300家,而且還在快速增加中。預(yù)計(jì)到2024年第一季度末,“百模大戰(zhàn)”就會(huì)升級(jí)為“千模大戰(zhàn)”!

百模大戰(zhàn).png 圖:部分國(guó)內(nèi)知名大模型

上一次出現(xiàn)如此“壯觀”的景象,還是十年前的互聯(lián)網(wǎng)團(tuán)購(gòu)。不過(guò),這兩者之間有著本質(zhì)的不同?!扒4髴?zhàn)”已由“千團(tuán)大戰(zhàn)”的資本驅(qū)動(dòng)型、營(yíng)銷(xiāo)驅(qū)動(dòng)型,轉(zhuǎn)向了研發(fā)驅(qū)動(dòng)型、技術(shù)驅(qū)動(dòng)型。這與中國(guó)產(chǎn)業(yè)升級(jí)正在追求的高質(zhì)量發(fā)展不謀而合,“千模大戰(zhàn)”拼的不再是錢(qián)和套路,而是實(shí)打?qū)嵉募夹g(shù)創(chuàng)新能力。

作為互聯(lián)網(wǎng)時(shí)代最大的受益者和贏家之一,阿里有極強(qiáng)的商業(yè)嗅覺(jué),是最早一批全面轉(zhuǎn)型“硬科技”研發(fā)的互聯(lián)網(wǎng)巨頭之一,在AI大模型領(lǐng)域也成功躋身第一梯隊(duì)。2023年,阿里通義千問(wèn)大模型在技術(shù)、商業(yè)、生態(tài)三方面,都取得了突破性時(shí)展,國(guó)產(chǎn)AI大模型之王,很可能就是阿里!

首次打上“業(yè)界最強(qiáng)”標(biāo)簽

12月1日,阿里云在北京召開(kāi)發(fā)布會(huì),發(fā)布通義千問(wèn)閉源模型2.1版,升級(jí)通義千問(wèn)視覺(jué)理解模型Qwen-VL,并開(kāi)源通義千問(wèn)720億參數(shù)模型Qwen-72B。從18億、70億、140億到720億參數(shù)規(guī)模,通義千問(wèn)成為業(yè)界首個(gè)“全尺寸開(kāi)源”的大模型。這預(yù)示著,阿里通義千問(wèn)自4月發(fā)布以來(lái),終于迎來(lái)了一次史詩(shī)級(jí)大升級(jí)。

圖片1.jpg

圖:阿里通義千問(wèn)發(fā)布會(huì)現(xiàn)場(chǎng)

通過(guò)橫向?qū)Ρ炔浑y發(fā)現(xiàn),Qwen-72B是目前業(yè)界最強(qiáng)的開(kāi)源中文大模型,在10個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)中,都創(chuàng)下開(kāi)源模型最優(yōu)成績(jī)。尤其在中文任務(wù)模式下,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基準(zhǔn),得分超越GPT-4;數(shù)學(xué)推理方面,Qwen-72B在GSM8K、MATH測(cè)評(píng)中斷層式領(lǐng)先其他開(kāi)源模型;代碼理解方面,Qwen-72B在HumanEval、MBPP等測(cè)評(píng)中的表現(xiàn)大幅提升,代碼能力有了質(zhì)的飛躍。

在英語(yǔ)任務(wù)中,Qwen-72B的MMLU基準(zhǔn)測(cè)試也取得開(kāi)源模型最高分。也就是說(shuō),Qwen-72B不僅在性能上超越了開(kāi)源標(biāo)桿Llama 2-70B和大部分商用閉源模型。未來(lái),企業(yè)級(jí)、科研級(jí)的高性能應(yīng)用,也有了開(kāi)源大模型這一選項(xiàng)。圖片2.jpg

圖:在10大權(quán)威測(cè)評(píng)中,通義千問(wèn)720億參數(shù)模型獲得開(kāi)源模型最優(yōu)成績(jī)

圖片3.jpg 

圖:通義千問(wèn)720億開(kāi)源模型部分成績(jī)超越閉源的GPT-3.5和GPT-4

另外,通義千問(wèn)2.1也有了大幅升級(jí),在復(fù)雜指令理解、文學(xué)創(chuàng)作、通用數(shù)學(xué)、知識(shí)記憶、幻覺(jué)抵御等能力都有肉眼可見(jiàn)的提升。具體表現(xiàn)為:代碼生成理解能力提升了30%、幻覺(jué)誘導(dǎo)抵抗提升了14%、數(shù)學(xué)邏輯推理能力提升了10%、中英百科知識(shí)增加了5%。

在競(jìng)爭(zhēng)激烈的大模型領(lǐng)域,每一小步提升,都意味著更大的競(jìng)爭(zhēng)優(yōu)勢(shì),所以大廠們無(wú)時(shí)不刻都在向著更高的技術(shù)指標(biāo)進(jìn)級(jí)。在這種情況下,阿里通義千問(wèn)只用了短短6個(gè)多月的時(shí)間,就從絕對(duì)落后做到了部分領(lǐng)先,這是極期難能可貴的。未來(lái)三到五年,如果阿里可以一直保持如此迅猛的發(fā)展態(tài)勢(shì),完全有機(jī)會(huì)沖擊國(guó)產(chǎn)AI大模型之巔,再次成為新科技時(shí)代的No.1。

構(gòu)筑堅(jiān)不可摧的“技術(shù)護(hù)城河”

前文提到,AI大模型拼的不再是資本和營(yíng)銷(xiāo),而是實(shí)打?qū)嵉募夹g(shù)創(chuàng)新。沒(méi)有核心優(yōu)勢(shì)的企業(yè),都會(huì)隨著技術(shù)的快速迭代,慢慢湮沒(méi)在滾滾歷史洪流中。和“千團(tuán)大戰(zhàn)”的結(jié)局類(lèi)似,只有極少數(shù)大模型公司能夠“笑到最后”。作為最早轉(zhuǎn)型“硬科技”的互聯(lián)網(wǎng)巨頭之一,阿里經(jīng)過(guò)十余年的技術(shù)積淀,已初步具備穿越周期的條件。

對(duì)于AI大模型來(lái)說(shuō),核心技術(shù)環(huán)節(jié)有三個(gè),一是數(shù)據(jù),二是算法,三是算力。作為中國(guó)最大的互聯(lián)網(wǎng)巨頭之一,阿里在數(shù)據(jù)方面有著天然的優(yōu)勢(shì),尤其是涉及交易細(xì)節(jié)的電商數(shù)據(jù),阿里優(yōu)勢(shì)更加明顯。在算法方面,盡管阿里起步稍晚,但目前已經(jīng)無(wú)限接近GPT-4,部分細(xì)分領(lǐng)域還實(shí)現(xiàn)了超越。站在歷史角度看,中國(guó)企業(yè)在數(shù)據(jù)算法領(lǐng)域從來(lái)沒(méi)輸過(guò),所以這部分的反超指日可待。

相比數(shù)據(jù)、算法,最關(guān)鍵的還是算力!現(xiàn)在大模型企構(gòu)建算力的唯一途徑,就是購(gòu)買(mǎi)更多、更先進(jìn)的算力基礎(chǔ)設(shè)施。而算力基礎(chǔ)設(shè)施中,最核心的部件就是AI算力芯片。目前,AI算力芯片做得最好的,非英偉達(dá)莫屬。其最新發(fā)布的H200,擁有141GB的內(nèi)存,處理速度高達(dá)4.8TB/秒,綜合性能是上一代的兩倍。這款芯片將給AI大模型企業(yè)帶來(lái)極大的助力。

圖片4.jpg 

圖:英偉達(dá)H200性能

然而,由于眾所周知的原因,英偉達(dá)H200等美國(guó)尖端AI芯片,并不能賣(mài)給中國(guó)企業(yè)。中國(guó)企業(yè)要想在新一輪產(chǎn)業(yè)變革中掌握主動(dòng)權(quán),自力更生成了必選項(xiàng)。

在國(guó)內(nèi),除了華為之外,阿里是極少數(shù)在做自研芯片,且已經(jīng)做出成績(jī)的公司之一。其重磅推薦出的含光800一度成為全球最強(qiáng)AI推理芯片。近幾年,阿里旗下芯片平臺(tái)平頭哥,先后發(fā)布鐵 910、無(wú)劍 SoC 平臺(tái)。就在上個(gè)月,阿里玄鐵RISC-V又上新了三款處理器:首次實(shí)現(xiàn)AI矩陣擴(kuò)展的C907、滿(mǎn)足Vector1.0標(biāo)準(zhǔn)的C920,以及實(shí)時(shí)處理器R910。截止目前,阿里平頭哥已累計(jì)售出30億顆RISC-V芯片,占據(jù)該市場(chǎng)全球30%的份額。其中,玄鐵CPU的出貨量已經(jīng)超過(guò)了25億顆,成為了國(guó)內(nèi)應(yīng)用規(guī)模最大的國(guó)產(chǎn)CPU。

圖片5.jpg

圖:阿里平頭哥芯片產(chǎn)品一覽

毫無(wú)疑問(wèn),平頭哥已成國(guó)產(chǎn)芯片不容忽略的一極。而在芯片領(lǐng)域做出了突破,也就意味著在算力基礎(chǔ)設(shè)施建設(shè)方面有了更大的主動(dòng)權(quán)。借此,阿里不僅可以幫助自己在大模型領(lǐng)域,構(gòu)筑一條堅(jiān)不可摧的“技術(shù)護(hù)城河”,還可以打破國(guó)外壟斷,為國(guó)內(nèi)其它相關(guān)企業(yè)的自主創(chuàng)新提供強(qiáng)有力的支持。未來(lái),阿里云將不斷壯大自身產(chǎn)業(yè)生態(tài),并發(fā)展成為整個(gè)行業(yè)的賦能者。

事實(shí)上,不只通義千問(wèn),目前中國(guó)一半大模型公司,都跑在阿里云上。阿里云CTO周靖人稱(chēng),阿里云將不斷開(kāi)放平臺(tái)能力,幫助更多企業(yè)實(shí)現(xiàn)大模型商業(yè)價(jià)值。

阿里這么說(shuō),也是這么做的。比如,阿里云剛剛發(fā)布的一站式大模型應(yīng)用開(kāi)發(fā)平臺(tái)——阿里云百煉,就集成了國(guó)內(nèi)外主流優(yōu)質(zhì)大模型,可以提供模型選型、微調(diào)訓(xùn)練、安全套件、模型部署等服務(wù)和全鏈路的應(yīng)用開(kāi)發(fā)工具,為用戶(hù)簡(jiǎn)化了底層算力部署、模型預(yù)訓(xùn)練、工具開(kāi)發(fā)等復(fù)雜工作。開(kāi)發(fā)者可在5分鐘內(nèi)開(kāi)發(fā)一款大模型應(yīng)用,幾小時(shí)即可“煉”出一個(gè)企業(yè)專(zhuān)屬模型,開(kāi)發(fā)者可把更多精力專(zhuān)注于應(yīng)用創(chuàng)新。

圖片6.jpg

圖:阿里云百煉平臺(tái)

截至2023年10月,阿里云已與60多個(gè)行業(yè)頭部伙伴進(jìn)行深度合作,推動(dòng)通義千問(wèn)在辦公、文旅、電力、政務(wù)、醫(yī)保、交通、制造、金融、軟件開(kāi)發(fā)等領(lǐng)域的落地。這個(gè)成績(jī),無(wú)疑再一次跑贏了絕大部分競(jìng)爭(zhēng)者??傊?,憑借獨(dú)有的技術(shù)優(yōu)勢(shì)和生態(tài)布局,阿里通義千問(wèn)是最有機(jī)會(huì)成為行業(yè)的領(lǐng)頭羊的大模型。

寫(xiě)在最后:

生成式AI爆火,千模大戰(zhàn)加速上演。作為最早轉(zhuǎn)型“硬科技”的互聯(lián)網(wǎng)巨頭之一,阿里憑借十余年積淀下來(lái)的技術(shù)優(yōu)勢(shì),在數(shù)據(jù)、算法、算力三大核心環(huán)節(jié),構(gòu)筑了一條堅(jiān)不可摧的護(hù)城河,還率先推出業(yè)界最強(qiáng)的720億參數(shù)開(kāi)源中文大模型Qwen-72B。未來(lái),隨著阿里云生態(tài)的不斷壯大,阿里通義千問(wèn)將成為最有機(jī)會(huì)登頂行業(yè)之巔的大模型。站在中國(guó)產(chǎn)業(yè)升級(jí)的大維度來(lái)看,阿里在AI領(lǐng)域的持續(xù)投入,無(wú)疑再一次押對(duì)了大勢(shì)。期待阿里這個(gè)龐然大物,在新一輪產(chǎn)業(yè)變革中成功完成轉(zhuǎn)型、蛻變!(完)

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2023-12-02
打上“業(yè)界最強(qiáng)”標(biāo)簽:阿里通義千問(wèn)沖擊國(guó)產(chǎn)大模型No.1
每個(gè)時(shí)代都有自己的主旋律,下一個(gè)十年的主旋律就是AI!自ChatGPT橫空出世以后,國(guó)內(nèi)的各種大模型也如雨后春筍般涌現(xiàn),能叫得上號(hào)就不下十余個(gè),其中就包括大名鼎鼎的華為盤(pán)古大模型、百度文心一言大模型、訊飛星火大模型、抖音云雀大模型,以及今天的主角阿里通義千問(wèn)大模型。據(jù)極客...

長(zhǎng)按掃碼 閱讀全文