跨越AI天塹時(shí):行動(dòng)代號(hào)“盤(pán)古大模型”

原標(biāo)題:跨越AI天塹時(shí):行動(dòng)代號(hào)“盤(pán)古大模型”

我采訪過(guò)一個(gè)案例,某工廠的IT負(fù)責(zé)人想要應(yīng)用AI,咨詢之后卻發(fā)現(xiàn)開(kāi)發(fā)成本過(guò)于高昂,人才、算力、算法等條件都不具備,最后只能作罷。

我認(rèn)識(shí)一位朋友,任職于某家AI技術(shù)供應(yīng)商,他們推出的行業(yè)解決方案?jìng)涫芎迷u(píng),卻在實(shí)際進(jìn)入商業(yè)化階段時(shí),發(fā)現(xiàn)大量客戶都需要定制,只能讓公司的AI專家四處奔波,解決用戶的細(xì)小問(wèn)題,最后利潤(rùn)卻連人員開(kāi)支都無(wú)法覆蓋。

還記得一條朋友圈。一位AI開(kāi)發(fā)者在使用之后感嘆GPT-3的神奇,同時(shí)也惋惜于中文世界缺少類似的NLP預(yù)訓(xùn)練大模型。

其實(shí),這些朋友都遇到了同一個(gè)問(wèn)題:一道名為“AI開(kāi)發(fā)”的產(chǎn)業(yè)天塹。

當(dāng)我們談?wù)揂I時(shí),總是會(huì)將其效果等同于數(shù)據(jù)集、實(shí)驗(yàn)室里的能力上限,卻忽略了在真實(shí)的開(kāi)發(fā)、訓(xùn)練、部署中,AI有著太多碎片化與不確定性的因素。

而跨過(guò)這道產(chǎn)業(yè)天塹,也成為了一場(chǎng)名副其實(shí)的全球大賽。這場(chǎng)賽跑中至關(guān)重要的一個(gè)項(xiàng)目,名為“預(yù)訓(xùn)練大模型”。2018年,谷歌AI團(tuán)隊(duì)發(fā)布了BERT模型,預(yù)訓(xùn)練模型的價(jià)值一時(shí)間成為全球焦點(diǎn)。2020 年 5 月,Open AI公布了擁有 1750 億參數(shù)的 GPT-3 預(yù)訓(xùn)練大模型,打破了人類有史以來(lái)創(chuàng)建最大神經(jīng)網(wǎng)絡(luò)的記錄。

與此同時(shí),隨著預(yù)訓(xùn)練大模型的產(chǎn)業(yè)與戰(zhàn)略價(jià)值水漲船高,致力于將AI打造為新一代信息技術(shù)核心抓手的中國(guó)產(chǎn)學(xué)各界出現(xiàn)了一絲緊迫。

中文世界什么時(shí)候能迎來(lái)強(qiáng)大可用的預(yù)訓(xùn)練大模型?又是否能夠沖出GPT-3帶來(lái)的能力邊界?面對(duì)AI開(kāi)發(fā)的”天塹”,我們有什么自己的辦法?

就在種種聲音不斷發(fā)酵的同時(shí),華為云人工智能領(lǐng)域首席科學(xué)家田奇,正在和團(tuán)隊(duì)一同發(fā)起一次安靜的沖鋒。

這次沖鋒的“行動(dòng)代號(hào)”,叫做——盤(pán)古大模型。

天塹:“小作坊式”的AI開(kāi)發(fā)困境

試想一下,如果每家企業(yè)在進(jìn)行研發(fā)時(shí),都需要自己做螺絲、軸承、齒輪這些基礎(chǔ)部件,那整個(gè)社會(huì)的工業(yè)化從何說(shuō)起?

但在AI領(lǐng)域,卻真的會(huì)出現(xiàn)這種情況。如今,AI技術(shù)的企業(yè)滲透率僅僅為4%,距離產(chǎn)業(yè)爆發(fā)期還有相當(dāng)長(zhǎng)的路要走。究其原因,并不是AI缺乏價(jià)值,而是開(kāi)發(fā)過(guò)程中存在大量的碎片化因素。每家想要應(yīng)用AI的企業(yè),可能都需要一些技術(shù)水平很高的人才來(lái)進(jìn)行獨(dú)立的架構(gòu)設(shè)計(jì)與調(diào)參。這就像每家工廠都需要聘請(qǐng)?jiān)O(shè)計(jì)師來(lái)設(shè)計(jì)螺絲,是一種相當(dāng)粗放、原始的手工作坊模式。

來(lái)到華為云的田奇,就和同事們共同發(fā)現(xiàn)了這樣的問(wèn)題。

加入華為之前,田奇已經(jīng)是業(yè)界知名的AI領(lǐng)域?qū)W者。他是美國(guó)伊利諾伊大學(xué)香檳分校博士、IEEE Fellow,也是原德州大學(xué)圣安東尼奧分校計(jì)算機(jī)系正教授。在高校任教17年之后,帶著學(xué)術(shù)界的前沿思考和科研成果,田奇與團(tuán)隊(duì)來(lái)到了產(chǎn)業(yè)一線。而他們首先關(guān)注到的,就是廣泛存于各個(gè)角落的AI開(kāi)發(fā)困境。

由于傳統(tǒng)的NLP、機(jī)器視覺(jué)模型開(kāi)發(fā)都來(lái)自研究機(jī)構(gòu),所以其開(kāi)發(fā)模式也天然與實(shí)驗(yàn)室對(duì)齊,缺乏產(chǎn)業(yè)界要求的效率、標(biāo)準(zhǔn)化與成本可控。

比如說(shuō),一家企業(yè)的一個(gè)項(xiàng)目,往往都需要開(kāi)發(fā)一系列定制化的小模型。但每個(gè)模型的開(kāi)發(fā)周期都相對(duì)較長(zhǎng),并且需要不斷完成各種數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)、模型適配等等瑣碎繁雜的工作。這個(gè)過(guò)程中,開(kāi)發(fā)人員會(huì)選擇自己熟悉、擅長(zhǎng)的模型與開(kāi)發(fā)方式,又導(dǎo)致每個(gè)模型之間差異化很大。一旦出現(xiàn)問(wèn)題就可能推倒重來(lái),而人員變動(dòng)更可能讓所有努力付諸東流。

這種開(kāi)發(fā)模式,存在著“三高”的問(wèn)題:開(kāi)發(fā)人員專業(yè)性要求高、綜合成本高、不可控程度高。

那么如何突破這道產(chǎn)業(yè)天塹呢?從工業(yè)體系的邏輯上看,核心方案就是提升AI開(kāi)發(fā)前置工作的標(biāo)準(zhǔn)化程度,把不同開(kāi)發(fā)者所需模型的公約部分提前訓(xùn)練好。這就是工業(yè)化中的零件化、標(biāo)準(zhǔn)化和流程化。

在探索AI工業(yè)化的過(guò)程中,預(yù)訓(xùn)練大模型逐漸成為行業(yè)認(rèn)可的方案。它的邏輯就是提前將知識(shí)、數(shù)據(jù)、訓(xùn)練成果沉淀到一個(gè)模型中,然后將這個(gè)基礎(chǔ)釋放到產(chǎn)業(yè)。由不同行業(yè)、不同企業(yè)的開(kāi)發(fā)者在此基礎(chǔ)上進(jìn)行二次開(kāi)發(fā)和微調(diào)。就像一個(gè)工業(yè)化社會(huì)的第一步,是完善重型機(jī)械的建造能力。AI工業(yè)化的來(lái)臨,也需要首先擁有作為底座的“重型機(jī)械”。這也成為了盤(pán)古大模型團(tuán)隊(duì)在華為云體系中的首要任務(wù)。

翻越開(kāi)發(fā)天塹,在于能筑“重器”。

登山:盤(pán)古大模型背后的人與事

想要打造一個(gè)屬于中文世界,并且適配各種真實(shí)產(chǎn)業(yè)場(chǎng)景的AI預(yù)訓(xùn)練大模型,首先擺在研發(fā)團(tuán)隊(duì)面前的是兩大門(mén)檻。一個(gè)是技術(shù)門(mén)檻,大模型需要非常好的并行優(yōu)化來(lái)確保工作效率,這對(duì)網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)能力提出了很高要求;第二是資源門(mén)檻,大模型訓(xùn)練需要極大的算力。后來(lái)在訓(xùn)練千億參數(shù)的盤(pán)古大模型時(shí),團(tuán)隊(duì)調(diào)用了超過(guò)2000塊的昇騰910,進(jìn)行了超過(guò)2個(gè)月的訓(xùn)練。這對(duì)于一般企業(yè)來(lái)說(shuō)顯然難以承擔(dān)。

總之,想要快速打造一個(gè)可堪重用的AI大模型,需要調(diào)用各方的力量,并且精準(zhǔn)完成技術(shù)上的進(jìn)化。

2020年夏天GPT-3的出現(xiàn),讓歐美AI界產(chǎn)生了對(duì)預(yù)訓(xùn)練大模型的極高興趣。但在國(guó)內(nèi),產(chǎn)業(yè)界對(duì)NLP預(yù)訓(xùn)練大模型的關(guān)注還相對(duì)較少。而機(jī)器視覺(jué)領(lǐng)域的預(yù)訓(xùn)練大模型,在全球范圍內(nèi)都是十分陌生的新鮮事物。

此時(shí),剛剛在2020年3月份加入華為云團(tuán)隊(duì)的田奇,開(kāi)始組建團(tuán)隊(duì)并且進(jìn)行方向梳理。到了8月,團(tuán)隊(duì)迎來(lái)了核心專家的加入。隨后在9月,團(tuán)隊(duì)開(kāi)始推動(dòng)盤(pán)古大模型的立項(xiàng),希望能夠在華為云的產(chǎn)業(yè)基座上,完成適配各個(gè)產(chǎn)業(yè)AI開(kāi)發(fā)的大模型。

來(lái)到2020年11月,盤(pán)古大模型在華為云內(nèi)部立項(xiàng)成功,也完成了與合作伙伴、高校的合作搭建。在開(kāi)始打造盤(pán)古大模型的時(shí)候,團(tuán)隊(duì)確立了三項(xiàng)最關(guān)鍵的核心設(shè)計(jì)原則:一是模型要大,可以吸收海量數(shù)據(jù);二是網(wǎng)絡(luò)結(jié)構(gòu)要強(qiáng),能夠真正發(fā)揮出模型的性能;三是要具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場(chǎng)景。

接下來(lái)就是選擇賽道的問(wèn)題。NLP領(lǐng)域的預(yù)訓(xùn)練大模型當(dāng)時(shí)已經(jīng)得到了廣泛關(guān)注,自然是盤(pán)古大模型的重中之重。同時(shí),AI在產(chǎn)業(yè)中應(yīng)用的更廣泛需求是機(jī)器視覺(jué)能力,所以盤(pán)古大模型同時(shí)也瞄準(zhǔn)這一領(lǐng)域,同時(shí)開(kāi)啟了NLP和機(jī)器視覺(jué)兩個(gè)領(lǐng)域的大模型開(kāi)發(fā)。

與此同時(shí),盤(pán)古大模型也做好了未來(lái)規(guī)劃。首先希望能夠把機(jī)器視覺(jué)、NLP、語(yǔ)音,甚至計(jì)算機(jī)圖形學(xué)的技術(shù)結(jié)合起來(lái),形成多模態(tài)的預(yù)訓(xùn)練大模型,增強(qiáng)預(yù)訓(xùn)練大模型的跨領(lǐng)域協(xié)同落地能力。另外,AI落地中還有一個(gè)十分重要的領(lǐng)域是科學(xué)計(jì)算。海洋、氣象、制藥、能源等領(lǐng)域都有非常強(qiáng)的知識(shí)處理、科學(xué)計(jì)算需求。用AI的方法去求解科學(xué)計(jì)算問(wèn)題,將帶來(lái)十分巨大的價(jià)值潛力。因此,多模態(tài)與科學(xué)計(jì)算大模型,將是盤(pán)古接下來(lái)的行動(dòng)方向。

確定了建設(shè)方案與賽道選擇之后,接下來(lái)的研發(fā)工作可以順理成章地開(kāi)展,同時(shí)也必然經(jīng)歷創(chuàng)造性研究中難免產(chǎn)生的一系列挑戰(zhàn)。

比如盤(pán)古大模型的核心開(kāi)發(fā)過(guò)程,就是以海量有效數(shù)據(jù)進(jìn)行模型預(yù)訓(xùn)練,實(shí)現(xiàn)吸收大量數(shù)據(jù)之后模型的高度智能化。那么數(shù)據(jù)和算力從哪來(lái),就成為了一個(gè)不可避免的問(wèn)題。在盤(pán)古大模型的開(kāi)發(fā)過(guò)程中,華為云和合作伙伴的多方推動(dòng),確保了所需數(shù)據(jù)和算力資源的保障到位。即便華為云擁有非常好的資源基礎(chǔ),在千億參數(shù)級(jí)別的大模型面前也依舊存有不足。為此,田奇團(tuán)隊(duì)也嘗試了與合作伙伴的緊密協(xié)作,調(diào)用一切資源來(lái)確保開(kāi)發(fā)進(jìn)度。比如團(tuán)隊(duì)同著名的鵬城實(shí)驗(yàn)室合作,來(lái)完成了模型訓(xùn)練所需算力的調(diào)用。

而在數(shù)據(jù)與知識(shí)方面,盤(pán)古大模型的開(kāi)發(fā)團(tuán)隊(duì)經(jīng)常會(huì)遇到與具體行業(yè)知識(shí)體系、數(shù)據(jù)系統(tǒng)的磨合問(wèn)題。這在具體過(guò)程中經(jīng)常出現(xiàn)意料之外的情況。比如一個(gè)醫(yī)學(xué)數(shù)據(jù)的準(zhǔn)確率,顯然應(yīng)該依賴醫(yī)學(xué)專家的解答。但在具體場(chǎng)景中,往往醫(yī)學(xué)專家的判斷準(zhǔn)確率也并不高。這類AI之外領(lǐng)域的情況,往往會(huì)反向影響到盤(pán)古大模型的開(kāi)發(fā)。為此,盤(pán)古大模型團(tuán)隊(duì)需要與具體的行業(yè)專家進(jìn)行反復(fù)溝通,希望把他們的知識(shí)或者直觀感受,轉(zhuǎn)化為計(jì)算機(jī)可量化的模型,再對(duì)訓(xùn)練出的結(jié)果進(jìn)行協(xié)同驗(yàn)證。這種反復(fù)的跨領(lǐng)域溝通與聯(lián)動(dòng),才最終可能達(dá)成關(guān)于AI的共識(shí)。

在盤(pán)古大模型開(kāi)發(fā)過(guò)程中,由于時(shí)間緊張、訓(xùn)練難度與成本巨大,并且還是機(jī)器視覺(jué)與NLP雙模型同時(shí)推動(dòng),自然也需要內(nèi)部團(tuán)隊(duì)的“超人發(fā)揮”。田奇回憶,團(tuán)隊(duì)內(nèi)部都叫自己“特戰(zhàn)隊(duì)員”,也就是角色需要經(jīng)?;Q,工作需要相互支撐,哪里缺人就要哪里頂上。一個(gè)技術(shù)專家,同時(shí)也要考慮很多產(chǎn)業(yè)落地、商業(yè)化方面的問(wèn)題。

支撐著盤(pán)古大模型不斷攻堅(jiān)克難的團(tuán)隊(duì),起初僅有6、7人,他們是讓盤(pán)古大模型得以從實(shí)驗(yàn)室走向產(chǎn)業(yè)的中堅(jiān)力量。如今團(tuán)隊(duì)已陸續(xù)壯大起來(lái),已包括20多名博士、30多名工程師、3名廣受關(guān)注的“華為天才少年”,還有50多名來(lái)自全國(guó)C9高校的專家。

翻山越嶺從來(lái)不易,智能時(shí)代亦是如此。

翻越:“盤(pán)古”究竟強(qiáng)在何處?

2021年4月,盤(pán)古大模型正式對(duì)外發(fā)布。其中盤(pán)古NLP大模型是業(yè)界首個(gè)千億參數(shù)的中文預(yù)訓(xùn)練大模型,在CLUE打榜中實(shí)現(xiàn)了業(yè)界領(lǐng)先。為了訓(xùn)練NLP大模型,團(tuán)隊(duì)在訓(xùn)練過(guò)程中使用了40TB的文本數(shù)據(jù),包含了大量的通用知識(shí)與行業(yè)經(jīng)驗(yàn)。

而盤(pán)古CV大模型,在業(yè)界首次實(shí)現(xiàn)了模型的按需抽取,可以在不同部署場(chǎng)景下抽取出不同大小的模型,動(dòng)態(tài)范圍可根據(jù)需求,覆蓋特定的小場(chǎng)景到綜合性的復(fù)雜大場(chǎng)景;提出的基于樣本相似度的對(duì)比學(xué)習(xí),實(shí)現(xiàn)了在ImageNet上小樣本學(xué)習(xí)能力業(yè)界第一。

這些數(shù)據(jù)下,我們可以進(jìn)一步考察盤(pán)古大模型的優(yōu)勢(shì)和能力點(diǎn)在何處。尤其盤(pán)古大模型與GPT-3的對(duì)比情況究竟如何,應(yīng)該會(huì)有很多朋友好奇。

橫向?qū)Ρ缺P(pán)古大模型與GPT-3的差異,也是透視盤(pán)古大模型技術(shù)創(chuàng)新的有效方案。首先我們知道盤(pán)古大模型有機(jī)器視覺(jué)模型,這是GPT-3所沒(méi)有的。回到NLP領(lǐng)域中,GPT-3更偏重于生成,其理解能力相對(duì)較弱。這也是為什么我們看到的GPT-3案例基本都與文本生成相關(guān)。而在盤(pán)古大模型的研發(fā)過(guò)程中,團(tuán)隊(duì)考慮到真實(shí)的產(chǎn)業(yè)場(chǎng)景中有大量的內(nèi)容理解需求,比如客服、智能對(duì)話等等,于是給盤(pán)古大模型設(shè)計(jì)了兼顧架構(gòu),能夠同時(shí)高度完成理解與生成任務(wù)。

再來(lái)看具體一些的技術(shù)差異,盤(pán)古大模型提升了復(fù)雜場(chǎng)景下的小樣本學(xué)習(xí)能力,在小樣本學(xué)習(xí)上比GPT-3提升了一個(gè)數(shù)量級(jí)的效率;在微調(diào)能力上,盤(pán)古有著更好的數(shù)據(jù)吸收理解能力,可以在真實(shí)行業(yè)場(chǎng)景中實(shí)現(xiàn)提升模型應(yīng)用效率;再有盤(pán)古大模型集成行業(yè)知識(shí)的能力更強(qiáng),其采用更靈活的模塊設(shè)計(jì),能夠根據(jù)業(yè)務(wù)場(chǎng)景適配,提升行業(yè)知識(shí)吸收效率。

在技術(shù)創(chuàng)新之外,盤(pán)古大模型還是一個(gè)天然瞄準(zhǔn)AI工業(yè)化、現(xiàn)實(shí)場(chǎng)景的項(xiàng)目。在立項(xiàng)初期,研發(fā)團(tuán)隊(duì)就與合作伙伴進(jìn)行了一系列商業(yè)化驗(yàn)證,以此來(lái)確保盤(pán)古大模型走入真實(shí)產(chǎn)業(yè)場(chǎng)景中的效率和適應(yīng)能力。這也是盤(pán)古大模型的一大差異,它并非為實(shí)驗(yàn)室而創(chuàng)造,而是將工業(yè)化的一面放置在更高的優(yōu)先級(jí)上,是一個(gè)以商業(yè)價(jià)值驅(qū)動(dòng)研發(fā)創(chuàng)新的“實(shí)干模式”大模型。

再有一點(diǎn),盤(pán)古大模型與其他預(yù)訓(xùn)練大模型不同的是,團(tuán)隊(duì)在研發(fā)過(guò)程中始終將生態(tài)化、協(xié)同創(chuàng)新納入考量。盤(pán)古大模型是一個(gè)開(kāi)放、可生長(zhǎng)的產(chǎn)業(yè)實(shí)體,可以在各個(gè)環(huán)節(jié)引入生態(tài)合作伙伴、高校科研團(tuán)隊(duì),以及不同領(lǐng)域AI開(kāi)發(fā)者的力量。這樣確保了盤(pán)古大模型融入產(chǎn)業(yè)鏈條、搭建生態(tài)化合作的能力。從技術(shù)化、商業(yè)化、生態(tài)化三個(gè)層面,盤(pán)古大模型都驅(qū)動(dòng)預(yù)訓(xùn)練大模型來(lái)到了一個(gè)新的階段,建造了一個(gè)從“作坊式AI開(kāi)發(fā)”到“工業(yè)化AI開(kāi)發(fā)”的轉(zhuǎn)換基礎(chǔ)。

盤(pán)古之力,在于合力。

燈火:大模型的落地進(jìn)行時(shí)

雖然剛剛發(fā)布幾個(gè)月,但從立項(xiàng)之初,盤(pán)古大模型就已經(jīng)開(kāi)展了一系列產(chǎn)業(yè)合作。這些來(lái)自千行百業(yè)的“盤(pán)古故事”,可以讓我們看到大模型與AI開(kāi)發(fā)之變帶來(lái)的真實(shí)影像。

在物流場(chǎng)景,盤(pán)古大模型協(xié)助浦發(fā)銀行構(gòu)建了“物的銀行”——浦慧云倉(cāng)。在人員行為、貨物檢測(cè)方面,可以實(shí)現(xiàn)性能提升5%到10%;同時(shí)開(kāi)發(fā)效率也極大提升,原本需要1到2個(gè)月的開(kāi)發(fā)工作,現(xiàn)在只需要兩三天就可以完成,開(kāi)發(fā)中的人力、算力、維護(hù)成本都極大降低。

在盤(pán)古大模型的落地進(jìn)程中,也經(jīng)常會(huì)出現(xiàn)一些“意外”的驚喜。比如在國(guó)家電網(wǎng)巡檢案例中,由于缺陷種類復(fù)雜多樣,傳統(tǒng)的方法需要對(duì)大多數(shù)缺陷適配特定模型以滿足性能需求,這樣100余種缺陷就需要開(kāi)發(fā)20+模型,造成模型迭代維護(hù)困難。盤(pán)古大模型創(chuàng)造性地提供行業(yè)預(yù)訓(xùn)練模型,得益于其突出的特征表達(dá)能力,能夠做到一個(gè)模型適配所有缺陷,極大地提升了開(kāi)發(fā)效率,同時(shí)識(shí)別效果平均提升超過(guò)18%。同時(shí),盤(pán)古大模型還提供針對(duì)零樣本的缺陷檢測(cè)功能,能夠快速判斷新缺陷,真正貼近于巡檢員能力。

這樣的案例不斷增多,讓盤(pán)古大模型的行業(yè)認(rèn)可度節(jié)節(jié)攀升。繼而也讓“預(yù)訓(xùn)練大模型是AI工業(yè)化主要途徑”成為行業(yè)共識(shí)與產(chǎn)業(yè)發(fā)展方向。目前,盤(pán)古大模型已經(jīng)在100多個(gè)行業(yè)場(chǎng)景完成驗(yàn)證,包括能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等等。精度提升、效率加強(qiáng)、開(kāi)發(fā)成本下降,逐漸成為盤(pán)古大模型走向產(chǎn)業(yè)的幾個(gè)“標(biāo)簽”。

萬(wàn)家燈火初上,百業(yè)AI將興。

思索:AI工業(yè)化的虹吸與變革

盤(pán)古大模型的故事當(dāng)然剛剛開(kāi)始,但從它的立項(xiàng)、研發(fā)和落地進(jìn)程中,我們卻可以得到一些關(guān)于AI工業(yè)化的思考。

從歷史中看,一種產(chǎn)品的工業(yè)化進(jìn)程必然需要經(jīng)歷研發(fā)為重—基座為重—產(chǎn)品為重三個(gè)層級(jí)。比如說(shuō)我們熟悉的智能手機(jī),在經(jīng)歷了微型處理、無(wú)線通訊、屏幕觸控等技術(shù)的儲(chǔ)備階段之后,最終形成了一套標(biāo)準(zhǔn)化的集成邏輯與基礎(chǔ)產(chǎn)業(yè)鏈。這一階段,廠商不必再花費(fèi)巨資進(jìn)行基礎(chǔ)研發(fā),而是可以用相對(duì)較低的成本完成零部件采購(gòu)與集成制造。也只有這樣,廠商才能打磨產(chǎn)品,雕琢功能,消費(fèi)者才能用上物美價(jià)廉的智能手機(jī)。

將這個(gè)邏輯回溯到AI領(lǐng)域。自深度學(xué)習(xí)為代表的AI第三次興起之后,這項(xiàng)技術(shù)得到了快速發(fā)展。但其基礎(chǔ)業(yè)態(tài)還處于“研發(fā)為重”的第一階段。行業(yè)中缺乏公開(kāi)、有效、低成本的產(chǎn)業(yè)基礎(chǔ),最終導(dǎo)致很多理論上成立的落地方案難以成行。

而盤(pán)古大模型的價(jià)值,恰恰就在于推動(dòng)AI的低成本、可復(fù)制。雖然在打造大模型的階段需要耗費(fèi)巨大的研發(fā)成本與資源,但一旦突破產(chǎn)業(yè)規(guī)模期,將帶來(lái)全行業(yè)的普惠價(jià)值。田奇認(rèn)為,目前我們處在AI工業(yè)化開(kāi)發(fā)模式起步后的快速發(fā)展階段,而大模型是最有希望將AI進(jìn)行落地的一個(gè)方向。

從這個(gè)角度看,我們?cè)谟^察、思考和推動(dòng)預(yù)訓(xùn)練大模型發(fā)展時(shí),就不應(yīng)該停留在科研基礎(chǔ)設(shè)施的角度,而是應(yīng)該以產(chǎn)業(yè)應(yīng)用為導(dǎo)向,引導(dǎo)各方全力以赴,謀求AI工業(yè)化進(jìn)程的質(zhì)變契機(jī)。

從盤(pán)古大模型的故事中看,這個(gè)過(guò)程需要多重力量的攜手與跨界。比如說(shuō),田奇加入華為,一度被視作AI學(xué)者進(jìn)入產(chǎn)業(yè)界的代表性事件。而今天來(lái)看,這種“跨界”和“變化”確實(shí)起到了作用。田奇有著最新的研究方法、技術(shù)創(chuàng)新能力與國(guó)際視野;而在華為云的產(chǎn)業(yè)結(jié)構(gòu)中,田奇團(tuán)隊(duì)也找到了學(xué)術(shù)界所不具備的驅(qū)動(dòng)力——在產(chǎn)業(yè)界,科學(xué)家必須思考功耗、效率、成本、商業(yè)場(chǎng)景等等一系列真實(shí)問(wèn)題,“學(xué)以致用”需要落進(jìn)方方面面。

再比如,盤(pán)古大模型的開(kāi)發(fā)過(guò)程,也是一場(chǎng)AI學(xué)者與工程師,同各行業(yè)專家、企業(yè)的對(duì)話。鐵路、物流、醫(yī)學(xué)、天文,種種知識(shí)要融入大模型之中,這就需要更強(qiáng)的協(xié)同能力與互相理解。

產(chǎn)學(xué)研的縱向融合,不同行業(yè)領(lǐng)域的橫向協(xié)同,誕生了AI在工業(yè)化階段必須經(jīng)歷的虹吸效應(yīng)。從這個(gè)角度看,盤(pán)古大模型也是一次產(chǎn)業(yè)、科研的虹吸范本。

這種“協(xié)同發(fā)力、重裝行動(dòng)”的盤(pán)古大模型模式,或許將在未來(lái)一段時(shí)間內(nèi)不斷涌現(xiàn),也將成為云計(jì)算與AI產(chǎn)業(yè)的戰(zhàn)略重心。而其影響,可能是AI開(kāi)發(fā)的綜合門(mén)檻下降,一系列產(chǎn)業(yè)與社會(huì)價(jià)值的提升,以及戰(zhàn)略級(jí)AI基礎(chǔ)設(shè)施的完備。

田奇回憶說(shuō),在打造大模型的過(guò)程中,他更多考慮的是可能帶來(lái)的商業(yè)價(jià)值。如果不能復(fù)制推廣,那么大模型可能就是“一個(gè)toy、一個(gè)只能在實(shí)驗(yàn)室中被觀賞的東西”。團(tuán)隊(duì)希望大模型能夠在更多場(chǎng)景中被使用,這樣才能帶來(lái)改變。

當(dāng)更多科學(xué)家、行業(yè)專家、AI架構(gòu)師,用這樣的角度和動(dòng)力去思考AI、推動(dòng)AI、建造AI,橫亙?cè)贏I面前的產(chǎn)業(yè)天塹,最終會(huì)成為登山者的豐碑,成為AI工業(yè)化變革的標(biāo)志。

也許有一天,我們?cè)诹腁I往事的時(shí)候,會(huì)記住這么幾個(gè)字:

AI落地,“盤(pán)古”開(kāi)天。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2021-08-31
跨越AI天塹時(shí):行動(dòng)代號(hào)“盤(pán)古大模型”
同時(shí),AI在產(chǎn)業(yè)中應(yīng)用的更廣泛需求是機(jī)器視覺(jué)能力,所以盤(pán)古大模型同時(shí)也瞄準(zhǔn)這一領(lǐng)域,同時(shí)開(kāi)啟了NLP和機(jī)器視覺(jué)兩個(gè)領(lǐng)域的大模型開(kāi)發(fā)。

長(zhǎng)按掃碼 閱讀全文