頻頻破圈,走向百業(yè):大模型的畢業(yè)季

原標(biāo)題:頻頻破圈,走向百業(yè):大模型的畢業(yè)季

人間六月,滿眼芳菲。很多人將在這時(shí)迎來人生中又一個(gè)畢業(yè)季。與熟悉的課堂、校舍、同學(xué)道別,走向新的學(xué)府,或者走向自己選擇的行業(yè)。

這個(gè)情感濃烈的六月,卻與往昔有點(diǎn)不同。除了人類的青春故事依舊精彩,AI大模型也在畢業(yè)季頻頻出圈。最近,百度的數(shù)字人度曉曉,向我們完美展示了一枚AI同學(xué)如何度過一個(gè)完美六月。先是寫高考作文,后是畫作參加美院畢業(yè)展,緊接著還跟龔俊一起創(chuàng)作音樂。難怪很多同學(xué)表示,我的畢業(yè)季可沒有AI那么精彩……

支撐度曉曉實(shí)力破圈的,是百度自主研發(fā)的文心大模型。

幾年以來,大模型可以說是AI領(lǐng)域,乃至整個(gè)科技界的核心熱詞之一。我們經(jīng)常會(huì)聽到某公司/科研機(jī)構(gòu)訓(xùn)練了新的大模型,參數(shù)規(guī)模打破了記錄;卻很少聽到某行業(yè)/領(lǐng)域真的用到了大模型。從2018年十月谷歌AI發(fā)布bert開始算起,大模型到這個(gè)六月正好度過了“大學(xué)四年”。換言之,這項(xiàng)被賦予期望的技術(shù),也該迎接自己的畢業(yè)季了。

此前,我們看到的是大模型無盡的提升訓(xùn)練模型參數(shù),無盡的刷新數(shù)據(jù)集測試分?jǐn)?shù),并且有各種各樣新的技術(shù)思路加入大模型訓(xùn)練。但面向未來,我們可能只需要以一種思路來評判大模型:能不能帶來產(chǎn)業(yè)價(jià)值。

度曉曉的出圈,確實(shí)刷新了很多人對AI的認(rèn)識。但更重要的是它通過一系列動(dòng)作,向產(chǎn)業(yè)證明了預(yù)訓(xùn)練大模型如何跨越技術(shù)屏障,真正與產(chǎn)業(yè)結(jié)合,向開發(fā)者與千行百業(yè)開放生態(tài)。

2019年,百度率先發(fā)布了中國首個(gè)正式開放的預(yù)訓(xùn)練模型ERNIE1.0,開啟了中國大模型的“入校生涯”;2022年,文心大模型第一個(gè)沖出實(shí)驗(yàn)室、數(shù)據(jù)集的大門,引領(lǐng)了全球大模型的“產(chǎn)業(yè)歲月”。

能夠做到這一切的原因,在于文心大模型正確回答了三道“畢業(yè)考試題”。

先答這道“證明題”:一系列出圈動(dòng)作背后的技術(shù)跨越

短短幾天之內(nèi),百度數(shù)字人度曉曉首先挑戰(zhàn)高考作文。參與作答了全國新高考Ⅰ卷的《本手、妙手、俗手》議論文寫作,40秒就根據(jù)題目創(chuàng)作了40多篇文章,平均1秒生成1篇,隨機(jī)抽取其中一篇,分?jǐn)?shù)已趕超約75%高考考生。

緊接著,度曉曉帶著她的畫作參加了西安美術(shù)學(xué)院2022年“時(shí)空留痕·無界西美”本科畢業(yè)展,開設(shè)了自己的專屬展區(qū)。她平均只需數(shù)十秒就能完成一幅有意味,充滿鮮明藝術(shù)特質(zhì)的畫作,被美院老師評為已經(jīng)具有畢業(yè)生水平。

這兩件事當(dāng)然讓AI數(shù)字人實(shí)力出圈。而在行業(yè)內(nèi)人士看來,這兩件事的核心意義在于,文心大模型做了兩道難度非常高的技術(shù)證明題,展示了大模型不是只能紙上談兵,而是能夠應(yīng)對真正的產(chǎn)業(yè)場景。

在以往的大模型測試中,所使用的基本是內(nèi)容固定、方向單一的數(shù)據(jù)集。這種測試當(dāng)然有一定價(jià)值,但卻與產(chǎn)業(yè)中需求多樣、數(shù)據(jù)樣本稀少、用時(shí)要求苛刻的環(huán)境有天壤之別。

比如說高考作文寫作就是這樣一個(gè)任務(wù)。高考作文比一般的文本生成任務(wù)更長,而且需要保證長文各個(gè)段落之間的邏輯性和連貫性。與此同時(shí),寫作需要徹底理解并且緊扣主題,從而保證中心突出,確保所有信息準(zhǔn)確指向踩分點(diǎn)。這種真正考人,而不是考AI的任務(wù),就是對大模型的一個(gè)巨大挑戰(zhàn)。在AI寫作高考作文中順利完成任務(wù)的,是百度使用了最新推出的文心·NLP大模型 ERNIE 3.0 Zeus。它就像個(gè)見多識廣的“尖子生”“學(xué)霸”,理解能力和創(chuàng)作能力比傳統(tǒng)模型更強(qiáng)。最終展現(xiàn)在我們面前的,就是一篇文辭華美、立意準(zhǔn)確的高考作文。

再說說參加畢業(yè)畫展。我們知道,大模型的特征之一就是不僅能夠處理自然語言處理任務(wù),還在機(jī)器視覺、跨模態(tài)、知識圖譜等領(lǐng)域取得了巨大進(jìn)展。度曉曉在美院畫展上創(chuàng)作的“無界”系列畫作,從不同角度詮釋了AI理解的“無界”,就展現(xiàn)出了文心大模型跨模態(tài)圖文生成模型ERNIE-ViLG,所具備的強(qiáng)大跨模態(tài)理解和生成能力。

跨模態(tài)理解信息,生成內(nèi)容,是人類智力的專屬價(jià)值,也是AI的核心努力方向。根據(jù)題目創(chuàng)作畫作,需要AI對給到的信息進(jìn)行深度理解,緊接著結(jié)合自身聯(lián)接的知識進(jìn)行信息拓展,進(jìn)而闡述創(chuàng)作的靈感,最終再以跨模態(tài)生成的方式完成畫作。文心大模型的這一系列操作行云流水,而且真正做到了信息準(zhǔn)確與藝術(shù)表現(xiàn)力的統(tǒng)一。這種智商與情商兼具的藝術(shù)家,其實(shí)才是最難得的。

這兩件出圈之舉,可以說是文心大模型回答的證明題:向業(yè)界證明了AI大模型不僅能夠堆參數(shù),跑數(shù)據(jù)集。還能夠無差別參加那些只有人類才能參加的活動(dòng),并且給出不屬于人類的完成水準(zhǔn)。我們已經(jīng)不需要謹(jǐn)小慎微地給大模型出題了,廣闊天地,四海八方,或許都是AI可以參與一答的題目。

當(dāng)然,寫作文與作畫背后,不僅是文心大模型的技術(shù)能力自證,同時(shí)也是AIGC產(chǎn)業(yè)方向的清晰標(biāo)識。能夠?qū)懳淖鳟嫷腁I,當(dāng)然也可以在更多內(nèi)容生產(chǎn)中大展身手。比如AI寫歌、AI剪輯等等。

于是,剛剛放下答題紙和畫筆的文心大模型,就跑去寫了首歌,順道組了個(gè)CP。

再來看看“多選題”:和龔俊組CP展示出的應(yīng)用價(jià)值

畢業(yè)季中,走向社會(huì)的年輕人不僅需要證明自己的能力,還需要選擇清楚自己的道路——大模型當(dāng)然也是如此。

于是我們看到,大模型正在越來越多的崗位發(fā)光發(fā)熱,并且還是與明星一起。6月14日,度曉曉與龔俊數(shù)字人聯(lián)合演唱的《每分 每秒 每天》歌曲MV成功刷屏。這是國內(nèi)首支從作詞到編曲都是由AI來完成的虛擬偶像單曲。

此外,度曉曉與龔俊數(shù)字人已經(jīng)入駐百度APP。在用戶使用百度APP的時(shí)候,可以通過搜索框或者底部的語音按鈕發(fā)起聊天類需求。比如用戶說“你好,你多大了,我想你了,我想聊天”,會(huì)直接進(jìn)入搜索負(fù)一樓的對話式框架。度曉曉&龔俊數(shù)字人會(huì)在負(fù)一樓陪伴用戶,進(jìn)行具有深度的語音對話。

為了這份隨時(shí)隨地的陪伴,文心大模型提供了整合了多模態(tài)交互技術(shù)、機(jī)器翻譯、語音識別、自然語言理解等多項(xiàng)能力,從而實(shí)現(xiàn)了個(gè)性化聊天陪伴、輔助搜索、服務(wù)分發(fā)和互動(dòng)玩法四大功能為一體。在百度APP中,用戶可以直接通過個(gè)性化聊天來感受大模型的能力和魅力。文心大模型可以呈現(xiàn)出有上下文聯(lián)系,自然生動(dòng)的聊天互動(dòng),并且在對話中識別用戶是否有搜索需求、服務(wù)類需求等進(jìn)行輔助。而這背后,是全球首個(gè)生成式開放域?qū)υ挻竽P蚉LATO。

PLATO當(dāng)然有著一系列技術(shù)差異性,但或許更重要的是,它清晰展示出了預(yù)訓(xùn)練大模型如何與具體的應(yīng)用場景、實(shí)際應(yīng)用任務(wù)相結(jié)合。大模型的價(jià)值清晰展現(xiàn)在了對以往APP交互的超越上,通過開放域?qū)υ挻竽P停珹PP可以向用戶提供超越以往搜索服務(wù)與語音助手服務(wù)的全新價(jià)值。其體驗(yàn)更加接近與真人互動(dòng),并且比傳統(tǒng)的關(guān)鍵字搜索會(huì)更加人性化、更有針對性,能夠更加準(zhǔn)確理解用戶的需求。

大模型的應(yīng)用價(jià)值,不在于能夠替代此前的某種技術(shù)?;蛘哒f不僅于此,而是可以做出“多選題”,集成多樣化的價(jià)值,應(yīng)用于多樣化的產(chǎn)業(yè)需求。

在數(shù)字人生成、智能客服、AIGC等等領(lǐng)域,可以看到文心大模型都有著真實(shí)且廣泛的產(chǎn)業(yè)級應(yīng)用落地。

一起來做這道“開放題”:大模型剛剛畢業(yè),卻已經(jīng)走向百業(yè)

也許那邊的朋友要問了:這么好的大模型,什么時(shí)候才能體驗(yàn)到呢?答案是,現(xiàn)在。

文心大模型已經(jīng)是一道開放題,等待著千行百業(yè)的你來一起寫畫她的畢業(yè)作品。

舉個(gè)例子,上文提到的ERNIE 3.0 Zeus是文心大模型最新發(fā)布的融合任務(wù)相關(guān)知識的千億大模型,也是國內(nèi)首個(gè)開放API調(diào)用的千億大模型。該模型在學(xué)習(xí)海量數(shù)據(jù)和知識的基礎(chǔ)上,進(jìn)一步學(xué)習(xí)百余種不同形式的任務(wù)知識,增強(qiáng)了模型的效果,在各類NLP任務(wù)上表現(xiàn)出了更強(qiáng)的零樣本和小樣本學(xué)習(xí)能力。而ERNIE 3.0 Zeus的智能寫作功能目前已經(jīng)上線旸谷社區(qū),開發(fā)者可以即可體驗(yàn)到這些前沿技術(shù)帶來的價(jià)值。

既很強(qiáng),也很落地,或許可以被稱為文心大模型的畢業(yè)季口號。這背后是文心大模型的兩大核心特色:產(chǎn)業(yè)級和知識增強(qiáng)。

“知識增強(qiáng)”是文心大模型的核心技術(shù)差異,即通過引入知識圖譜,通過“知識增強(qiáng)”的方法,將數(shù)據(jù)與知識融合,使得文心大模型相較于其他模型,學(xué)習(xí)效率更高、可解釋性更好。這是文心大模型能夠超越眾多“同學(xué)”,率先走向就業(yè)的技術(shù)保障。

而“產(chǎn)業(yè)級”則是百度在大模型落地領(lǐng)域的經(jīng)驗(yàn)、技術(shù)、產(chǎn)品設(shè)計(jì)與生態(tài)培養(yǎng)等等能力的融合。一方面,文心大模型的技術(shù)來源于產(chǎn)業(yè),從設(shè)計(jì)與技術(shù)上就傾向產(chǎn)業(yè)應(yīng)用;另一方面,文心大模型建設(shè)了一系列配套能力和工具,通過多種方式降低大模型應(yīng)用門檻,提升其真實(shí)應(yīng)用的可行性。

在這兩大特性的保證下,百度在全球范圍內(nèi)開啟了一場讓大模型走向產(chǎn)業(yè)的“畢業(yè)旅行”。寫高考作文,畫畢業(yè)作品,與明星一同寫歌,都可以看作這場旅行中的一些風(fēng)景。在更廣闊的產(chǎn)業(yè)原野上,百度還將文心大模型不斷升級,瞄準(zhǔn)各行業(yè)的智能化需求。不久之前的WAVE SUMMIT 2022深度學(xué)習(xí)開發(fā)者峰會(huì)上,文心大模型迎來一系列升級:發(fā)布10個(gè)新的大模型,同時(shí)提出了基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型構(gòu)成的三級體系。讓不同的應(yīng)用場景、行業(yè)需求有不同的大模型支撐,真正讓大模型走向千行百業(yè)。與此同時(shí),考慮到開發(fā)者、應(yīng)用者不同的使用需求和開發(fā)能力,百度還圍繞文心大模型提出了一系列產(chǎn)業(yè)落地的關(guān)鍵路徑,比如建設(shè)更適配場景需求的大模型體系,提供全流程支持應(yīng)用落地的工具、平臺(tái)和方法,建設(shè)激發(fā)創(chuàng)新的開放生態(tài)等。為促進(jìn)大模型惠及最廣泛的行業(yè)與開發(fā)者,配套發(fā)布大模型套件、API體系,以及旸谷大模型創(chuàng)意社區(qū),全方位幫助開發(fā)者更低門檻地應(yīng)用。

如今,智能作畫、智能對話、智能創(chuàng)作、故事生成等大模型創(chuàng)意應(yīng)用已經(jīng)上線旸谷社區(qū)。百度與國家電網(wǎng)、浦發(fā)銀行等行業(yè)頭部企業(yè)進(jìn)行了聯(lián)合研發(fā)與創(chuàng)新,成功實(shí)現(xiàn)了行業(yè)大模型在產(chǎn)業(yè)中落地生根。

從應(yīng)用深度上看,在百度內(nèi)部文心大模型也全面應(yīng)用于智能搜索、信息流、智能音箱等互聯(lián)網(wǎng)產(chǎn)品,大幅提升了用戶獲取信息、知識和服務(wù)的效率和體驗(yàn)。在百度之外,文心大模型的落地應(yīng)用已經(jīng)覆蓋工業(yè)、能源、教育、金融、通信、媒體等眾多行業(yè),例如工業(yè)領(lǐng)域的零部件質(zhì)量檢測、能源領(lǐng)域的輸電線路巡檢、金融行業(yè)的合同信息抽取等等,幫助企業(yè)實(shí)現(xiàn)智能化升級。

百度業(yè)務(wù)中看得到,產(chǎn)業(yè)應(yīng)用里用得到,開發(fā)者找得到,讓文心大模型做成了一道開放題。它的答案,是人人都能成為大模型開發(fā)者,行行都能成為大模型應(yīng)用者。

《經(jīng)濟(jì)學(xué)人》最近發(fā)了一篇關(guān)于大模型的文章,其中提到文心ERNIE大模型是中國最好的預(yù)訓(xùn)練大模型。就我的理解,文心大模型好就好在它的“真”。

真實(shí)的解決技術(shù)難題,而不是用多少億的參數(shù),百分之九十九點(diǎn)多少的分?jǐn)?shù)來證明自己。

真誠不套路的去用,去證明自己的價(jià)值。而不是畫餅充饑,用PPT展示未來。

真正地融入產(chǎn)業(yè),融入需求,賦能開發(fā),筑造生態(tài)。

或許,每個(gè)人在校園里都許下過改變世界的夢想。后來有人真正實(shí)現(xiàn)了,有人沒有。

差別可能就在于畢業(yè)季到來的那天,我們選了什么,做了什么。

致用,務(wù)實(shí),本分,這才是大模型的花樣畢業(yè)季。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-06-16
頻頻破圈,走向百業(yè):大模型的畢業(yè)季
在行業(yè)內(nèi)人士看來,這兩件事的核心意義在于,文心大模型做了兩道難度非常高的技術(shù)證明題,展示了大模型不是只能紙上談兵,而是能夠應(yīng)對真正的產(chǎn)業(yè)場景。

長按掃碼 閱讀全文