大模型的禾下乘涼夢(mèng),百度自己來做試驗(yàn)田

原標(biāo)題:大模型的禾下乘涼夢(mèng),百度自己來做試驗(yàn)田

禾下乘涼夢(mèng),是一個(gè)今天國(guó)人無比熟悉的詞。它來自袁隆平院士對(duì)雜交水稻高產(chǎn)的理想追求,是袁隆平的中國(guó)夢(mèng)。他生前多次提到,夢(mèng)想到禾下乘涼,夢(mèng)里水稻長(zhǎng)得有高粱那么高,籽粒有花生米那么大。

或許,千行百業(yè)都有這樣一個(gè)“禾下乘涼夢(mèng)”??萍继剿鲿?huì)為生產(chǎn)與創(chuàng)造帶來難以估量的價(jià)值,極大改變?nèi)藗兊纳?。?a href="http://ygpos.cn/AI_1.html" target="_blank" class="keylink">AI領(lǐng)域,有一項(xiàng)技術(shù)經(jīng)常讓我聯(lián)想到“禾下乘涼夢(mèng)”,那就是預(yù)訓(xùn)練大模型。在袁隆平院士的夢(mèng)中,雜交水稻會(huì)長(zhǎng)得非常高大,帶來極高的畝產(chǎn)量;大模型也是在訓(xùn)練數(shù)據(jù)與模型規(guī)模上非常大,在模型能力上形成巨大優(yōu)勢(shì)。

從2018年開始,大模型開始作為AI領(lǐng)域重要的技術(shù)方向被廣泛關(guān)注。多年過去,我們對(duì)于大模型最大的期待,或許就在于它能不能從實(shí)驗(yàn)室和數(shù)據(jù)集中的“種子”,真正變成一片片賦能行業(yè),普惠經(jīng)濟(jì)的稻田。

雜交水稻的發(fā)展,離不開精心耕耘的試驗(yàn)田。實(shí)現(xiàn)大模型的“禾下乘涼夢(mèng)”,或許也需要這樣的“試驗(yàn)田”挺身而出,為時(shí)代探明大模型的前進(jìn)方向——這個(gè)關(guān)頭,百度站了出來。

9月23日,2022萬(wàn)象·百度移動(dòng)生態(tài)大會(huì)在廣東珠海召開。會(huì)上,百度集團(tuán)資深副總裁、百度移動(dòng)生態(tài)事業(yè)群組(MEG)總經(jīng)理何俊杰首次對(duì)外全面解讀百度移動(dòng)生態(tài)戰(zhàn)略。其中非常值得注意的一點(diǎn),是會(huì)上詳細(xì)展示了我們熟悉的百度移動(dòng)生態(tài),是如何與百度打造的文心系列大模型深度結(jié)合,帶來搜索、信息流、AIGC等領(lǐng)域的禾木生長(zhǎng)。在百度移動(dòng)生態(tài)中,文心大模型的能力可謂能用盡用,應(yīng)出盡出。

換個(gè)角度想,如果我們想知道未來千行百業(yè)如何在大模型的禾下乘涼,那么今天百度移動(dòng)生態(tài)的場(chǎng)景坐標(biāo),或許正指向著明天智能中國(guó)的大模型之路。

大模型3.0階段,產(chǎn)業(yè)轉(zhuǎn)化成為核心

在討論百度移動(dòng)生態(tài)融合文心大模型能力的重要性之前,我們必須先來了解這背后的技術(shù)與產(chǎn)業(yè)背景。百度移動(dòng)生態(tài)與大模型融合之所以重要,是因?yàn)榇竽P瓦@項(xiàng)技術(shù)本身正處在非常重要的發(fā)展節(jié)點(diǎn)。

從發(fā)展歷程上看,從2018年預(yù)訓(xùn)練大模型開始受到行業(yè)重視算起,大模型的發(fā)展可以歸納為三個(gè)階段。第一階段就是所謂的“大煉模型”。傳統(tǒng)的深度模型已經(jīng)是行業(yè)主旋律,而預(yù)訓(xùn)練大模型作為一種新興的技術(shù)思路,開始進(jìn)入萌芽階段。接下來在第二階段,大模型的價(jià)值得到了產(chǎn)學(xué)各界的普遍認(rèn)同。伴隨著資本與社會(huì)關(guān)注度的廣泛注入,談AI必談大模型成為風(fēng)尚,各界也就進(jìn)入從“大煉模型”到“煉大模型”的轉(zhuǎn)變。在這個(gè)階段中,各種大模型層出不窮,在訓(xùn)練數(shù)據(jù)參數(shù)上的擴(kuò)張,技術(shù)思路的發(fā)展帶來了大模型技術(shù)的繁榮。

當(dāng)大模型的技術(shù)研發(fā)儲(chǔ)備到一定階段,新的挑戰(zhàn)也隨之而來:這么多大模型,到底應(yīng)該如何與產(chǎn)業(yè)應(yīng)用結(jié)合?這個(gè)問題如果不能妥善解決,那么大模型的繁榮發(fā)展終究是空中樓閣。所以,大模型的3.0階段,就是從“煉大模型”到“用大模型”的轉(zhuǎn)變。如何實(shí)現(xiàn)有效的產(chǎn)業(yè)轉(zhuǎn)化,已經(jīng)變成了目前階段大模型領(lǐng)域的最核心任務(wù)。

想要用好大模型,從技術(shù)向產(chǎn)業(yè)的轉(zhuǎn)化邏輯上看,需要具備三個(gè)前提條件:技術(shù)過硬,平臺(tái)與工具齊備,有清晰明確的場(chǎng)景價(jià)值作為示范。而一路深耕文心系列大模型的百度,顯然在前兩項(xiàng)能力中具備先發(fā)優(yōu)勢(shì)。

百度自2019年開始深耕預(yù)訓(xùn)練模型研發(fā),發(fā)布了知識(shí)增強(qiáng)文心ERNIE系列模型。2021年12月,百度與鵬城實(shí)驗(yàn)室聯(lián)合發(fā)布全球首個(gè)知識(shí)增強(qiáng)千億大模型“鵬城-百度·文心”,參數(shù)規(guī)模達(dá)到2600億,在60多項(xiàng)NLP任務(wù)中取得最好效果。2022年5月的Wave Summit深度學(xué)習(xí)開發(fā)者峰會(huì)上,百度發(fā)布10個(gè)大模型,包括融合學(xué)習(xí)任務(wù)知識(shí)的知識(shí)增強(qiáng)千億大模型、多任務(wù)統(tǒng)一學(xué)習(xí)的視覺大模型、跨模態(tài)大模型、生物計(jì)算大模型、行業(yè)大模型等,并提出支撐大模型產(chǎn)業(yè)落地的3個(gè)關(guān)鍵路徑:建設(shè)更適配場(chǎng)景需求的大模型體系,提供全流程支持應(yīng)用落地的工具、平臺(tái)和方法,建設(shè)激發(fā)創(chuàng)新的開放生態(tài)等。

至此,文心大模型已經(jīng)既包含基礎(chǔ)的通用大模型,也包含面向重點(diǎn)任務(wù)領(lǐng)域的行業(yè)大模型,同時(shí)還具備豐富的工具平臺(tái)。從技術(shù)過硬角度看,文心大模型具有知識(shí)增強(qiáng)的差異化優(yōu)勢(shì),可以從大規(guī)模知識(shí)圖譜和海量無結(jié)構(gòu)數(shù)據(jù)中完成學(xué)習(xí),從而實(shí)現(xiàn)模型效率更高、效果更好,具有良好的可解釋性。從平臺(tái)建設(shè)與產(chǎn)業(yè)轉(zhuǎn)化上看,文心大模型具有產(chǎn)業(yè)級(jí)特性,提供全流程支持應(yīng)用落地的工具和方法,營(yíng)造激發(fā)創(chuàng)新的開放生態(tài)。

換言之,清晰的場(chǎng)景化示范價(jià)值,是文心大模型推動(dòng)大模型走向3.0階段的“最后一公里”。這個(gè)時(shí)候,百度豐富的產(chǎn)業(yè)生態(tài)布局,就體現(xiàn)出了關(guān)鍵價(jià)值。

百度移動(dòng)生態(tài),做大模型時(shí)代的“試驗(yàn)田”

在科技領(lǐng)域有句話,叫“自己的降落傘自己先跳”。對(duì)于希望率先探索大模型應(yīng)用與產(chǎn)業(yè)轉(zhuǎn)化的百度來說,也必須“自己的大模型自己先用”。

好在百度豐富的移動(dòng)生態(tài)布局,不僅是大模型應(yīng)用的價(jià)值沃土,更能以其苛刻的技術(shù)要求、清晰的能力展現(xiàn)、具有代表性的應(yīng)用場(chǎng)景,成為更多開發(fā)者與企業(yè)的大模型“試驗(yàn)田”。

2022萬(wàn)象·百度移動(dòng)生態(tài)大會(huì)中,我們看到了百度移動(dòng)生態(tài)與文心大模型基礎(chǔ)能力豐富多元的融合。百度移動(dòng)生態(tài),向來是百度AI技術(shù)落地的“首站”,長(zhǎng)期秉持著AI技術(shù)能用盡用、能出盡出的原則。

而在與大模型的結(jié)合上,我們首先可以看到百度最新發(fā)布了面向搜索場(chǎng)景的跨模態(tài)大模型“知一”。它可以理解全網(wǎng)文本、圖片、視頻、結(jié)構(gòu)化信息等形態(tài)各異的資源,從而打破資源形態(tài)的界限,將最滿足用戶需求的結(jié)果呈現(xiàn)給用戶,真正實(shí)現(xiàn)大模型技術(shù)與搜索、信息流等百度核心業(yè)務(wù)的深度融合。

而對(duì)于更多百度移動(dòng)生態(tài)中的開發(fā)者、創(chuàng)作者而言,基于文心大模型打造的“創(chuàng)作者AI助理團(tuán)”可以帶來劃時(shí)代的AIGC體驗(yàn)。這個(gè)AI團(tuán)隊(duì)里,有文案、有插畫師、有視頻制作人,在這些“助理”們的齊心努力下,可以讓創(chuàng)作者實(shí)現(xiàn)“一個(gè)人成為一支隊(duì)伍”。

基于百度文心大模型,“AI文案助理”可以根據(jù)創(chuàng)作者的需求快速產(chǎn)出不同風(fēng)格的文章標(biāo)題、內(nèi)容段落,“AI插畫助理”可以根據(jù)關(guān)鍵詞,自動(dòng)“畫”出十余種不同風(fēng)格的畫作,讓創(chuàng)作者實(shí)現(xiàn)“配圖自由”。相關(guān)能力,目前已經(jīng)可以在百度APP中體驗(yàn),效果十分突出。

“AI視頻制作助理”基于文心大模型的自然語(yǔ)言處理和跨模態(tài)AI技術(shù),讓創(chuàng)作者的圖文自動(dòng)生成視頻,速度可達(dá)“分鐘級(jí)”。這項(xiàng)技術(shù)讓創(chuàng)作者從圖文到視頻的創(chuàng)作周期縮短了3倍以上,而且也為創(chuàng)作者帶來“一篇內(nèi)容,兩種收益”的效果。

“創(chuàng)作者AI助理團(tuán)”,可說是全景式展現(xiàn)了大模型的一個(gè)應(yīng)用價(jià)值——AIGC(AI Generated Content,人工智能自動(dòng)生成內(nèi)容)?;诖竽P痛蛟斓腁IGC能力,可以實(shí)現(xiàn)多種多樣的AI自主創(chuàng)作,以及形態(tài)豐富的創(chuàng)作輔助功能,實(shí)現(xiàn)自動(dòng)生產(chǎn)文案、自動(dòng)生產(chǎn)圖片、圖文轉(zhuǎn)視頻等一系列技術(shù)飛躍。目前,“創(chuàng)作者AI助理團(tuán)”已經(jīng)開始邀請(qǐng)內(nèi)測(cè),將從今年第四季度起陸續(xù)向更多創(chuàng)作者開放。

由此我們不難看出,文心大模型帶給百度移動(dòng)生態(tài)的能力并不是“錦上添花”的簡(jiǎn)單能力升級(jí),而是實(shí)打?qū)嵉目缭绞絼?chuàng)新,甚至可以說解決了移動(dòng)開發(fā)者、創(chuàng)作者長(zhǎng)期以來最核心的創(chuàng)作門檻困擾,讓創(chuàng)作者聚焦于創(chuàng)作的最核心部分。

這樣的能力升級(jí),當(dāng)然對(duì)于百度移動(dòng)生態(tài)的未來發(fā)展至關(guān)重要。但更重要的,可能是這種結(jié)合展示了一種可能,一種大模型走向深度產(chǎn)業(yè)應(yīng)用的可能。

AIGC豐收時(shí),行業(yè)轉(zhuǎn)化深耕中:文心大模型的禾下乘涼夢(mèng)

不久之前,科技部發(fā)布了《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場(chǎng)景的通知》(以下簡(jiǎn)稱《通知》),指出要充分發(fā)揮人工智能賦能經(jīng)濟(jì)社會(huì)發(fā)展的作用,打造形成一批可復(fù)制、可推廣的標(biāo)桿型示范應(yīng)用場(chǎng)景。

不難看出,以場(chǎng)景作為先導(dǎo),快速實(shí)現(xiàn)AI技術(shù)的行業(yè)落地與規(guī)?;o助正在成為目前AI產(chǎn)業(yè)發(fā)展的主要任務(wù)。對(duì)于大模型來說也是如此,各行業(yè)想要真正理解大模型的價(jià)值,應(yīng)用大模型的能力,首先需要以場(chǎng)景為先導(dǎo),以示范為坐標(biāo)。

百度移動(dòng)生態(tài)對(duì)于大模型的深入應(yīng)用,正好可以構(gòu)成這種迫切為時(shí)代所需要的場(chǎng)景示范。從大模型走向產(chǎn)業(yè)轉(zhuǎn)化的路徑上看,百度移動(dòng)首先證明了AIGC的可用性。AIGC作為大模型走向產(chǎn)業(yè)的重要一站,更多行業(yè)可以從百度的經(jīng)驗(yàn)中消化并吸納AIGC的價(jià)值,從而實(shí)現(xiàn)自身的大模型落地。其次,百度移動(dòng)生態(tài)與大模型融合,還證明了大模型與產(chǎn)業(yè)需求、產(chǎn)業(yè)真實(shí)情況的融合價(jià)值。百度移動(dòng)生態(tài)擁有著巨大的流量以及多樣化的業(yè)務(wù),這些條件都是對(duì)大模型可用性的考驗(yàn)。

知名經(jīng)濟(jì)學(xué)家任澤平也在萬(wàn)象大會(huì)期間表示:“在AIGC的時(shí)代,百度APP作為‘前哨’和‘根據(jù)地’,是AIGC應(yīng)用最廣闊的天地,也將成為人人皆可用的AI新基建。這種‘百度搭臺(tái),人人唱戲’的模式,將會(huì)激發(fā)全民更大的創(chuàng)造力,很多新模式、新應(yīng)用都會(huì)破土而出?!?/p>

從文心大模型與百度移動(dòng)生態(tài)的結(jié)合,到AIGC產(chǎn)業(yè)實(shí)踐的探索,再到更多行業(yè)應(yīng)用大模型的可能,我們可以看到這個(gè)路徑為大模型的3.0階段帶來了三重價(jià)值。

1.自種自證:大模型的技術(shù)能力已經(jīng)趨向飽滿

百度移動(dòng)生態(tài)對(duì)文心大模型的應(yīng)用,首先讓各行業(yè)的開發(fā)者看到了大模型能做什么,有著怎樣的想象力,而這歸其根本來自文心大模型的技術(shù)能力。大模型的種子,需要在土壤中證明自己的價(jià)值,而AIGC與百度移動(dòng)生態(tài)就提供了這樣的土壤。以AI智能寫作為例, ERNIE 3.0 Zeus是文心大模型最新發(fā)布的融合任務(wù)相關(guān)知識(shí)的千億大模型,其在學(xué)習(xí)海量數(shù)據(jù)和知識(shí)的基礎(chǔ)上,進(jìn)一步學(xué)習(xí)百余種不同形式的任務(wù)知識(shí),在各類任務(wù)表現(xiàn)出了更強(qiáng)的創(chuàng)作能力。從財(cái)經(jīng)、體育類新聞快訊,再到詩(shī)歌、小說等文學(xué)創(chuàng)作,AI寫作覆蓋的領(lǐng)域越來越廣,創(chuàng)作形式和內(nèi)容也變得更加豐富多彩。

今年高考期間,ERNIE 3.0 Zeus 加持的AI數(shù)字人度曉曉挑戰(zhàn)寫高考作文,以40秒40篇的速度,獲得了位列總考生前25%的成績(jī)。 ERNIE 3.0 Zeus的智能創(chuàng)作能力目前已經(jīng)對(duì)外開放,各行各業(yè)的廣大開發(fā)者可以在線體驗(yàn)與定制ERNIE 3.0 Zeus的文本創(chuàng)作能力。再說說AI作畫,AI作畫這樣的AIGC應(yīng)用想要得到保障,背后是文心跨模態(tài)大模型的有力支撐,作為全球最大中文跨模態(tài)生成模型,文心ERNIE-ViLG參數(shù)規(guī)模已達(dá)100億,它將「文生成圖」和「圖生成文」任務(wù)融合到同一個(gè)模型進(jìn)行端到端學(xué)習(xí),從而增強(qiáng)文本和圖像的跨模態(tài)語(yǔ)義對(duì)齊。而近期文心ERNIE-ViLG文圖生成算法迎來升級(jí),通過漸進(jìn)式擴(kuò)散模型,生成空間由小及大、生成輪廓由粗到細(xì),同時(shí)根據(jù)生成階段自動(dòng)選擇最優(yōu)生成網(wǎng)絡(luò),文本生成圖像的效果取得進(jìn)一步提升??梢哉f,每一幅AI畫作的背后,都有文心大模型技術(shù)能力飽滿的證明。

2.沃土通衢:產(chǎn)業(yè)工具與開發(fā)平臺(tái)逐漸完備

各行業(yè)、各領(lǐng)域中的開發(fā)者,想要真正用到大模型,就需要針對(duì)性的平臺(tái)與工具,從而降低技術(shù)獲取門檻,提升產(chǎn)業(yè)開發(fā)效率。為此,文心大模型在工具化、平臺(tái)化中進(jìn)行了豐富的探索。以AI作畫為例,文心一格是百度推出的AI藝術(shù)和創(chuàng)意輔助平臺(tái),是百度依托于飛槳、文心大模型持續(xù)的技術(shù)創(chuàng)新,在“AI作圖”方面發(fā)布的產(chǎn)品。面向有設(shè)計(jì)需求和創(chuàng)意的人群,文心一格可以基于文心大模型智能生成多樣化AI創(chuàng)意圖片,輔助創(chuàng)意設(shè)計(jì),打破創(chuàng)意瓶頸。對(duì)便捷性需求更高的開發(fā)者,還可以使用文心文圖生成大模型ERNIE-ViLG 服務(wù),極速獲得沉浸式文圖生成大模型的技術(shù)體驗(yàn),更可靈活方便、高效地實(shí)現(xiàn)產(chǎn)品集成。這樣我們可以看到,對(duì)AI作畫有不同需求、不同考量的開發(fā)者,都有平臺(tái)和工具來獲取自己想要的AIGC能力。這就是大模型走向行業(yè),走向應(yīng)用的沃土通衢。

3.禾下乘涼:大模型規(guī)?;瘧?yīng)用的開始

面向更廣闊的行業(yè)應(yīng)用前景與產(chǎn)業(yè)想象力,文心大模型不僅僅推動(dòng)與百度業(yè)務(wù)的結(jié)合,更積極探索對(duì)外賦能的形式與方法。文心大模型具備的知識(shí)增強(qiáng)特性,本身就可以實(shí)現(xiàn)在實(shí)體問答、知識(shí)預(yù)測(cè)等領(lǐng)域獲得更好效果,提升大模型在行業(yè)場(chǎng)景中的可用性。同時(shí),文心·行業(yè)大模型采用行業(yè)知識(shí)增強(qiáng)技術(shù)對(duì)行業(yè)特色數(shù)據(jù)與行業(yè)特色知識(shí)學(xué)習(xí),進(jìn)而提升大模型對(duì)行業(yè)應(yīng)用的適配性。目前文心已經(jīng)聯(lián)合國(guó)家電網(wǎng)、浦發(fā)銀行發(fā)布知識(shí)增強(qiáng)的電力行業(yè)NLP大模型“國(guó)網(wǎng)-百度·文心”、金融行業(yè)NLP大模型“浦發(fā)-百度·文心”,已在電力、金融相關(guān)任務(wù)完成落地應(yīng)用。在航天領(lǐng)域,文心大模型攜手中國(guó)航天發(fā)布世界上首個(gè)航天大模型——“航天-百度·文心大模型”,推進(jìn)航天領(lǐng)域AI技術(shù)應(yīng)用。

文心大模型早已推出了開發(fā)套件、API和內(nèi)置文心大模型能力的開發(fā)平臺(tái),可以讓不同領(lǐng)域、不同需求的產(chǎn)業(yè)開發(fā)者以更低成本、更低門檻精準(zhǔn)獲得大模型賦能,促進(jìn)人工智能的進(jìn)一步廣泛應(yīng)用。

文心大模型在產(chǎn)業(yè)中加速落地,正在成為推動(dòng)AIGC發(fā)展的新引擎,同時(shí)也在成為推動(dòng)產(chǎn)業(yè)智能化的新基座。大模型的規(guī)?;瘧?yīng)用和落地千行百業(yè),或許就是我們期待的那個(gè)智能中國(guó)的禾下乘涼夢(mèng)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-09-27
大模型的禾下乘涼夢(mèng),百度自己來做試驗(yàn)田
好在百度豐富的移動(dòng)生態(tài)布局,不僅是大模型應(yīng)用的價(jià)值沃土,更能以其苛刻的技術(shù)要求、清晰的能力展現(xiàn)、具有代表性的應(yīng)用場(chǎng)景,成為更多開發(fā)者與企業(yè)的大模型“試驗(yàn)田”。

長(zhǎng)按掃碼 閱讀全文