百度:不做大模型王者,要做AI世界的基石

討論國產(chǎn)AI大模型,百度是繞不過的話題。作為中國AI產(chǎn)業(yè)的扛旗者,百度在AI技術(shù)上擁有足夠高的話語權(quán),其推出的文心大模型被視作是最有機(jī)會追趕GPT的國產(chǎn)基礎(chǔ)大模型。不過從最新的發(fā)布來看,百度在AI大模型這件事上,似乎并不想過度地卷參數(shù),而是將重心放在了落地上,給人們提供開發(fā)AI應(yīng)用的工具,則是百度推動AI大模型落地的關(guān)鍵。

4月16日,Create 2024 百度AI開發(fā)者大會在深圳舉行。從現(xiàn)場人流量可以看出,AI依然是科技圈頂流?,F(xiàn)場嘉賓中,有企業(yè)高管,有技術(shù)人員,有銷售人員,有高校學(xué)生……所有人都在學(xué)習(xí)AI大模型,都在尋覓AI大模型的機(jī)會。

自去年以來,諸多熱門AI大模型技術(shù)持續(xù)占據(jù)媒體頭條,對普通人來說卻遙不可及。當(dāng)所有人都在仰望神壇上的AI大模型技術(shù)時,百度決定要讓AI技術(shù)走下神壇,這正是李彥宏的演講主題《人人都是開發(fā)者》所表達(dá)的愿景。

李彥宏沒有過多地介紹文心大模型的技術(shù)優(yōu)勢,而是將主題圍繞開發(fā)者,將更多時間給到了“工具”。

為什么要讓工具成為這屆開發(fā)者大會的主角?用李彥宏的話說是:"大語言模型本身并不直接創(chuàng)造價值,基于大模型開發(fā)出來的AI原生應(yīng)用才能滿足真實(shí)的市場需求?!备鶕?jù)過去一年的實(shí)踐,踩了無數(shù)的坑,交了高昂的學(xué)費(fèi)后,百度積累了基于大模型開發(fā)AI原生應(yīng)用的思路,并帶來三大AI開發(fā)神器:智能體開發(fā)工具AgentBuilder、AI原生應(yīng)用開發(fā)工具AppBuilder、各種尺寸的模型定制工具M(jìn)odelBuilder。

三大AI開發(fā)神器,讓“人人都是開發(fā)者”不是夢

在2023年10月,百度發(fā)布了文心大模型4.0版本。為了推動AI大模型落地,李彥宏提出了AI原生應(yīng)用概念,他認(rèn)為大模型技術(shù)和AI原生應(yīng)用是一體兩面、共生共存:前者的理解、生成、邏輯、記憶四大能力的進(jìn)步是AI原生應(yīng)用不可或缺的生存土壤;反過來,如果沒有AI原生應(yīng)用在各個場景的落地、普及,大模型技術(shù)也就失去了現(xiàn)實(shí)意義。

簡單地說,AI原生應(yīng)用之于大模型技術(shù),如同App之于移動互聯(lián)網(wǎng)。所有應(yīng)用都值得用AI重做一遍,在AI大模型上也將長出截然不同的新應(yīng)用。

然而,對于絕大多數(shù)企業(yè)與個體來說,開發(fā)App本身就是高門檻的事,基于大模型開發(fā)AI原生應(yīng)用,門檻更是指數(shù)級上升:大模型技術(shù)新,人才本就奇缺,大模型技術(shù)還高度復(fù)雜、且日新月異,開發(fā)難度更高,很多學(xué)計算機(jī)類專業(yè)的程序員在未經(jīng)專業(yè)培訓(xùn)時都難以掌握。

提供專門的AI原生應(yīng)用開發(fā)工具就成為大模型落地的燃眉之急。2023年10月提出AI原生應(yīng)用概念時,百度就意識到這一問題,且提出了要讓AI原生應(yīng)用開發(fā)更敏捷的目標(biāo)。隨著代碼大模型技術(shù)本身的快速升級,百度如今推出了可以讓人人成為開發(fā)者的系列AI開發(fā)工具。

1、AgentBuilder是人人可用的智能體開發(fā)工具,用戶不需掌握任何編程技術(shù),即可用“對話式交互”的模式,用自然語言輸入指令創(chuàng)造AI原生應(yīng)用。目前已有新加坡旅游局、啟德教育和索菲亞等上萬家企業(yè)、5萬多名開發(fā)者基于AgentBuilder開發(fā)智能體,最快5分鐘即可創(chuàng)建完成。

2、AppBuilder是目前最好用的AI原生應(yīng)用開發(fā)工具。百度已提前將開發(fā)AI原生應(yīng)用所需的組件和框架封裝在AppBuilder中,開發(fā)者最快三步就可以開發(fā)一個AI原生應(yīng)用,且依然是自然語言編程。李彥宏在現(xiàn)場基于AppBuilder進(jìn)行AI原生應(yīng)用開發(fā)實(shí)戰(zhàn),演示了“游樂場排隊(duì)助手”、華北電力大學(xué)“華電AI助理”和百度文庫智能漫畫生成三個AI原生應(yīng)用的創(chuàng)建過程。

3、ModelBuilder是面向?qū)I(yè)開發(fā)者的模型定制工具,其預(yù)置了最全面最豐富的大模型(高達(dá)77個),包括旗艦基礎(chǔ)大模型ERNIE3.5、ERNIE4.0,百度旗下的多款輕量級大模型以及垂直模型,以及第三方主流模型。ModelBuilder可以根據(jù)開發(fā)者的需求定制任意尺寸的模型,并根據(jù)細(xì)分場景對模型進(jìn)一步精調(diào),達(dá)到更好的效果,李彥宏在現(xiàn)場展示了基于ModelBuilder開發(fā)教育行業(yè)的“作文批改助手”,不僅可以擁有更專業(yè)的老師點(diǎn)評思維、做到格式遵循,而且相比未精調(diào)模型,精調(diào)后的模型打分與真實(shí)的老師點(diǎn)評分?jǐn)?shù)更為接近。

AgentBuilder、AppBuilder、ModelBuilder三大AI開發(fā)神器的底層,則是強(qiáng)大的代碼大模型技術(shù)。據(jù)李彥宏介紹,文心大模型快速進(jìn)化,其中“代碼”是重要升級領(lǐng)域,其在代碼生成、代碼解釋、代碼優(yōu)化等通用能力方面實(shí)現(xiàn)了進(jìn)一步的顯著提升,達(dá)到國際領(lǐng)先水平。

在一年多前,百度就基于文心大模型推出智能代碼助手Comate,支持100多種語言和主流IDE平臺,可推薦代碼、生成代碼注釋、進(jìn)行代碼續(xù)寫、查找代碼缺陷、給出優(yōu)化方案,還可深度解讀代碼庫、關(guān)聯(lián)私域知識生成新代碼,目前已被百度自身,以及喜馬拉雅、三菱電梯、軟通動力等上萬家企業(yè)應(yīng)用,生成代碼采納率達(dá)46%,百度每天新增代碼中已有27%由其生成。

在開發(fā)者大會上,李彥宏還發(fā)布了文心大模型4.0的工具版,讓開發(fā)者可在工具版上使用代碼解釋器功能,通過自然語言交互實(shí)現(xiàn)對復(fù)雜數(shù)據(jù)和文件的處理與分析,還可以生成圖表或文件,能夠快速洞察數(shù)據(jù)中的特點(diǎn)、分析變化趨勢。

隨著大模型在代碼領(lǐng)域的持續(xù)進(jìn)階,以及AgentBuilder、AppBuilder這樣的低門檻甚至零門檻開發(fā)工具的出現(xiàn),自然語言編程不再是夢想,每個人都可以使用自然語言來表達(dá)自己的需求、構(gòu)建需要的程序,專業(yè)程序員則可以靠ModelBuilder專業(yè)工具大幅提高效率,減少重復(fù)工作,聚焦在業(yè)務(wù)與創(chuàng)造本身。

正如李彥宏所說:“AI正在掀起一場創(chuàng)造力革命,未來開發(fā)應(yīng)用就像拍個短視頻一樣簡單,人人都是開發(fā)者,人人都是創(chuàng)造者?!彼踔翗酚^地表示:“你只要會說話,就可以成為一名開發(fā)者,用自己的創(chuàng)造力改變世界。

有了計算機(jī)就有了編程的概念。編程語言一直在進(jìn)化,從最初的二進(jìn)制,到后來的機(jī)器代碼,到匯編語言,再到高級語言。這些年,高級語言也在不斷革新。而編程語言不斷進(jìn)階的目的,就是為了讓編程難度更低、效率更高。按照這樣的路線來看,人人都掌握的自然語言將是“編程語言”進(jìn)化的終極形態(tài)。

不只是百度意識到這樣的趨勢,此前,英偉達(dá)CEO黃仁勛也曾表示,AI可以讓每個人都能編程:“編程語言可以普及成為人類的語言,現(xiàn)在世界上每個人都是程序員。這就是人工智能的奇跡?!?/p>

英雄所見略同,百度發(fā)布三大AI開發(fā)神器,讓“人人都是開發(fā)者”變?yōu)楝F(xiàn)實(shí),讓每個人都可以更好地掌控、利用和挖掘AI紅利,創(chuàng)造更好的世界。

不卷參數(shù)卷工具,百度成為AI普及的推手

在這屆開發(fā)者大會上,李彥宏也有分享百度文心大模型的最新進(jìn)展。截至目前,文心大模型已經(jīng)成為了中國最領(lǐng)先、應(yīng)用最廣泛的AI基礎(chǔ)模型?;谖男拇竽P偷腁I原生爆款應(yīng)用文心一言在發(fā)布一年后,用戶數(shù)已突破2億,API日均調(diào)用量也突破2億,服務(wù)客戶數(shù)達(dá)到了8.5萬,利用千帆平臺開發(fā)的AI原生應(yīng)用數(shù)超過了19萬。

絲毫不難發(fā)現(xiàn):百度絲毫沒有要卷大模型參數(shù)“堆料”的意思,它分享的核心數(shù)據(jù)均關(guān)系到大模型的應(yīng)用進(jìn)展,它正在進(jìn)行的一切努力也圍繞著大模型落地進(jìn)行。

首先是提供更全、更好、更智能的應(yīng)用開發(fā)工具。

在“百模大戰(zhàn)”如火如荼且許多大模型走向開源后,當(dāng)下的市場不再需要更多的基礎(chǔ)大模型。市場真正緊缺的,一個是具有世界級競爭力的頂尖大模型,這是文心大模型努力的方向;另一個則是基于AI大模型的殺手锏應(yīng)用。只有形成類似于AppStore這樣的繁榮的原生AI應(yīng)用生態(tài),AI大模型技術(shù)才算真正實(shí)現(xiàn)了爆發(fā)。

然而,AI原生應(yīng)用開發(fā)徹底改變了軟件開發(fā)的思路,不再是面向過程也不再是面向?qū)ο?,而是“面向智能”,開發(fā)者需要調(diào)用、組合模型的能力來創(chuàng)造應(yīng)用,傳統(tǒng)的開發(fā)工具體系很難適應(yīng)這樣的新型開發(fā)模式。因此,不論是從0到1的新建,抑或是對成熟應(yīng)用的改造,AI原生應(yīng)用的構(gòu)建都必須要有更適合的專業(yè)AI大模型應(yīng)用開發(fā)工具,就像網(wǎng)站、軟件、App開發(fā)有各自的專門工具體系一樣。

于是我們發(fā)現(xiàn),“工具”成了百度這屆AI開發(fā)者大會的最高頻的關(guān)鍵詞。

其次是不斷降低大模型成本,讓開發(fā)者愿意用、用得起、用得多。

除了降低AI原生應(yīng)用開發(fā)門檻外,百度也在努力降低大模型的計算成本。從“囤卡現(xiàn)象”,到“電力短缺”,諸多與大模型相關(guān)的新聞均表明AI大模型應(yīng)用成本高昂務(wù)必。然而,技術(shù)普及的關(guān)鍵就在于成本降低。從飛機(jī)到5G網(wǎng)絡(luò)到電動車再到智能駕駛,每一個技術(shù)走向爆發(fā)都會經(jīng)歷一個進(jìn)化曲線:隨著技術(shù)不斷發(fā)展,產(chǎn)品化與商用化加速促進(jìn)成本降低,到達(dá)一個奇點(diǎn)時,成本出現(xiàn)質(zhì)變,走向大規(guī)模普及。

推動大模型經(jīng)濟(jì)成本降低,百度雙管齊下:

一方面是技術(shù)降本。在芯片、框架、模型、應(yīng)用這四層架構(gòu)上有著全棧的布局,具備端到端這一模式的先天優(yōu)勢,基于此可不斷地將模型成本打下來,讓更多人都可以高效、低價地用大模型來做AI應(yīng)用,且不斷提高文心大模型和文心一言的效率。

另一方面是規(guī)模降本。在GPT出圈以前的2019年,百度就已布局大模型技術(shù)并推動落地。大模型用得越多越智能,也越便宜。隨著百度大模型技術(shù)的規(guī)?;涞?,技術(shù)持續(xù)進(jìn)化的同時成本不斷降低,飛輪效應(yīng)已然形成。據(jù)李彥宏介紹,“相比一年前,文心大模型的算法訓(xùn)練效率提升到了原來的5.1倍,周均訓(xùn)練有效率達(dá)到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。也就是說,客戶原來一天調(diào)用1萬次,同樣成本現(xiàn)在一天可以調(diào)用100萬次?!?/p>

最后、建立AI大模型生態(tài),鼓勵A(yù)I原生應(yīng)用創(chuàng)新。

在這屆開發(fā)者大會上,李彥宏宣布,第二屆“文心杯”創(chuàng)業(yè)大賽正式啟動,這是一個鼓勵開發(fā)者基于大模型開發(fā)AI原生應(yīng)用的大賽。2023年5月百度首次啟動“文心杯”創(chuàng)業(yè)大賽,一共給15支優(yōu)勝團(tuán)隊(duì)提供了數(shù)千萬元的資金支持。今年百度“文心杯”創(chuàng)業(yè)大賽力度更大,首次設(shè)立‘特別大獎’,特別優(yōu)秀的項(xiàng)目,將有機(jī)會獲得5000萬人民幣的現(xiàn)金和資源支持。

不論是WEB時代的網(wǎng)站,抑或是移動時代的App,任何應(yīng)用生態(tài)的繁榮都來自于開發(fā)者的創(chuàng)新。在AI原生應(yīng)用生態(tài)中,百度一方面提供更強(qiáng)的基礎(chǔ)大模型技術(shù)基石,和更成熟的配套開發(fā)工具支持,另一方面則營造良好的創(chuàng)新生態(tài),降低開發(fā)門檻,吸聚開發(fā)者,發(fā)揮中國創(chuàng)業(yè)者善于做應(yīng)用落地的優(yōu)勢,推動大模型上更早長出更多成功的AI原生應(yīng)用。

李彥宏多年來一直扮演著“AI布道師”角色,自深度學(xué)習(xí)時代起就一直為AI產(chǎn)業(yè)化搖旗吶喊,致力于讓全社會理解AI、重視AI、用好AI。在演講的最后,李彥宏動情地表示:“今天的中國,有10億互聯(lián)網(wǎng)用戶,有強(qiáng)大的基礎(chǔ)大模型,有足夠多的AI應(yīng)用場景,有全球最完備的產(chǎn)業(yè)體系,國家也在大力鼓勵和支持‘人工智能+’行動,每一個人,每一家企業(yè),只需要充分利用這些工具,就可以釋放無限的創(chuàng)造力和生產(chǎn)力?!?/p>

百度AI的落地范式,行業(yè)的游戲規(guī)則

2023年,大模型就已成為科技產(chǎn)業(yè)的頭等大事,中國興起了如火如荼的“百模大戰(zhàn)”。然而迄今為止,真正讓用戶有感知的AI大模型應(yīng)用仍是鳳毛麟角。雖然時不時會有類似于Sora、Suno這樣的AI大模型爆款應(yīng)用或者技術(shù)刷屏,但它們大都僅限于“娛樂”,且往往會“曇花一現(xiàn)”,因?yàn)闊o法真正解決用戶生活中面臨的問題,或者沒有給企業(yè)帶來任何實(shí)質(zhì)性價值。

由此可見,“落地”依然是大模型以及AI發(fā)展的重中之重。行業(yè)亟待殺手锏應(yīng)用的出現(xiàn),亟待能跑通商業(yè)模式的大模型應(yīng)用,亟待更繁榮的AI應(yīng)用生態(tài)。在這樣的關(guān)鍵窗口期,百度旗幟鮮明展現(xiàn)出的AI觀,正是行業(yè)需要的AI觀。

當(dāng)行業(yè)在卷開源“重復(fù)造輪子”,或者圍繞“比大更大”的參數(shù)進(jìn)行軍備競賽時,百度公然“唱反調(diào)”,只做有價值的大模型,號召開發(fā)者使用更合適(而不是更大)的模型,讓行業(yè)回到理性發(fā)展的軌道。

在開發(fā)者大會上,李彥宏甚至直言,“開源模型會越來越落后?!痹诎俣瓤磥?,未來絕大多數(shù)AI原生應(yīng)用都是MoE的,即大小模型的混用,不依賴一個模型來解決所有問題;小模型推理成本低,響應(yīng)速度快,在一些特定場景中,經(jīng)過精調(diào)后的小模型,它的使用效果可以比美大模型?;诖?,開發(fā)者可在強(qiáng)大的基礎(chǔ)模型文心4.0之上,根據(jù)需要,兼顧效果、相應(yīng)速度,推理成本等各種考慮,剪裁出適合各種場景的更小尺寸模型,并且支持精調(diào)和post pretrain。這樣通過降維剪裁出來的模型,比直接用開源模型調(diào)出來的模型,同等尺寸下,效果明顯更好;同等效果下,成本明顯更低?!八蚤_源模型會越來越落后?!?/p>

在大模型基座研發(fā)上,百度在確保文心大模型自主可控、技術(shù)領(lǐng)先的同時,強(qiáng)化中文等獨(dú)特優(yōu)勢。同時,圍繞多模態(tài)大模型等垂直場景構(gòu)筑長板優(yōu)勢,李彥宏在開發(fā)者大會上表示:“視覺大模型最大的應(yīng)用場景是自動駕駛。百度在這個方向上是最好的,是自動駕駛的全球領(lǐng)導(dǎo)者,我們不只訓(xùn)練AI如何生成視頻,更訓(xùn)練AI理解真實(shí)世界發(fā)生的事情并預(yù)測未來?!边@一點(diǎn)馬斯克也曾發(fā)出同樣的感慨,在Sora發(fā)布后他在X上直言:特斯拉的視頻生成技術(shù)是世界上最好的,甚至超過OpenAI的Sora,原因在于特斯拉擁有強(qiáng)大的自動駕駛技術(shù)。

更重要的是,百度將“落地”視作發(fā)展大模型AI的頭等大事。技術(shù)只有落地才有價值,大模型只有轉(zhuǎn)化成AI應(yīng)用才能為人類所用。不論是提出AI原生應(yīng)用的暢想,抑或是推出成套的AI開發(fā)神器,都表明百度在力所能及地推動AI大模型落地。

作為技術(shù)領(lǐng)先者的百度,已然成為AI大模型落地的關(guān)鍵推手,其AI觀已成為行業(yè)游戲規(guī)則,將讓AI大模型健康發(fā)展,讓AI大模型的普惠時刻更早來臨。

大模型落地不需要“大炮打蚊子”?!斑m合的才是最好的?!卑俣纫詣?wù)實(shí)的態(tài)度,構(gòu)建基礎(chǔ)大模型和垂直大模型技術(shù)基座,同時提供工具鏈支持,讓每個人都有機(jī)會挖掘到AI紅利。

毫無疑問,百度走在正確的道路上。

#暮春谷雨#

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-04-16
百度:不做大模型王者,要做AI世界的基石
百度:不做大模型王者,要做AI世界的基石

長按掃碼 閱讀全文