撰文 | 王 妤 語
題圖 | 官方圖片
中國版的ChatGPT終于來了。
3月16日下午,百度于北京總部召開邀請測試會,主題圍繞新一代大語言模型、生成式AI產(chǎn)品文心一言。
百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏展示了文心一言文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成的能力。
百度同時公布了文心一言的邀請測試方案。3月16日起,首批用戶即可通過邀請測試碼,在文心一言官網(wǎng)體驗(yàn)產(chǎn)品,后續(xù)將陸續(xù)開放給更多用戶。
李彥宏表示,目前,大語言模型和生成式AI代表了一個新技術(shù)范式,是全球每家企業(yè)都不可錯過的機(jī)會。百度文心一言定位于人工智能基座型的賦能平臺,將助力金融、能源、媒體、政務(wù)等千行百業(yè)的智能化變革。
“百度希望和大家一起,推動人工智能技術(shù)進(jìn)步,讓所有人都能使用最先進(jìn)的生產(chǎn)力工具,讓所有人都能從中受益?!崩顝┖暾f。
一、文心一言能做什么?
文心一言能做什么?這或許是大家最想知道的問題。
使用過ChatGPT的人應(yīng)該都知道,ChatGPT在信息查詢、文本輸出、推理運(yùn)算上可以說是如魚得水,游刃有余。
不過,用中文提問ChatGPT,相比于英文而言,始終差一點(diǎn)意思。不少人吐槽,在和國外相比,在國內(nèi)ChatGPT的體驗(yàn)感覺就像是mini版,回答問題的豐富度和內(nèi)容準(zhǔn)確性總是差一點(diǎn)。
好在,百度做出了中國版的ChatGPT。以上的種種,文心一言都可以全部現(xiàn)實(shí)。
文心一言搞“文學(xué)創(chuàng)作”很有一套。
圖片來源:官方圖片
在文心一言上輸入的關(guān)鍵文詞和主題,它可以自動生成符合語法和語義規(guī)范的短本。這不僅縮短了檢索關(guān)鍵信息的時間,還可以給作家和文字工作者提供創(chuàng)業(yè)靈感和素材。
作為中國最大的搜索引擎,在搜索業(yè)務(wù)超過二十年積累,百度有世界上最大的知識圖譜,這一切讓文心一言回答準(zhǔn)確性及生成結(jié)果的可信度得到提升。
文心一言也可以快速生成周報、新聞稿、宣傳標(biāo)語。
圖片來源:官方圖片
文心一言可以根據(jù)輸入的關(guān)鍵詞和主題,快速生成符合要求的文案,幫助企業(yè)進(jìn)行品牌宣傳和廣告創(chuàng)意。另外,營銷策劃和推廣,文心一言也是信手拈來。
文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù),數(shù)十億搜索數(shù)據(jù)和圖片數(shù)據(jù),百億級語音日均調(diào)用數(shù)據(jù),及5500億事實(shí)的知識圖譜。經(jīng)過千億級參數(shù)訓(xùn)練后的文心一言,不僅有強(qiáng)大的邏輯推理能力,在創(chuàng)意內(nèi)容生成上有突出表現(xiàn)。
文心一言還可以輕松回答“雞兔同籠”問題。
圖片來源:官方圖片
文心一言還具備了一定的思維能力,能夠?qū)W會數(shù)學(xué)推演及邏輯推理等相對復(fù)雜任務(wù)。不過,李彥宏表示,對于該類問題,文心一言目前不一定能完全回答正確,但是未來經(jīng)過更多的訓(xùn)練后,文心一言的思維能力會越來越強(qiáng)。
寫詩作賦,文心一言也可以信手拈來。
圖片來源:官方圖片
作為扎根于中國市場的大語言模型,文心一言具備中文領(lǐng)域最先進(jìn)的自然語言處理能力。也就是說,相比于ChatGPT,文心一言對中文的理解能力和把控能力更強(qiáng)。
另外,除了文本之外,文心一言還可以輸出圖片、視頻等多模態(tài)內(nèi)容,甚至還可以將文字直接用方言讀出來。
相較文心一言,GPT4標(biāo)榜的圖片輸入生成文本也未向公眾開放,生成圖片及視頻能力也僅僅停留在展示頁面,毫無誠意。
盡管文心一言在一定程度上具有了對人類意圖的理解能力,回答的準(zhǔn)確性、邏輯性、流暢性都逐漸接近人類水平。但整體而言,這類大語言模型還遠(yuǎn)未到發(fā)展完善的階段,有賴于通過真實(shí)的用戶反饋而逐步迭代。
二、為什么百度能做出“文心一言”?
ChatGPT火熱背景下,包括百度、騰訊、阿里、字節(jié)跳動、360在內(nèi)的國內(nèi)公司都躍躍欲試,想要做出首個中國版ChatGPT。
目前來看,只有百度實(shí)實(shí)在在做出并公布了生成式AI產(chǎn)品——文心一言。百度做出文心一言,一點(diǎn)都不意外。
文心一言本質(zhì)上就是大型語言模型。而要做出大型語言模型,錢(投入),算法、算力、應(yīng)用、數(shù)據(jù),這五個維度缺一不可。
錢,可以說是首要條件。資料顯示,跑通一次100億以上參數(shù)量的模型,算力至少需要1000張GPU卡。GPU芯片中領(lǐng)先者如A100售價達(dá)1萬美元, 微軟Azure云服務(wù)為ChatGPT布署了超過1萬枚英偉達(dá)A100 芯片。即使不使用頂級芯片,按照一張GPU五萬元的市場均價計算,1000張GPU意味著單月至少5000萬的成本。業(yè)界測算,gpt-3單次訓(xùn)練成本至少460萬元。
百度,在研發(fā)投入上一點(diǎn)也不含糊。前不久發(fā)布的百度2022年財報顯示,百度2022年營收約1237億元,凈利潤約207億元,研發(fā)投入達(dá)214億元,占百度核心收入22.4%,在全國科技公司里位于前列。
可以這樣說,百度幾乎是把一年賺的錢全用來做研發(fā)了。
更重要的是,百度同時在芯片、框架、模型和應(yīng)用四層技術(shù)棧布局。在芯片層,百度自研AI芯片“昆侖”已經(jīng)在多場景和搜索業(yè)務(wù)上部署實(shí)踐;在框架層,百度飛槳深度學(xué)習(xí)平臺能夠做到下接芯片上承應(yīng)用,支持模型的訓(xùn)練和開發(fā)。
圖片來源:官方圖片
在模型層,早些的時候,百度就已經(jīng)對大語言模型上展開了相應(yīng)的思考,并投入了大量的人力和物力,通過不斷的算法改進(jìn)和技術(shù)升級,逐步提高了自己的語言模型水平。
2019年,百度就推出了知識增強(qiáng)的語義理解框架ERNIE(文心大模型),2021年,百度又基于ERNIE邀請測試了全球首個百億參數(shù)的對話大模型PLATO-XL。
經(jīng)過多次迭代,ERNIE系列模型目前已經(jīng)具備了較強(qiáng)泛化能力和性能,這也為大語言模型文心一言的推出打下了扎實(shí)的基礎(chǔ)。
在應(yīng)用層面,百度深度學(xué)習(xí)技術(shù)與場景融合創(chuàng)新,應(yīng)用場景日漸豐富。
另外,百度在自然語言處理領(lǐng)域有著豐富的實(shí)踐經(jīng)驗(yàn)和技術(shù)積累。尤其是在數(shù)據(jù)處理上創(chuàng)新式采用了“超級分布式訓(xùn)練”技術(shù),能夠支持大規(guī)模數(shù)據(jù)處理和模型訓(xùn)練,為百度大語言模型的誕生奠基。
無論是在芯片層、框架層等技術(shù)架構(gòu)方面的布局,還是在算力、數(shù)據(jù)等要素資源的投入,百度在國內(nèi)AI領(lǐng)域始終處于領(lǐng)先地位。百度能夠成為國內(nèi)首家推出大語言模型文心一言的企業(yè),主要還是源自百度多年以來的積淀。
三、推出文心一言,百度擁抱的是未來
文心一言能為百度帶來什么?
在會上,百度表示多項(xiàng)主流業(yè)務(wù)將接入文心一言,包括百度搜索,以及基于百度智能云的智能語音助手小度、智能駕駛阿波羅(Apollo)等。
有相關(guān)專家表示,文心一言的出現(xiàn),預(yù)計會給百度的三大業(yè)務(wù)線(移動生態(tài)為代表的基本盤、以智能云為代表的新興業(yè)務(wù)、以智能駕駛和小度為代表的前沿業(yè)務(wù))帶來新的增長和想象空間。
此外,百度表示,文心一言的定位是人工智能基座型的賦能平臺,通過新技術(shù)幫助企業(yè)創(chuàng)建最好的客戶體驗(yàn),讓任何公司有機(jī)會離客戶更近,從而深刻地影響千行百業(yè)中每一家公司,實(shí)現(xiàn)智能化變革、效率提升,獲得更強(qiáng)的競爭優(yōu)勢,創(chuàng)造更大的商業(yè)價值。
截至目前,已經(jīng)有650家企業(yè)宣布加入文心一言生態(tài)圈。對這些企業(yè)而言,接入文心一言后,有機(jī)會通過新的技術(shù)去創(chuàng)建最好的客戶體驗(yàn),從而比其他人更能抓住客戶,獲得更強(qiáng)的競爭優(yōu)勢。比如,航空公司、大型金融機(jī)構(gòu)的AI客服和呼叫中心。
對于百度來說,伴隨著文心一言的邀請測試,這些企業(yè)和用戶開始使用后,將建立真實(shí)用戶反饋、開發(fā)者調(diào)用和模型迭代的飛輪,文心一言會有更大的進(jìn)步,更好地理解人的意圖,生成符合人的價值觀、表達(dá)習(xí)慣的回復(fù)。
ChatGPT和文心一言的出現(xiàn),帶來的是生產(chǎn)力的變革和提升。
“我們相信,人工智能會徹底改變我們今天的每一個行業(yè)。AI的長期價值,對各行各業(yè)的顛覆性改變,才剛剛開始。未來,將會有更多的殺手級應(yīng)用、現(xiàn)象級產(chǎn)品出現(xiàn),將會有更多的里程碑事件發(fā)生。”李彥宏說。
生成式AI產(chǎn)品作為未來產(chǎn)業(yè)、經(jīng)濟(jì)社會發(fā)展中一項(xiàng)變革性技術(shù)與關(guān)鍵力量,深刻影響著未來世界競爭格局,也將給AI行業(yè)帶來罕見的發(fā)展窗口期。
無論是百度,還是其他公司,或者是深處技術(shù)變革漩渦中心的我們,都已經(jīng)站在了變革的清晨。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 特斯拉CEO馬斯克身家暴漲,穩(wěn)居全球首富寶座
- 阿里巴巴擬發(fā)行 26.5 億美元和 170 億人民幣債券
- 騰訊音樂Q3持續(xù)穩(wěn)健增長:總收入70.2億元,付費(fèi)用戶數(shù)1.19億
- 蘋果Q4營收949億美元同比增6%,在華營收微降
- 三星電子Q3營收79萬億韓元,營業(yè)利潤受一次性成本影響下滑
- 賽力斯已向華為支付23億,購買引望10%股權(quán)
- 格力電器三季度營收同比降超15%,凈利潤逆勢增長
- 合合信息2024年前三季度業(yè)績穩(wěn)?。籂I收增長超21%,凈利潤增長超11%
- 臺積電四季度營收有望再攀高峰,預(yù)計超260億美元刷新紀(jì)錄
- 韓國三星電子決定退出LED業(yè)務(wù),市值蒸發(fā)超4600億元
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。