文心一言,百度的新故事?

撰文/蘇舒

編輯/李信馬

盡管百度只是承認(rèn)了正在做類似ChatGPT的項(xiàng)目,以及項(xiàng)目的名字——“文心一言”, 但這個(gè)消息依然讓百度賺足了眼光。

2月7日,百度公布消息當(dāng)天,港股股價(jià)在一天內(nèi)大漲15%,美股股價(jià)漲幅也達(dá)到了12%。

(圖片來源:騰訊自選股)

此前,當(dāng)?shù)貢r(shí)間2月6日,谷歌也公開了正在做類似ChatGPT的項(xiàng)目——Bard。2月7日,微軟宣布將ChatGPT接入到搜索引擎必應(yīng)中;次日,阿里也傳出正在研發(fā)“阿里版” ChatGPT,目前處于內(nèi)測(cè)階段。

大廠紛紛跟進(jìn),將ChatGPT的熱度抬升到了新階段。對(duì)百度來說,這款產(chǎn)品可能正是他們苦苦追尋的“荒年之谷”。

01、百度需要ChatGPT

深耕人工智能多年的百度,絕不會(huì)錯(cuò)過眼前的風(fēng)口。

ChatGPT被視為人工智能行業(yè)的里程碑,百度在AI領(lǐng)域的積累——海量數(shù)據(jù)、算力、算法以及預(yù)訓(xùn)練大模型,已經(jīng)具備了生成類似項(xiàng)目的條件。而ChatGPT,或者說其“中國版”文心一言的商業(yè)化前景,也足夠吸引人。

首先,文心一言可以和百度的搜索引擎結(jié)合。有接近百度人士透露,文心一言落地的首站,將直接接入百度搜索。目前,文心一言的相關(guān)功能已陸續(xù)在百度搜索內(nèi)上線或內(nèi)測(cè),包括多答案回復(fù)、智能生成等。

與傳統(tǒng)的搜索引擎相比,接入ChatGPT后的搜索,可以提供更智能化的單一答案,讓用戶省去反復(fù)點(diǎn)擊鏈接找尋答案的麻煩。這一變化或許會(huì)帶來互聯(lián)網(wǎng)廣告收入形式的革新,以及出現(xiàn)新形式的增值服務(wù),有不小的想象空間。

(圖為新必應(yīng)搜索截圖)

除了和搜索引擎結(jié)合之外,百度的公告稱,小度將融合文心一言的全面能力,打造針對(duì)智能設(shè)備場(chǎng)景的人工智能模型「小度靈機(jī)」,應(yīng)用到小度全系產(chǎn)品。

小度背后是“小度OS+硬件”,除了已經(jīng)常見的智能家居場(chǎng)景外,還包括以學(xué)習(xí)機(jī)、平板等為主的學(xué)習(xí)場(chǎng)景,還有百度另一大業(yè)務(wù)——智能汽車中的車載場(chǎng)景。

賽智產(chǎn)業(yè)研究院院長趙剛對(duì)表示:“從目前ChatGPT來看,百度推出的文心一言背后的技術(shù)對(duì)于百度全產(chǎn)品線會(huì)有很大的提升。ChatGPT是一種引領(lǐng)性的技術(shù),一種變革性的生產(chǎn)力,它可以帶動(dòng)其他產(chǎn)品圍繞著這個(gè)方向做出相應(yīng)的服務(wù)模式和商品模式的調(diào)整。不止是推動(dòng)百度的全線產(chǎn)品升級(jí)革新,ChatGPT及其背后技術(shù)的出現(xiàn),甚至于可以推動(dòng)智能交通、智慧醫(yī)療等各個(gè)行業(yè)的變革。這就像是當(dāng)年的深度學(xué)習(xí)算法出現(xiàn)后帶動(dòng)一輪AI企業(yè)的整體提升,基于GDP模型下,新一波人工智能浪潮已然開啟。”

2017年,百度提出“All in AI”戰(zhàn)略,將業(yè)務(wù)重心轉(zhuǎn)向人工智能。但商業(yè)化落地上,人工智能目前仍未取得突破性進(jìn)展,ChatGPT的出現(xiàn),不僅有可能幫助百度開拓新的商業(yè)版圖,其對(duì)百度的基本盤——搜索引擎——的價(jià)值,也是百度不敢忽視的。

02、文心一言能成為中國的ChatGPT嗎?

將這個(gè)問題拋給ChatGPT,它給出了這樣的回答:文心一言有可能成為中國的 ChatGPT。

(圖為ChatGPT截圖)

目前,文心一言還未正式推出。試圖從ChatGPT和文心一言的項(xiàng)目起源、技術(shù)路徑以及商業(yè)化等方面進(jìn)行比較。

2018年,Open AI在NLP(自然語言處理)領(lǐng)域打造了GPT系列模型。2020年,Open AI放出了具有1750億參數(shù)的預(yù)訓(xùn)練模型GPT-3,橫掃文本生成領(lǐng)域,不僅能問答、翻譯、寫文章,還能做數(shù)學(xué)計(jì)算。

2022年12月,基于GPT-3.5預(yù)訓(xùn)練大模型的免費(fèi)對(duì)話模型——ChatGPT正式上線。

而文心一言最早可以追溯到2019年,百度推出了產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)文心大模型ERNIE。百度放出的AIGC能力,包括寫作、繪畫、寫歌等方面的能力,都是基于這一大模型。

據(jù)推測(cè),去年9月,百度就開始做文心一言,從項(xiàng)目發(fā)起時(shí)間來看,并沒有落后Open AI很長時(shí)間。

其次,從技術(shù)路徑上來看,ChatGPT成功的原因有四點(diǎn):強(qiáng)大的基座模型能力(InstructGPT)、大參數(shù)語言模型(GPT3.5)、高質(zhì)量的真實(shí)數(shù)據(jù)(精標(biāo)的多輪對(duì)話數(shù)據(jù)和比較排序數(shù)據(jù))、性能穩(wěn)定的強(qiáng)化學(xué)習(xí)算法(PPO算法)。

百度同樣具備這些能力。正如百度官宣中所言:百度在人工智能四層架構(gòu)中,有全棧布局。包括底層的芯片、深度學(xué)習(xí)框架、大模型以及最上層的搜索等應(yīng)用。

另外,深耕人工智能領(lǐng)域多年的百度,擁有產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)文心大模型ERNIE,具備跨模態(tài)、跨語言的深度語義理解與生成能力。

“Open AI的ChatGPT、百度的文心一言、或者是谷歌的Bard,這三家從整體的技術(shù)路徑來看是比較一致的?!壁w剛表示,具體細(xì)節(jié)上,每家可能對(duì)模型有著不同的組合方式來實(shí)現(xiàn)創(chuàng)新。

不得不提到的是,文心一言和ChatGPT有不同的側(cè)重點(diǎn),文心一言主要關(guān)注文本生成領(lǐng)域,而 ChatGPT 則主要關(guān)注自然語言處理和生成領(lǐng)域。

從商業(yè)的角度來看,微軟的ChatGPT、谷歌的Bard對(duì)百度來說沒什么威脅性。畢竟在中國市場(chǎng),百度搜索擁有主導(dǎo)地位和海量的中文數(shù)據(jù),占據(jù)絕對(duì)的優(yōu)勢(shì)。微軟和谷歌的產(chǎn)品反而可以作為百度技術(shù)路徑和商業(yè)化上的參考對(duì)象。目前阿里、騰訊也爆出正在做ChatGPT相關(guān)項(xiàng)目,但與百度相比,無論是在數(shù)據(jù)儲(chǔ)備還是搜索引擎上,都有明顯的差距。

目前來看,距離中國的ChatGPT最近的,的確是文心一言,但文心一言能做到什么程度,甚至能否超過ChatGPT,成為百度期盼已久的“第二增長曲線”,還有待時(shí)間的考驗(yàn)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-02-11
文心一言,百度的新故事?
中國版ChatGPT來了

長按掃碼 閱讀全文