OpenAI和谷歌,AI對線中的飛馳人生

到底什么時候,才能有一家公司趕超OpenAI?這句問題,想必是過去一年多來,縈繞在不少讀者心中的困惑。

如果全世界只有一家公司能趕超OpenAI,谷歌應(yīng)該是最有希望的選手。

同為北美AI巨頭的谷歌,與OpenAI有著相同的AGI目標(biāo)、世界級的技術(shù)人才、全球資金資源,就連OpenAI大模型的核心Transformer架構(gòu),都是谷歌原創(chuàng)發(fā)明的。

然而2023年至今,AI領(lǐng)域風(fēng)云迭起,OpenAI永遠(yuǎn)快谷歌一步。谷歌每次拿出一個“復(fù)仇大殺器”,想一雪前恥的時候,總會被OpenAI搶走風(fēng)頭。

比如最新推出的核彈級多模態(tài)大模型Gemini 1.5,只在科技話題榜上“炸裂”了幾個小時,就因為緊隨其后推出的Sora過于炸裂、更吸引眼球,而變得無人在意。

毫無疑問,AI領(lǐng)域正在進(jìn)行著一場世界上最精彩的“速度與激情”,領(lǐng)先的OpenAI贏得漂亮,緊隨其后的谷歌也輸?shù)皿w面。我發(fā)現(xiàn)它們的境遇,被龍年春節(jié)檔的熱門電影,給精準(zhǔn)拿捏了。

如果說OpenAI是驚艷四座、激動人心的《熱辣滾燙》,那谷歌就像是《飛馳人生2》中艱難追夢的中年賽車手,鼓起勇氣全速前進(jìn),結(jié)果不是贏,而是來了個大翻車。

誰能摘下賽道終點AGI的圣杯,結(jié)果還未可知,這一年多來,僅僅是欣賞這一長程賽事的初始賽段,都已經(jīng)令人極為振奮了。

谷歌與OpenAI的AI對線,可謂是屢戰(zhàn)屢敗、屢敗屢戰(zhàn)。我們就從這場精彩的“雙雄競速”,來整體看一看北美AI巨頭的產(chǎn)業(yè)對壘形勢。

谷歌三連敗,北美AI巨頭的激情對線

目前,在爭奪AGI通用人工智能圣杯的賽場上,分別有三支北美AI巨頭:OpenAI、谷歌、Meta。

其中,Meta走的是開源路線,其大模型系列LLaMA是目前全球最活躍的AI開源社區(qū)。而OpenAI和谷歌則在同一條賽道上,主要打造“閉源”大模型。

盡管OpenAI被嘲諷“不再Open”,谷歌工作人員也大膽諫言“我們和OpenAI都沒有護城河”。但換個角度,閉源的業(yè)務(wù)策略要說服用戶付費,必須提供高質(zhì)量模型、具備難以替代的能力優(yōu)勢,這也會驅(qū)動模型廠商持續(xù)創(chuàng)新,保持競爭優(yōu)勢,是AI產(chǎn)業(yè)中一股不可缺少的商業(yè)力量。

所以,北美AI三巨頭的對壘格局,就是Meta卷生態(tài),OpenAI與谷歌卷模型。

那么,把目光聚焦到模型賽道上,比賽情況如何呢?

2023一整年,和OpenAI同一賽道的谷歌,深深品嘗到了peer pressure同輩壓力的滋味。

這場競速,可以分為三個賽段:

Round1.ChatGPT VS Bard.

結(jié)果不用多說,這是一場谷歌被OpenAI“摘了桃子”而開啟的競賽,從此就只能一路跟在OpenAI的尾氣后面。

2022年11月,OpenAI發(fā)布ChatGPT一鳴驚人,開啟了全球大語言模型的熱潮。

其中,ChatGPT的基礎(chǔ)技術(shù)Transformer是谷歌推出的,大語言模型的涌現(xiàn)現(xiàn)象是谷歌研究員Jason Wei發(fā)現(xiàn)的(后來跳槽到了OpenAI)。用谷歌的技術(shù),搶谷歌的人,沖擊谷歌的AI領(lǐng)導(dǎo)地位,OpenAI可謂是一通“騎臉輸出”。

谷歌的應(yīng)對,是“一怒之下怒了一下”。

2023年3月,谷歌緊急發(fā)布了Bard。但這個模型本身的性能就比較弱,上線時功能有限,只支持英文,只針對少數(shù)用戶,跟ChatGPT完全不能打。

Round2.GPT-4 VS PaLM2.

有人說,谷歌采用的是“田忌賽馬”策略,第一局故意放出了比較弱的機器學(xué)習(xí)模型Bard。這話有一定道理,但架不住OpenAI的每匹馬都是好馬。

OpenAI很快推出了升級版的GPT-4,并開放了 GPT-4 的 API,把谷歌甩得更遠(yuǎn)了。

5月的谷歌I/O 2023大會,派出來對打GPT- 4的PaLM 2,也是一個“過渡產(chǎn)品”。谷歌研究副總裁Zoubin Ghahramani對外表示,PaLM 2是對早期模型的改進(jìn),僅僅縮小了谷歌與OpenAI在AI方面的差距,但并沒有整體超越GPT-4。

這一輪,谷歌仍然落后。谷歌顯然也清楚這一點,在這場大會上同時宣布,正在訓(xùn)練PaLM的繼任者,名為Gemini,押注了上億身家,準(zhǔn)備在年底上演“王子復(fù)仇記”。

Round3.Gemini家族VS Sora+GPT-5。

2023年底的12月,谷歌Gemini“雖遲但到”,這個谷歌目前最強大、最通用的AI模型,被媒體稱為“復(fù)仇殺器”。這期間,OpenAI上演了一出“甄嬛回宮”的宮斗大戲,沒有特別炸裂的產(chǎn)品。這一次,谷歌能奪回屬于自己的一切嗎?

很遺憾,谷歌并沒能上演AI領(lǐng)域的“龍王歸來”。

三個尺寸的Gemini:Nano、Pro和Ultra,其中Gemini Pro在常識推理任務(wù)中落后于OpenAI的GPT模型,Gemini Ultra對于GPT-4僅有幾個百分點的優(yōu)勢,而GPT-4是OpenAI一年前的產(chǎn)品。而且,Gemini還被爆出,宣稱打敗GPT-4的多模態(tài)視頻,有后期制作和剪輯的成分,用中國模型產(chǎn)生的中文語料進(jìn)行訓(xùn)練,自稱是文心一言。

谷歌一鼓作氣,一腳油門,Gemini Ultra發(fā)布還沒幾天,就推出了多模態(tài)大模型Gemini 1.5,能夠穩(wěn)定處理高達(dá)100萬token,創(chuàng)下了最長上下文窗口的紀(jì)錄。

這是一個激動人心的成果,如果沒有Sora的話。

OpenAI幾個小時之后,就推出了文字視頻生成模型Sora,用前所未有的視頻生成性能,以及世界模型的產(chǎn)品化,再一次驚艷了世人,搶走了本應(yīng)屬于Gemini 1.5的話題度,也強化了自己的AI領(lǐng)導(dǎo)地位。目前人們傾向于認(rèn)為,OpenAI還是領(lǐng)先谷歌一籌。

此前大家都猜測是GPT-5已經(jīng)訓(xùn)練得差不多了,面對谷歌目前最強的模型Gemini 1.5,已經(jīng)有人隔空喊話奧特曼,問他還要把寶貝捂到什么時候,還不快點放出GPT-5。

至此,為期約一年的北美AI“田忌賽馬”,以谷歌的三連敗,暫時告一段落。

AGI的殊途,難以飛馳的谷歌

AGI是一場長長的賽事。拉長時間軸,谷歌與OpenAI的一年對壘與一時成敗,或許未來看都不算什么。有資格走上頂級賽道,本身就是谷歌AI實力的一種證明。

比起輸贏結(jié)果,更值得討論的是,谷歌變成“卷王”卷了一整年,為什么會一直被OpenAI甩在身后,怎么折騰都跟不上?

田忌賽馬,輸一次是戰(zhàn)術(shù)失誤,次次都輸,可能就能關(guān)注一下,是不是從馬種、馬圈、草料等源頭,就已經(jīng)存在問題了。

回到源頭,谷歌和OpenAI可謂是同歸、殊途。

同歸,是雙方都以實現(xiàn)通用人工智能,摘下AGI圣杯作為目標(biāo);

殊途,是雙方選擇的技術(shù)路線不同。OpenAI將更為通用的語言能力,作為實現(xiàn)AGI的基礎(chǔ),因此采用了對NLP領(lǐng)域至關(guān)重要的Transformer架構(gòu),打造了一系列GPT模型,才有了ChatGPT的驚艷亮相。

而谷歌則不然。多年來,谷歌的AI研發(fā)機構(gòu)DeepMind,將強化學(xué)習(xí)、深度學(xué)習(xí)用于解決各種人工智能問題,技術(shù)積累非常廣泛。比如石破天驚的AlphaGo、徹底改變生物學(xué)的AlphaFold,以及Transformer等NLP技術(shù)。

這就相當(dāng)于,兩個車手在為比賽準(zhǔn)備賽車,OpenAI為AGI選了一個場地,比如“方程式賽車”,然后以語言為核心進(jìn)行模型的開發(fā)制造,對賽車(模型)的結(jié)構(gòu)、長寬、發(fā)動機、汽缸等進(jìn)行優(yōu)化改造(工程化)。而谷歌的DeepMind則不確定哪種車能終結(jié)AGI比賽,手里的技術(shù)工具又很多,于是方程式賽車、跑車、摩托車都造一下試試。

兩種路線原本并沒有什么優(yōu)劣之分。但隨著大語言模型的“智能涌現(xiàn)”,證明了OpenAI選擇的技術(shù)路線更有希望實現(xiàn)AGI,谷歌DeepMind的技術(shù)路線就暴露出了明顯的短板:

1.方向分散,成本高昂。在各個技術(shù)方向上投入的泛創(chuàng)新,消耗了大量資金,DeepMind與谷歌母公司AlphaBeta在商業(yè)化上的矛盾日趨加深。在OpenAI大幅融資加速的時候,谷歌為了加大對AI的投資,通過裁員來節(jié)省成本。

2.選型太多,難以聚焦。谷歌開創(chuàng)了許多技術(shù),但每個技術(shù)的重視程度、持續(xù)深入強度也被分散了,四處打井不出水。最典型的就是Transformer架構(gòu),由谷歌發(fā)明,但被OpenAI發(fā)揚光大。ChatGPT的涌現(xiàn)現(xiàn)象,也是研究員在谷歌發(fā)現(xiàn)之后,但得不到重視,出走OpenAI后向前推進(jìn)。

3.落地遲緩,成果太慢。谷歌內(nèi)部對AI的保守也是出名的,導(dǎo)致其即使掌握了先進(jìn)的技術(shù),成果轉(zhuǎn)化的效率也很低下。有前谷歌員工曾吐槽,谷歌的項目一般都是先吹一陣牛,然后什么也不發(fā)布,一年后再把這個項目給砍了。這一點在Sora的爆火上就能看到,訓(xùn)練Sora使用的擴散模型(diffusion model)、文生圖模型,谷歌都有相應(yīng)的技術(shù)儲備和成果,但就是沒能先搞出Sora這樣的產(chǎn)品。

可以看到,由于一開始就押注錯了賽道,等到大語言模型成為AGI最有潛力的實現(xiàn)路徑,OpenAI領(lǐng)先的大勢已成。這時的谷歌再要回到OpenAI所在的技術(shù)賽道上,當(dāng)然就處于劣勢身位了。

一步錯,步步錯的“人生”,挺住意味著一切

坦誠地說,谷歌已經(jīng)在積極解決問題,包括技術(shù)戰(zhàn)略選擇失誤、內(nèi)部的管理效率人事冗余、AI技術(shù)人才的外流等。

去年4月,谷歌將自己的兩個AI“扛把子”團隊——谷歌大腦和DeepMind合并,共同進(jìn)行Gemini的開發(fā)。從最終效果來看,Gemini的表現(xiàn)是很優(yōu)秀的,1.5版本是目前全球最領(lǐng)先的大模型之一。內(nèi)部資源也大幅度向AI領(lǐng)域傾斜,一些外流的AI人才回歸谷歌。

實際行動表明,谷歌在明確了賽道之后,追趕OpenAI的決心和速度都是一等一的。

但持續(xù)落后的現(xiàn)實也充分詮釋了一點:自己的失敗固然可怕,朋友的成功更讓人揪心。

盡管谷歌竭力解決自身的種種弊病,全力推動大模型,但架不住OpenAI的加速度更強大。

一方面,OpenAI的研發(fā)團隊可謂是全力以赴,而谷歌新合并的團隊還需要磨合。Sora核心研發(fā)人員Bill Peebles曾透露,團隊每天基本不睡覺高強度工作了一年。而谷歌大腦和DeepMind合并之后,很多員工不得不放棄自己原本熟悉的軟件,放棄原本開展的項目去開發(fā)Gemini,這些內(nèi)部磨合導(dǎo)致的項目延遲、停滯,必然會給谷歌追趕OpenAI帶來阻礙。

另外,相比谷歌亡羊補牢式地招回人才,OpenAI虹吸全球頂級AI人才的氣勢如虹。就在2月份,Altman公開在社交媒體上表示,“所有關(guān)鍵資源都已到位,非常專注于AGI”,在線誠聘人才。AI的競爭歸根結(jié)底是人才的競爭,因為AGI最重要的是智力資源,而最頂尖最優(yōu)秀的人才一共只有那么多,這也讓人為谷歌能否追趕上OpenAI捏了一把汗。

電影《飛馳人生2》中,主角再度嘗試賽車而翻車后,他沒有繼續(xù)追求賽場上的贏,而是作為一個深愛著賽車運動的車手,踏上賽場,只為證明自己。

谷歌與OpenAI的對線,也不能歸于簡單的輸和贏。正如谷歌在「Why We Focus on AI (and to what end)」中所言:我們相信AI能夠成為一項基礎(chǔ)技術(shù),徹底改變?nèi)澜缛嗣竦纳睢@正是我們追求的目標(biāo),也是我們的激情所在!

所有勇于下場、站上跑道的AI“賽車手”,都值得掌聲。而這場充滿了速度與激情的AGI比賽,一定還會帶給觀眾席上的我們,更多震撼。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-02-26
OpenAI和谷歌,AI對線中的飛馳人生
OpenAI和谷歌,AI對線中的飛馳人生

長按掃碼 閱讀全文