大佬說AI|李開復(fù)親授“從0到1大模型創(chuàng)業(yè)”方法論 別胡亂燒錢

大模型創(chuàng)業(yè)公司該用什么姿勢開啟長跑拉力賽?聽李開復(fù)講。

1年時間、從0到1打造一家大模型創(chuàng)業(yè)企業(yè),其中:旗艦大模型Yi-Large能力躋身全球第一梯隊、海外toC產(chǎn)品營收過億元、開源Yi-1.5系列模型、面向國內(nèi)外發(fā)布多款模型 API 接口、對標(biāo)ChatGPT5的大模型正在開發(fā)……

這是在零一萬物成立一周年時,李開復(fù)披露的成績單。

零一萬物旗艦大模型Yi-Large排名

目前零一萬物已經(jīng)構(gòu)建起“開源閉源雙軌策略”,大模型生成出來,交給 2C做產(chǎn)品,交給API平臺推動生態(tài)的業(yè)態(tài)。

“我們狂奔了一年,在模型方面趕上美國最頂尖的大模型,以后還要繼續(xù)努力?!?/p>

李開復(fù)稱:“但是面對未來,不能只是拼命狂奔,要開始思考怎么進(jìn)入長跑模式?!?/p>

大模型創(chuàng)業(yè)公司該用什么姿勢開啟長跑拉力賽?

作為國內(nèi)最早的VC創(chuàng)投基金創(chuàng)始人之一,李開復(fù)曾被譽為年輕人的創(chuàng)業(yè)導(dǎo)師,對成功孵化創(chuàng)業(yè)有著深入洞察。

現(xiàn)在,李開復(fù)把他和團(tuán)隊的經(jīng)驗總結(jié)出“方法論”,并在零一萬物一周年時分享出來了。

選對路:「AGI」 vs 「PMF」 vs 「TC-PMF」

“國內(nèi)的初創(chuàng)公司,相對硅谷公司的差異,我們能夠仰望星空,但也能腳踏實地?!?/p>

李開復(fù)稱,目前大模型創(chuàng)業(yè)有2條路有很多討論,有一批人瘋狂地追AGI(Artificial General Intelligence,通用人工智能),認(rèn)為AGI一旦發(fā)生世界都改變了,另外一批人會說模型做得越大越難用,還不如趕快找到PMF(適合市場需求的應(yīng)用)。

/注:PMF(Product Market Fit),指“產(chǎn)品市場匹配度”。硅谷著名風(fēng)險投資家、網(wǎng)景公司創(chuàng)始人馬克·安德森(Marc Andreessen)最早提出了這個概念,指出了產(chǎn)品市場匹配度的重要性,你所提供的產(chǎn)品正好滿足市場的需求,令客戶滿意,這是創(chuàng)業(yè)成功的第一步。/

對此,李開復(fù)認(rèn)為:“這兩批人說得都對,但都不完整”。

AGI是夢想,但是你用夢想去指點一個公司的執(zhí)行,而你又沒有財力去做超級大力出奇跡的事情,那其實就是徒勞無功的。

零一萬物是務(wù)實的AGI信仰者,不會用純大力出奇跡的唯一思維,追求能不能用一百億美金、一千億美金去訓(xùn)練出最好的大模型。Open AI有資格嘗試這條道路,但這不是我們走的道路。我們是務(wù)實,我們一定要用最少的芯片,最低的成本訓(xùn)練出我們能訓(xùn)練最好的模型。

李開復(fù)也強(qiáng)調(diào),不覺得有任何一種技術(shù)可以在長期的時間里只靠技術(shù)領(lǐng)跑所有的競爭,一定是最終產(chǎn)品的勝出要靠非技術(shù)的優(yōu)勢達(dá)到口碑的傳播。

“今天我們不能忘記PMF的重要性,做所有的產(chǎn)品都應(yīng)該基于PMF,不是胡亂去燒錢,但有了PMF這個理論是不夠的”,李開復(fù)表示:“我們提出除了PMF之外AI2.0時代還要考慮TC-PMF,T代表Technology(技術(shù)),C代表Cost(成本)?!?/p>

之所以要加上“T”和“C”,李開復(fù)認(rèn)為,考慮Technology,是因為大模型仍然按照Scaling laws(尺度定律)在快速進(jìn)化,要不斷預(yù)測未來技術(shù)會怎么走,而不是基于今天的技術(shù)來決定能做什么。

/注:大模型的Scaling Law是OpenAI在2020年提出的概念,即模型的最終性能主要與計算量,模型參數(shù)量和數(shù)據(jù)大小三者相關(guān),而與模型的具體結(jié)構(gòu)(層數(shù)/深度/寬度)基本無關(guān)。/

考慮Cost,是因為現(xiàn)在大模型推理成本過高,很多用戶規(guī)模大的應(yīng)用還不能全面嵌入AI。例如,今天如果開發(fā)一個社交應(yīng)用,每次跟人聊天統(tǒng)統(tǒng)都要調(diào)用API幫你畫各種東西,最后這個API的成本會讓創(chuàng)業(yè)企業(yè)破產(chǎn)。因此要努力將大模型推理成本降下來。

李開復(fù)表示,整個行業(yè)應(yīng)該用更務(wù)實的方法,一方面做一個務(wù)實的AGI的信仰者,另一方面要務(wù)實地把模型尺寸壓縮下來,把推理成本降低下來,零一萬物在做的是能不能加速比別人的成本更降一步。

“考慮到做一個偉大的大模型公司,不只是底層,同樣重要的還有應(yīng)用,怎么找到復(fù)雜的TC-PMF,怎么把這一批完全不同的人聚在一起協(xié)作,這是我們在硅谷公司一般沒有看到,這是我們獨特的方法,也是中國獨角獸的機(jī)會。”李開復(fù)強(qiáng)調(diào)。

闡述上述方法論后,李開復(fù)還攜一眾團(tuán)隊大拿,分享了零一萬物的實際操作經(jīng)驗。

零一萬物的4大發(fā)展原則

1、全球布局:模型、產(chǎn)品都面對全球,平行跟跑

一年前開始時,美國全方位領(lǐng)先,我們要謙卑地跟人家學(xué)習(xí),人家有好的已經(jīng)被教育的市場里,看在這個市場里怎么達(dá)到TC-PMF。

去年9月開始,零一萬物便聚焦生產(chǎn)力、社交賽道于海外應(yīng)用展開探索,已有 4 款產(chǎn)品陸續(xù)上線。目前零一萬物海外生產(chǎn)力應(yīng)用總用戶接近千萬,海外產(chǎn)品采用會員訂閱制,營收今年預(yù)期過億人民幣。

李開復(fù)強(qiáng)調(diào)了成功的經(jīng)驗:“我們平行的在跟跑”。

零一萬物創(chuàng)業(yè)的前三個月招了一批優(yōu)秀的產(chǎn)品負(fù)責(zé)人,先去最先進(jìn)的國外市場,用當(dāng)時最先進(jìn)的模型GPT-4調(diào)優(yōu)當(dāng)時所有的PMF,調(diào)到了國外的PMF。與此同時,幾個月間零一萬物國內(nèi)的模型也訓(xùn)練出來了,在國內(nèi)會把整個應(yīng)用后端切換到自己的模型上。“在國內(nèi)能夠幫助我們打造更好的模型和用戶體驗”。

5月初,零一萬物在國內(nèi)推出“萬知”的,這款產(chǎn)品就是在零一萬物團(tuán)隊在海外已經(jīng)驗證成功達(dá)到PMF的產(chǎn)品再推回中國的例子。

現(xiàn)在還在2B方面探索和世界500強(qiáng)達(dá)到深度的合作,我們看到美國的一些公司做了行業(yè)的金融大模型,但并不是特別地滿意,我們認(rèn)為我們可以和世界500強(qiáng)達(dá)成獨特的合作,讓它深度合作參與達(dá)到雙贏。

2、?;步ǎ?/strong>特別重要,目的是省算力、省成本

“我們今天面臨一個現(xiàn)實,就是美國大廠的GPU數(shù)量,是中國任何公司、尤其是初創(chuàng)公司的十倍以上。在這個前提之下,我們要怎樣才能確保能緊追世界領(lǐng)先的公司,哪怕追上了它現(xiàn)在的產(chǎn)品,它還會有下一個產(chǎn)品的發(fā)布?!?/p>

“既然不能用10萬張GPU來訓(xùn)練,我們就會尋找別的方式,依然能做出非常好的效果。”

用有限的資源來打造一個能緊追對手的方法論。在GPU算力稀缺的情況下,只能竭盡全力的提高計算效率。要特別重視 AI Infra。

AI Infra(AI Infrastructure 人工智能基礎(chǔ)架構(gòu)技術(shù)),它涵蓋了人工智能開發(fā)和部署所需的各種底層技術(shù)設(shè)施。這些設(shè)施包括處理器、操作系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、云計算平臺等,它們共同構(gòu)成了大模型訓(xùn)練和部署的硬技術(shù)基礎(chǔ)。AI Infra可以被視為連接算力和應(yīng)用的中間層基礎(chǔ)設(shè)施。

零一萬物的模型團(tuán)隊和Infra架構(gòu)團(tuán)隊會在一起工作,“這個特別重要”,李開復(fù)強(qiáng)調(diào)。這也就是“?;步ā?。

據(jù)介紹,零一萬物的大模型和Infra團(tuán)隊有1比1規(guī)模。

零一萬物模型訓(xùn)練負(fù)責(zé)人黃文灝補充道,算法和Infra要一體優(yōu)化,算法人員會往Infra下面看很多,Infra人員會往算法上看很多,我們最后直接并成一個團(tuán)隊,這樣我們可以用 One Team 的工作方式來推進(jìn)。

黃文灝強(qiáng)調(diào),要關(guān)注計算效率,它是算法和Infra做聯(lián)合優(yōu)化的問題,算法人員應(yīng)該看到很底層的Infra,怎么提高GPU使用率和GPU之間通信的問題,而不是像過去用別人現(xiàn)有的庫調(diào)優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),這里面的范式有很大不一樣。零一萬物所有算法人員都可以寫到底層的CUDA算子(注:CUDA是NVIDIA在2006年推出的運算平臺),通信算子,這些都是必備的能力。

李開復(fù)曾經(jīng)表示,“做過大模型 Infra 的人比做算法的人才更稀缺”。超強(qiáng)的Infra能力是大模型研發(fā)的核心護(hù)城河之一。現(xiàn)在,李開復(fù)稱,重視Infra給零一萬物帶來絕對的大模型訓(xùn)練成本優(yōu)勢。

3、模應(yīng)一體:不是只做酷炫的 demo,對用戶有價值,這才是價值

所謂模應(yīng)一體,即模型和應(yīng)用一體。

如何做到模應(yīng)一體?

“零一萬物有比較多的應(yīng)用在做,包括生產(chǎn)力、社交、娛樂,我們希望所有的應(yīng)用都基于一個通用的模型。這個預(yù)訓(xùn)練模型作為一個基礎(chǔ)可以服務(wù)所有的應(yīng)用?!秉S文灝介紹。

“我們打破壁壘,算法團(tuán)隊和應(yīng)用團(tuán)隊是一體化。一方面以應(yīng)用為目標(biāo)的產(chǎn)品經(jīng)理要不斷去了解基礎(chǔ),哪些是模型能做的,哪些是模型不能做的,一定要了解產(chǎn)品的邊界在哪里。另一方面技術(shù)人員也要去了解產(chǎn)品的需求到底是什么,找到一個實際的應(yīng)用和模型能夠快速一體化迭代的方案?!?/p>

零一萬物生產(chǎn)力產(chǎn)品負(fù)責(zé)人曹大鵬介紹,萬知和零一萬物海外的產(chǎn)品,都是在“模應(yīng)一體”的組織下打造出來。海外產(chǎn)品的ROI(投資回報率)達(dá)到1以上。

為什么要“模應(yīng)一體”,曹大鵬認(rèn)為,本身模型在不斷提升,模型提升之后,在原來模型基礎(chǔ)上做的應(yīng)用是不是沒有價值了?這要求產(chǎn)品跟模型要深度預(yù)判技術(shù)趨勢,在模型最開始階段或者定義的時候,就把應(yīng)用思考融入進(jìn)去。

另外,曹大鵬也分享了零一萬物從0到1打造一個應(yīng)用產(chǎn)品的關(guān)注點,”我們實踐下來,在0到0.1早期的時候,最核心的產(chǎn)品方法論就是TC-PMF。0到0.1最重要的是怎么讓產(chǎn)品能夠讓用戶使用。0到1我們最關(guān)注產(chǎn)品長期留存,包括能不能產(chǎn)生用戶自傳播的口碑。從1到100的過程需要規(guī)?;鲩L能力,怎么把ROI做到1以上。“

4、AI-First應(yīng)用:找到”普惠點“,才能爆發(fā)

李開復(fù)認(rèn)為,現(xiàn)在對于所有大模型公司的考驗,在復(fù)雜的TC-PMF環(huán)境之下,怎樣同時開發(fā)產(chǎn)品、了解用戶和市場,又考慮到技術(shù)的發(fā)展速度和模型的合理推進(jìn),還要考慮推理成本的必然下降……怎么結(jié)合起來在它發(fā)生的那一點,我們可以稱之為“普惠點”,開發(fā)出最好的AI-First應(yīng)用。

“只有達(dá)到普惠,模型成本不會成為做一個海量體量產(chǎn)品的障礙,這樣的popular app才有可能發(fā)生”,曹大鵬進(jìn)一步舉例道:“抖音真正變成一個Super app是在蘋果手機(jī)推出幾年之后,抖音產(chǎn)生Super app的時間點,第一個是4G普及,第二個是安卓千元機(jī)的普及,一下子把短視頻的市場擴(kuò)大100倍?!?/p>

零一萬物一直在努力降低模型使用成本。零一萬物API開放平臺的負(fù)責(zé)人藍(lán)雨川介紹,Yi-Large API現(xiàn)在定價是20元人民幣,對應(yīng)100萬token數(shù)量。這個數(shù)字大概是GPT-4定價的不到1/3。

李開復(fù)稱:“人類的需求是固定的,需要工作、娛樂、溝通、社交、電商、購買,這些需求什么時候才能有AI-Frist應(yīng)用出來?這個真實帶來的價值就是誰會打造一個AI抖音,AI微信,AI淘寶,我們希望我們有可能作為這樣一個點燃者。如果我們不能做到,希望一個很好的開發(fā)者,能用我們的API做到?!保ü啵?/p>

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2024-05-17
大佬說AI|李開復(fù)親授“從0到1大模型創(chuàng)業(yè)”方法論 別胡亂燒錢
大模型創(chuàng)業(yè)公司該用什么姿勢開啟長跑拉力賽?聽李開復(fù)講。

長按掃碼 閱讀全文