融數(shù)聯(lián)智創(chuàng)始人兼CEO袁曄:國內(nèi)更適合做垂直類大模型

ChatGPT掀起的熱浪還是繼續(xù)。

一方面,除了BAT等互聯(lián)網(wǎng)科技大廠紛紛下場緊追ChatGPT步伐之外,國內(nèi)科技圈迎來了一波創(chuàng)業(yè)潮,一瞬間,大模型賽道上熱鬧非凡。另一方面,也有不少人開始擔(dān)憂起了未來,數(shù)據(jù)隱私安全、社會倫理等威脅論甚囂塵上。

在此背景下,特別邀請了明略科技集團高級技術(shù)總監(jiān)趙亮、賽智產(chǎn)業(yè)研究院院長趙剛、融數(shù)聯(lián)智創(chuàng)始人兼CEO袁曄三位重量級嘉賓,以把脈ChatGPT技術(shù)的利好與落地為棋盤,同時聚焦于ChatGPT數(shù)據(jù)安全話題,探討ChatGPT發(fā)展之路。

以下是融數(shù)聯(lián)智創(chuàng)始人兼CEO袁曄的觀點,為了方便閱讀,在不改變原義的基礎(chǔ)上進行了調(diào)整:

:ChatGPT到底是什么,或者說大家如何定義ChatGPT?是聊天機器人,還是AGI(通用人工智能),還是其他?

袁曄:我認為這是兩個問題。正如ChatGPT名字一樣,Chat就是聊天機器人,GPT整套框架包括大語言模型在內(nèi)的一套涵蓋算法、算力、數(shù)據(jù)等技術(shù)的體系。前一個還比較好理解,因為它已經(jīng)呈現(xiàn)在大眾面前,但后一個因為沒有開源,所以大家很難去深挖它究竟是什么樣的。GPT前幾版本有開源的,但GPT3.5、GPT4已經(jīng)被微軟私有化了,我們很難知道它的邊界是什么,只能通過只言片語去猜測一些信息。

所以說如果我們要去分析GPT到底是什么,以及GPT現(xiàn)在做的程度如何,我覺得還是很難去下定義或者去討論。坦率來說,這就好像是你問微軟,Microsoft的產(chǎn)品office word到底寫了多少行代碼,但這些代碼都是閉源的,缺少基礎(chǔ)信息,所以這是一件很難去下定義的事情。

:ChatGPT大爆發(fā)背后,如何平衡數(shù)據(jù)隱私安全和AI能力之間的關(guān)系?

袁曄:這個涉及方面比較多。我先從隱私保護的角度來談。確實,像北美、歐洲和中國在隱私保護方面的政策是不一樣的。所以我們可以看到Open AI在美國可以獲得大量的數(shù)據(jù)去訓(xùn)練它的模型。此外,英語世界的語料是非常多的,數(shù)據(jù)整理和清洗的工作也做的比較好,這些都是在今天我們能夠看到ChatGPT做的很好的重要因素之一。

歐洲為什么會有國家拒絕呢?是因為歐洲有一個法律叫GDPR,這是在隱私保護上非常嚴格的要求,這也是為什么意大利會首先拒絕,那么接下來可能歐洲其他國家也會跟進,因為這是法律的要求。

同樣,國內(nèi)也有個人隱私保護法、數(shù)據(jù)安全法等等,整體上與歐洲GDPR更接近。所以,從這個角度上來講,如果說中文世界想做一個類似于ChatGPT這樣的產(chǎn)品,面對的挑戰(zhàn)有很多。現(xiàn)實情況是,首先數(shù)據(jù)相對較少,第二,數(shù)據(jù)清洗工作也相對做的沒有英語世界做的多。第三,從法律的合規(guī)性和數(shù)據(jù)監(jiān)管隱私保護的角度也是完全不一樣的,所以這個也會從某種意義上影響國內(nèi)想做ChatGPT產(chǎn)品的團隊的具體執(zhí)行。

Open AI現(xiàn)在達到的狀態(tài),可以說,哪怕是谷歌這樣的公司也很難追趕,因為它基本上很好地調(diào)用了英語世界的語料,用于訓(xùn)練模型,并且形成了很好像雪球一樣的滾動效應(yīng),也就是說,大量用戶使用后,又產(chǎn)生了很多數(shù)據(jù),并且不停地進行優(yōu)化訓(xùn)練。

可以這樣說,現(xiàn)階段的ChatGPT就像是雪球在高速滑行狀態(tài),雪球會越來越大,其他的跟隨者都很難在利用這些雪滾出這樣大的球。

所以,某種意義上來說,在北美市場這個模式的戰(zhàn)斗已經(jīng)結(jié)束,ChatGPT這個事情上,歐洲也好,中國也好,或者世界上其他國家也好,可能會在垂直類大模型上生根發(fā)芽,而這對于隱私保護來說,才是一個現(xiàn)實的挑戰(zhàn)。

早在20年的時候,就有研究人員針對ChatGPT做過相關(guān)數(shù)據(jù)隱私安全的研究。當(dāng)時的這個研究就是說,大模型里面可能會隱藏著一些個人隱私的數(shù)據(jù),只要通過一些手段就可以把它提取出來。因此,這也引發(fā)了一股擔(dān)憂隱私數(shù)據(jù)泄漏言論。其實在這些新聞出來之前,很多學(xué)者就注意到了這個問題,并嘗試做了一些工作。比如學(xué)術(shù)圈曾提到,通過一些方式來嘗試減少和避免隱私數(shù)據(jù)泄漏。但目前來看,從技術(shù)層面上來說,好像還沒有一個很好的方式能夠絕對地避免這個問題。

此外,ChatGPT出現(xiàn)后,很多能力是我們暫時很難去解釋的,或者說真正用原理去解釋。這也引發(fā)了很多擔(dān)憂,除了隱私數(shù)據(jù)的泄漏外,也會引發(fā)其他一些比如輿論引導(dǎo)等社會性、公共安全的擔(dān)憂。

:怎么看待馬斯克叫停GPT5這件事?

袁曄:我認為馬斯克的擔(dān)心有一定的道理。主要原因還是在于大家對GPT5的認知是模糊的,大家都不知道到底是怎么做的,這可能是一個很大的原因。如果開源的話,大家顧慮會相對少些。其實這也可以倒逼微軟來開源這個部分。

但顯然,ChatGPT的出現(xiàn),在商業(yè)角度上來看是解決了一些問題的,比如說很多初級的工作,確實也可以被替換。

:除了互聯(lián)網(wǎng)、科技大廠外,現(xiàn)在去做大語言模型的創(chuàng)業(yè)公司、連續(xù)創(chuàng)業(yè)者不再少數(shù),還有像王小川、王慧文這樣子的互聯(lián)網(wǎng)老兵,大家認為誰能做出中國版的ChatGPT?

袁曄:我認為,我們很難再去做一個OpenAI他們一樣做出的ChatGPT,哪怕是谷歌、亞馬遜、Mate,當(dāng)然,這也包括國內(nèi)的一些公司。因為第一名已經(jīng)跑很遠了,并且像雪球一樣越滾越大,我們很難去追趕。既然如此,為什么不另辟蹊徑呢?

第二,從現(xiàn)實的角度來說,國內(nèi)的相關(guān)法律法規(guī)跟北美也不一樣,包括數(shù)據(jù)狀況跟北美也不一樣,所以我們也不太可能做出一模一樣的東西來,而且也不可能去在英語世界做出這樣一個應(yīng)用。我們處在中文世界里,所以我們只能說不安其命,大家有自己的想法,大廠做出解決大廠自己問題的東西,初創(chuàng)公司有初創(chuàng)公司的玩法。然后無非就是看大家要解決的問題是什么,是真的要解決自己的業(yè)務(wù)問題,比如說大廠想要解決自身業(yè)務(wù)的問題,初創(chuàng)公司解決一個具體的業(yè)務(wù)場景問題。

所以,通用這個事情是比較難的,我認為國內(nèi)做垂直類大模型的機會可能更大些。

:圍繞著ChatGPT相關(guān)領(lǐng)域,您認為目前有哪些創(chuàng)業(yè)機會?圍繞著數(shù)據(jù)隱私安全,有沒有一些創(chuàng)業(yè)的方向?您對創(chuàng)業(yè)者有沒有什么建議?同時對已經(jīng)深耕ChatGPT領(lǐng)域的企業(yè)提出一些建議或看法?

袁曄:對于創(chuàng)業(yè)公司來說,需要考慮的事情包括團隊、資金等各方面的能力??傮w來說,沿著通用大模型創(chuàng)業(yè)還是比較難的。

我們需要做的是擁抱新技術(shù),去使用它、結(jié)合它,應(yīng)用它。對于國內(nèi)創(chuàng)業(yè)者而言,做通用大模型還是有難度,國內(nèi)更適合在垂直行業(yè)做模型,開花結(jié)果。

:ChatGPT是否會引發(fā)第四次工業(yè)革命?

袁曄:對第四代或第四個階段的定義,其實之前像區(qū)塊鏈、Web3,大家都會有類似的一些角度,比如說Web3顧名思義第三代互聯(lián)網(wǎng),區(qū)塊鏈大家也講是第三代互聯(lián)網(wǎng),包括 VR/AR/MR、元宇宙這些。至于ChatGPT本身,把大家?guī)У搅说谒拇€是怎么樣,只能由歷史來定,我們現(xiàn)階段其實都是在猜。

但有一點,結(jié)合第一個咱們討論的問題,我想簡單說一下其他角度,就是說無論ChatGPT發(fā)展到什么程度,我覺得人類本身就是一個渺小的,而且在宇宙整個時間軸里都是很短暫的。

我們今天的人類其實跟100萬年前的人類其實已經(jīng)不一樣了,甚至與在沒有工業(yè)革命之前的人類也不一樣。我們的體力、身體的結(jié)構(gòu)其實多多少少都發(fā)生了微妙的變化,因為機器等帶來的就是我們不需要那么強調(diào)體力、上肢及下肢。我們很多時候擔(dān)心說AI去挑戰(zhàn)人類,我覺得有點過慮了。

但有一點,我們?nèi)肀?,和它去做結(jié)合,包括腦機接口、假肢義肢,這些都是人與機器的融合。同時我認為,工業(yè)革命雖然帶來很多工作崗位的消失,但同樣也會創(chuàng)造大量的工作崗位。

:在這樣的背景下,我們需要具備怎么樣的技能才能應(yīng)對ChatGPT帶來的生產(chǎn)力的一個變革?

袁曄:特別簡單——用,讓他不斷地學(xué)習(xí)。通過各種方法去用ChatGPT,他的API是開的,調(diào)用他的API去做一些簡單的應(yīng)用,才知道這個東西到底是什么,才知道怎么去結(jié)合它,否則就天天說,數(shù)學(xué)來了加減乘除很嚇人,但是你從來不去學(xué)加減乘除,你就覺得它跟洪水猛獸一樣的東西。

當(dāng)你學(xué)了,你才知道你如何作為一個個體的人去跟他結(jié)合,我覺得核心就是要去用。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-04-21
融數(shù)聯(lián)智創(chuàng)始人兼CEO袁曄:國內(nèi)更適合做垂直類大模型
擁抱新技術(shù),去使用它、結(jié)合它,應(yīng)用它。

長按掃碼 閱讀全文