張亞勤:大模型做對(duì)了三件事,還需三大改進(jìn)

6月17日消息(南山)日前舉辦的人工智能行業(yè)盛會(huì)“2024北京智源大會(huì)”上,零一萬物CEO李開復(fù)與清華大學(xué)智能產(chǎn)業(yè)研究院院長(zhǎng)、智源學(xué)術(shù)顧問委員張亞勤進(jìn)行了一場(chǎng)尖峰對(duì)話。

在對(duì)話中,李開復(fù)強(qiáng)調(diào),大模型是AI有史以來最大的革命,人類能夠用更多計(jì)算和數(shù)據(jù)不斷讓它增加智慧,目前還在推進(jìn)中,這是令人振奮的事情。當(dāng)然挑戰(zhàn)也非常多,例如當(dāng)前主要靠算力推動(dòng),使得掌握GPU資源的國(guó)家處在優(yōu)勢(shì)地位;再如因?yàn)閿?shù)據(jù)問題,大模型不知道“最近一年發(fā)生了什么”。當(dāng)然,隨著人類社會(huì)加大研究,李開復(fù)對(duì)大模型的未來十分樂觀。

張亞勤則談到,大模型做對(duì)了三件事,還需三大改進(jìn)。

做對(duì)了哪三件事?一是規(guī)模法則(Scaling Law),得益于對(duì)海量數(shù)據(jù)的利用以及算力的顯著提升,再加上現(xiàn)在的Diffusion和Transformer架構(gòu)能夠高效地利用算力和數(shù)據(jù),使得“飛輪效應(yīng)”得以正循環(huán)。盡管有人質(zhì)疑Scaling Law在2~3年后是否仍然有效,但至少在未來5年里,它仍將是大模型發(fā)展的主要方向。

二是“Token Beist”。在大模型中,“Token”是一個(gè)基本元素,無論是文本、語(yǔ)音、圖像、視頻、自動(dòng)駕駛,甚至是生物領(lǐng)域的蛋白質(zhì)和細(xì)胞,最終都可以抽象為一個(gè)Token。Token之間的訓(xùn)練、學(xué)習(xí)和生成是核心環(huán)節(jié),這與人類大腦中的神經(jīng)元工作原理相似,無論執(zhí)行何種任務(wù),其基礎(chǔ)機(jī)制都是相同的。

三是通用性。通用性不僅體現(xiàn)在文本處理上,還擴(kuò)展到了多模態(tài)領(lǐng)域,甚至可以生成如蛋白質(zhì)等復(fù)雜結(jié)構(gòu)。此外,它在物理世界(如具身智能)和生物世界(如生物智能)中也有著廣泛的應(yīng)用前景。

此外大模型還需要做三大改進(jìn)。一是效率,人類大腦擁有860億個(gè)神經(jīng)元,每個(gè)神經(jīng)元又有數(shù)千個(gè)突觸連接,卻只需要20瓦的能量,重量還不到三斤;而大模型還依靠大量堆積GPU,需要建立真正的商業(yè)模式,大幅度提升效率。

二是大模型沒有真正理解物理世界。當(dāng)前做的再好的大模型,在生成式和對(duì)世界真實(shí)的表述之間存在矛盾,人類需要探索如何將生成式的概率大模型與現(xiàn)有的“第一性原理”或真實(shí)模型、知識(shí)圖譜相結(jié)合。張亞勤認(rèn)為,未來 5年會(huì)有全新的架構(gòu)替代現(xiàn)在的Transformer和Diffusion模型。

三是欠缺邊界。大模型現(xiàn)在不明白“我不知道什么”,需要業(yè)界解決這個(gè)難題。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-06-17
張亞勤:大模型做對(duì)了三件事,還需三大改進(jìn)
張亞勤:大模型做對(duì)了三件事,還需三大改進(jìn),C114訊 6月17日消息(南山)日前舉辦的人工智能行業(yè)盛會(huì)2024北京智源大會(huì)上,零一萬物CEO李

長(zhǎng)按掃碼 閱讀全文