桔子视频一区二区三区视频在线,国产乱理伦片在线观看、丿

7月27日消息，25日，清華大學(xué)人工智能研究院教授、歐洲人文和自然科學(xué)院外籍院士孫茂松在浦江基礎(chǔ)科學(xué)發(fā)展論壇期間接受采訪時(shí)表示，根據(jù)現(xiàn)有文本分析、不生成新文本的理解類大模型不存在“幻覺(jué)”。但像ChatGPT這樣生成類的大模型，對(duì)話需要與事實(shí)對(duì)齊，這還要付出很大的努力，也是目前的研究熱點(diǎn)。

澎湃新聞報(bào)道，孫茂松表示，當(dāng)前業(yè)界對(duì)于ChatGPT的舉一反三還處于“知其然，不知其所以然”的階段，只有搞清楚大模型的機(jī)理，才有可能克服現(xiàn)有人工智能大模型的局限性，超越現(xiàn)有大模型，建立下一代人工智能理論和模型。而人工智能最前沿之爭(zhēng)就是人才的競(jìng)爭(zhēng)，頂尖高手決定了人工智能的高度，廣泛的應(yīng)用決定了人工智能的廣度。

理解大模型機(jī)理，才能克服局限建立下一代AI理論

人們常常忽略語(yǔ)言的重要性，因?yàn)檎Z(yǔ)言自然得就像空氣一樣。但只有人類才有語(yǔ)言能力，語(yǔ)言的地位極其重要。而ChatGPT的出現(xiàn)讓機(jī)器也有了語(yǔ)言對(duì)話的能力，孫茂松說(shuō)，這是5000年未有之變局，也會(huì)催生一系列新應(yīng)用。

但對(duì)于ChatGPT，“現(xiàn)在是知其然，不知其所以然。OpenAI開(kāi)發(fā)出了這樣的現(xiàn)象，但為何會(huì)產(chǎn)生智能涌現(xiàn)這樣的現(xiàn)象還說(shuō)不清?，F(xiàn)在人工智能領(lǐng)域的大公司、大機(jī)構(gòu)都在拼命往前跑，把大模型效果做得更好，還沒(méi)有時(shí)間停下來(lái)深刻地思考大模型的機(jī)理?！睂O茂松表示，這就像蒸汽機(jī)帶來(lái)了工業(yè)革命，但直到大約100年后在熱力學(xué)三定律之下才解釋清楚。

大模型里的元素事關(guān)數(shù)學(xué)，當(dāng)前大模型的參數(shù)到了萬(wàn)億級(jí)，應(yīng)用數(shù)學(xué)家從來(lái)沒(méi)有解過(guò)如此大的方程組，并且大模型涉及到的數(shù)學(xué)問(wèn)題與經(jīng)典數(shù)學(xué)完全不同，這為理解大模型機(jī)理帶來(lái)了挑戰(zhàn)。

但孫茂松認(rèn)為，只有搞清楚大模型的機(jī)理，才有可能克服現(xiàn)有人工智能大模型的局限性，超越現(xiàn)有大模型，建立下一代人工智能理論和模型。而這不會(huì)再像蒸汽機(jī)那樣需要100年才能理解機(jī)理，他相信三五年時(shí)間就能突破大模型的機(jī)理研究。

語(yǔ)料利用處于粗放階段，減少大模型幻覺(jué)是研究熱點(diǎn)

目前大模型的語(yǔ)料利用還處于粗放階段，僅僅是從互聯(lián)網(wǎng)上抓取語(yǔ)料，還沒(méi)有涉及網(wǎng)頁(yè)中的超鏈接和圖片處理、文本結(jié)構(gòu)的識(shí)別與利用等。孫茂松表示，“大模型寫短文可以寫得很好，但寫長(zhǎng)文、短篇小說(shuō)不行，它沒(méi)有辦法保持大邏輯流暢、人物角色連貫。因?yàn)榇竽Ｐ途褪菍?duì)下一個(gè)詞的預(yù)測(cè)，預(yù)測(cè)得再好，它對(duì)語(yǔ)料的利用還是有深刻的不足?！?/p>

除此之外，孫茂松表示，要對(duì)語(yǔ)料質(zhì)量保持足夠關(guān)注，剔除語(yǔ)言不通順的語(yǔ)料、計(jì)算機(jī)生成的語(yǔ)料，利用質(zhì)量好的語(yǔ)料。但水至清則無(wú)魚，越純的語(yǔ)料可能導(dǎo)致多樣性損失，例如喂給大模型的都是“高大上的語(yǔ)料”，大模型就看不懂帶有表情符號(hào)的語(yǔ)料。因此要追求平衡，根據(jù)應(yīng)用判斷什么是好的語(yǔ)料。

大模型存在“幻覺(jué)”，常常一本正經(jīng)地“胡說(shuō)八道”。但孫茂松表示，“幻覺(jué)”是能力強(qiáng)的表現(xiàn)，是創(chuàng)新的源泉。大模型分為生成模型和理解模型，前者如ChatGPT，孫茂松說(shuō)，以前要讓計(jì)算機(jī)通順地說(shuō)話是做不到的，因?yàn)樵~與詞的組合關(guān)系復(fù)雜?，F(xiàn)在做到了通順，但并不意味著所說(shuō)的話是正確的，語(yǔ)義層、語(yǔ)用層都需要和現(xiàn)實(shí)世界對(duì)齊。

“比如機(jī)器回答在上海城隍廟吃了上海小籠包和上?？绝啠瑥恼Z(yǔ)言角度來(lái)看，這都沒(méi)有問(wèn)題。哪個(gè)更符合事實(shí)，它就不知道了，這就需要人介入進(jìn)來(lái)?！睂O茂松表示，大模型的對(duì)話需要與事實(shí)對(duì)齊，這還要付出很大的努力，也是目前的研究熱點(diǎn)。

對(duì)于后者，模型根據(jù)現(xiàn)有文本進(jìn)行分析，不生成新的文本，只理解不說(shuō)話，就不存在“幻覺(jué)”。利用這種理解模型，打通語(yǔ)料，讓機(jī)器自主學(xué)習(xí)，就可以依靠模型查詢相似詩(shī)句，例如哪一詩(shī)句和杜甫《絕句》中的“一行白鷺上青天”最接近？大模型的回答是宋代《野景》中的“白鷺一行登碧霄”，這就是大模型所擅長(zhǎng)的。

AI最前沿之爭(zhēng)是人才的競(jìng)爭(zhēng)，頂尖高手決定高度

這一波人工智能浪潮起于2010年，彼時(shí)學(xué)術(shù)界和工業(yè)界都在開(kāi)足馬力研究，積累了充分的經(jīng)驗(yàn)，ChatGPT的出現(xiàn)為人工智能點(diǎn)了一把火。孫茂松表示，國(guó)內(nèi)的“百模大戰(zhàn)”并非貶義，而是實(shí)力的象征。未來(lái)通用大模型支撐垂直模型的開(kāi)發(fā)，絕大多數(shù)從業(yè)者將不會(huì)把主要精力放在基礎(chǔ)模型上，而是面向行業(yè)應(yīng)用開(kāi)發(fā)垂直模型。

但在通用大模型方面，“我們確實(shí)在跟跑，跟領(lǐng)跑者的差距很明顯。這半年我們把差距縮小了，但沒(méi)有質(zhì)的變化?！睂O茂松表示，在ChatGPT之前，國(guó)內(nèi)的大模型研究和國(guó)外相比差半個(gè)肩位，ChatGPT出現(xiàn)后甩開(kāi)100米，這半年追了幾十米，但在關(guān)鍵性能上還有差距。如果能夠研究透徹大模型的機(jī)理，就可能棋高一著。

無(wú)論是模型還是應(yīng)用，都離不開(kāi)硬件廠商或云服務(wù)商，算力目前是最稀缺的資源。啟明創(chuàng)投發(fā)布的《生成式AI》報(bào)告顯示，GPU的性能實(shí)際上決定了這個(gè)新興行業(yè)的步調(diào)，但從長(zhǎng)期來(lái)看，人才對(duì)人工智能未來(lái)的影響超過(guò)算力。

孫茂松同樣認(rèn)為，人工智能最前沿之爭(zhēng)就是人才的競(jìng)爭(zhēng)，頂尖高手決定了人工智能的高度，廣泛的應(yīng)用決定了人工智能的廣度。人工智能的發(fā)展需要一流的人才，這些人才除了具備頂尖的能力，還要有遠(yuǎn)大的科學(xué)理想、敏銳的洞察力和對(duì)技術(shù)的激情。

免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

清華大學(xué)教授孫茂松：理解大模型機(jī)理建立AI新理論

下一篇