7月18日消息,這兩天又一件事吵得沸沸揚(yáng)揚(yáng):包括ChatGPT 4o、谷歌Gemini Advanced、Claude 3.5 Sonnet在內(nèi)的很多SOTA大模型王者在回答“9.9和9.11誰(shuí)更大”的問(wèn)題時(shí)紛紛翻車。這讓大家大跌眼鏡,人工智能還是人工智障的說(shuō)法再次卷土重來(lái)。
360創(chuàng)始人周鴻祎對(duì)該熱門話題也發(fā)表了自己的觀點(diǎn),他認(rèn)為:“不要低估大模型未來(lái)發(fā)展的潛力,但是不要高估大模型現(xiàn)在的實(shí)力“,”不要因?yàn)檫@個(gè)事就對(duì)大模型表示失望。這恰恰說(shuō)明了其實(shí)大模型跟人的大腦是非常像的,它并不是萬(wàn)能的?!?/p>
同時(shí),周鴻祎還解釋了大模型為什么不識(shí)數(shù)、并給出了解決大模型不識(shí)數(shù)問(wèn)題的解決方案。
大模型為什么不識(shí)數(shù)?
周鴻祎認(rèn)為,大模型現(xiàn)在還是有很多的缺點(diǎn),不認(rèn)識(shí)“9.11和9.9誰(shuí)大”,就是一個(gè)典型的例子。
“看了幾個(gè)大模型輸出的答案,差不多都在胡言亂語(yǔ),為什么呢?”周鴻祎簡(jiǎn)單解釋了為什么大模型會(huì)認(rèn)為9.1比9.9大。
他認(rèn)為:第一個(gè)問(wèn)題:“其實(shí)大模型的全稱叫大語(yǔ)言模型,它首先解決的是對(duì)人類自然語(yǔ)言理解的問(wèn)題。所以大模型把9.9和9.11并沒(méi)有當(dāng)成一個(gè)數(shù)字來(lái)看,而是把它們分成了兩個(gè)token。沒(méi)有經(jīng)過(guò)專門特別的提示和訓(xùn)練,大模型是不懂阿拉伯?dāng)?shù)字,也不懂?dāng)?shù)學(xué),所以大模型是按照一個(gè)文字的邏輯來(lái)進(jìn)行對(duì)比。所以9前面是一樣大的,那么11比9要大,所以就得出來(lái)9.11比9.9要大。”
周鴻祎還舉了個(gè)例子:這就好比你小時(shí)候上私塾只學(xué)了四書五經(jīng),一點(diǎn)數(shù)學(xué)算數(shù)都沒(méi)學(xué)。那出一個(gè)這樣的小數(shù)題你當(dāng)然就不會(huì)了。
第二個(gè)問(wèn)題就是對(duì)提示詞的依賴。也就是說(shuō)你跟人工智能提要求的時(shí)候,如果都是聊天機(jī)器人的界面,你的說(shuō)法不一樣,那大模型的反應(yīng)是不一樣的。就好像一個(gè)問(wèn)題換了種問(wèn)法,有時(shí)候大模型就很聰明,有時(shí)候大模型就很笨。這恰恰說(shuō)明了通過(guò)自然語(yǔ)言跟大模型來(lái)交流交互,在有些情況下是一種非常不靠譜的方式。比如也有人說(shuō)換一種問(wèn)法大模型就會(huì)了,比如說(shuō)把9.9和9.11放在前面,再問(wèn)誰(shuí)大誰(shuí)小,而不是先問(wèn)誰(shuí)大誰(shuí)小,然后把9.11和9.9放在后面。
怎么解決大模型不識(shí)數(shù)的問(wèn)題?
“這也恰恰說(shuō)明了光靠大模型是解決不了企業(yè)政府的很多實(shí)際的工作和生產(chǎn)上的問(wèn)題,需要和其他技術(shù)相結(jié)合“,周鴻祎認(rèn)為,其實(shí)解決這個(gè)問(wèn)題也很簡(jiǎn)單,有三種做法。
第一種方法,就是要教會(huì)大模型數(shù)學(xué),就要把很多數(shù)學(xué)知識(shí)進(jìn)行專門的訓(xùn)練。就像我們小學(xué)上了語(yǔ)文之后,還要學(xué)算數(shù)一樣。有了這樣專門的訓(xùn)這樣的專業(yè)模型,就可以正確的回答這個(gè)問(wèn)題。
第二個(gè)解決問(wèn)題的方法,是像360AI搜索一樣,就利用搜索和知識(shí)推理相結(jié)合。
周鴻祎稱,剛才試看了一下360大模型的回答,實(shí)際上也是不準(zhǔn)確的。但是跟360AI搜索結(jié)合在一起,通過(guò)全網(wǎng)搜索類似的答案,再加上大模型的理解,相當(dāng)于是現(xiàn)找答案,然后現(xiàn)教大模型,那么答案就是對(duì)的。這也就是搜索增強(qiáng)或者知識(shí)對(duì)齊。
第三種方法實(shí)際上調(diào)用API。比如說(shuō)如果大模型能夠識(shí)別這是一個(gè)數(shù)學(xué)題,但是它不會(huì)解。沒(méi)關(guān)系,利用函數(shù)調(diào)用的方式去調(diào)比如說(shuō)一個(gè)數(shù)學(xué)網(wǎng)站的API,比如說(shuō)有很多類似的這種數(shù)學(xué)網(wǎng)站,可以準(zhǔn)確的告訴你9.9和9.11誰(shuí)大誰(shuí)小。
還有一種最簡(jiǎn)單的做法,為什么大模型現(xiàn)在都要學(xué)編程呢?因?yàn)榫幊叹秃帽仁谴竽P徒o了一個(gè)計(jì)算器,那你出了一道數(shù)學(xué)題,雖然我不會(huì)回答,但是如果我手上有個(gè)計(jì)算器,那我就能回答。所以有了大模型會(huì)懂得調(diào)pythons語(yǔ)言,用pythons來(lái)寫一個(gè)程序,讓pythons來(lái)比一下9.11和9.9誰(shuí)大。當(dāng)然了,編程的程序結(jié)果如果是對(duì)的那也會(huì)得出正確的答案。
最后,周鴻祎給出了三點(diǎn)總結(jié):
第一,大模型對(duì)自然語(yǔ)言的理解是它的基礎(chǔ)。很多數(shù)學(xué)物理化學(xué)的這些專業(yè)知識(shí)他并不了解,這個(gè)很正常。大家不要驚訝,要學(xué)習(xí)這些知識(shí)還需要專業(yè)的模型訓(xùn)練。
第二,利用搜索可以把人類擁有的解題的經(jīng)驗(yàn)和知識(shí)的推理相結(jié)合,實(shí)際上是一種可以單獨(dú)用大模型更有效的一種方法。
第三,大模型作為一個(gè)聊天機(jī)器人,實(shí)際上直接在業(yè)務(wù)和工作上直接用是不現(xiàn)實(shí)的,一定需要給他增加各種能力的補(bǔ)強(qiáng)。比如說(shuō)它能調(diào)用其他的工具,能自己編程序來(lái)算。實(shí)際上人類也是這樣,如果給了人類一個(gè)很復(fù)雜的一堆數(shù)據(jù),讓人類憑著自己的頭腦去總結(jié)數(shù)據(jù)的規(guī)律,人類也往往回答不正確。但是人類如果會(huì)編程序,或者手邊有一個(gè)什么計(jì)算軟件,那么用這個(gè)計(jì)算軟件和工具就可以幫助人類得到正確的答案。所以大模型也需要外部工具的幫助。
”所以不要因?yàn)檫@個(gè)事兒對(duì)大模型表示失望。這恰恰說(shuō)明了其實(shí)大模型跟人的大腦是非常像的,它并不是萬(wàn)能的。人今天之所以能做很多工作,人本身是得到了很多第三方工具的幫助,包括計(jì)算機(jī),包括計(jì)算器。“周鴻祎強(qiáng)調(diào),”希望不要因?yàn)檫@個(gè)事兒?jiǎn)适銓?duì)人工智能的信心?!?br/>
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型Baichuan4-Finance,整體準(zhǔn)確率領(lǐng)先GPT-4o近20%
- 央視曝光未成年人可輕松繞開(kāi)“防沉迷”系統(tǒng):租號(hào)玩游戲最低僅需4元
- 知乎發(fā)布2024“年度十問(wèn)”:《黑神話:悟空》、諾貝爾物理學(xué)獎(jiǎng)等問(wèn)題在列
- 李斌回應(yīng)螢火蟲三重奏大燈設(shè)計(jì):沒(méi)有參考iPhone
- 一周熱點(diǎn)匯總:特斯拉下月量產(chǎn)改款Model Y,阿里“甩賣”銀泰
- 蔚來(lái)第三品牌firefly螢火蟲首款車型正式亮相 預(yù)售價(jià)14.88萬(wàn)元
- 首發(fā)線控轉(zhuǎn)向等多項(xiàng)技術(shù) 蔚來(lái)旗艦車型ET9正式上市:78.8萬(wàn)元起
- 網(wǎng)信辦:從嚴(yán)打擊網(wǎng)上侵害未成年人合法權(quán)益行為
- 豆包大模型全面升級(jí),相關(guān)概念股瘋漲,字節(jié)發(fā)布緊急警示
- “小紅書封號(hào)”沖上熱搜,小米YU7無(wú)偽裝實(shí)車首次曝光
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。