01
相信這兩天你一定被這則消息刷屏了——OpenAI 發(fā)布了GPT-4。
在聊GPT-4之前,我們先來介紹下GPT。
進入21世紀,隨著人工智能的發(fā)展,自然語言處理(NLP)領(lǐng)域取得了顯著進展。OpenAI作為人工智能前沿企業(yè),推出了GPT系列的自然語言處理模型。從2018年發(fā)布GPT-1,到如今的GPT-4,每一代模型都在數(shù)據(jù)規(guī)模、性能和多樣性方面取得了突破性的進展,其中被大家所熟知的是基于GPT-3.5的聊天機器人——ChatGPT。
02
和上一代相比,GPT-4帶給我們最大的震撼就是多模態(tài)模型,通俗點說,就是不僅可以像GPT-3.5一樣進行文字對話,還可以進行視覺邏輯推理——識別圖像并基于上下文應(yīng)答相關(guān)問題。
比如在下圖中,GPT-4解釋了圖片的不尋常之處——一名男子正在行駛中的出租車頂熨燙衣服。
關(guān)于兩者的區(qū)別,打個更直觀的比喻:GPT-3.5更像一個瞎子,只能聽人說,GPT-4有眼睛了,不僅可以聽人說,還能看圖片了。這就好比一個醫(yī)生,過去只能聽患者口頭描述病情,現(xiàn)在可以看CT、B超等影像結(jié)果了,這必須是一個里程碑。
因為這使得GPT-4具有更多的商業(yè)化應(yīng)用和集成,從而使其在各種場景中更具價值。同時,它可能與其他AI系統(tǒng)更好地協(xié)同工作,從而為用戶提供更加豐富的體驗。
目前 Open AI 還沒有將 GPT-4 中的圖像識別能力開放給普通用戶,但已經(jīng)為一些應(yīng)用提供了支持。比如,OpenAI 正在與 BeMyEyes 密切合作。
BeMyEyes是一家丹麥公司,致力于為盲人或視力低下的人提供技術(shù)幫助。BeMyEyes在接入了GPT-4后,視障人群就有了一個「虛擬志愿者」,可以用來描述服裝的外觀、識別植物、閱讀地圖、翻譯標簽等等。
當然,目前容易犯錯的AI還難以完全取代人類志愿者,但也大大提升了效率。
03
第二個區(qū)別在于,GPT-4能夠識別和處理更復(fù)雜的指令。
一方面,量上來了——GPT-4能夠讀取或生成的文字篇幅高達25000詞,遠超篇幅上限為3000詞的ChatGPT。這意味著GPT-4可以更好地用于提取摘要、長篇內(nèi)容創(chuàng)作、文檔搜索和分析等應(yīng)用場景。
另一方面,質(zhì)也提高了——GPT-4具備更高的準確性、生成質(zhì)量和任務(wù)完成能力。
比如,我分別讓GPT-3.5(左)和GPT-4(右)給亮三點寫3句slogan,要求是簡短且押韻。從結(jié)果來看,不管是精簡程度還是押韻效果,GPT-4都完勝。
我們再來看看官方的報告:OpenAI稱,GPT-4與上一代GPT-3.5相比,在日常的對話中所體現(xiàn)出的差別并不大,但是在各項標準化考試中,GPT-4的表現(xiàn)明顯優(yōu)于上一代,已經(jīng)達到了人類的水準。
例如在GRE考試中的數(shù)學部分,滿分是170分,GPT-4獲得163分,而上一代GPT-3.5得分為147分,在GRE語言部分,GPT-4得分為169分,GPT-3.5得分為154分。
這還不算什么,在一次模擬律師考試中,GPT-4 的分數(shù)在應(yīng)試者中排名前 10%,而GPT-3.5 的得分排名在后10%。
也就是說,上了半年輔導(dǎo)班后,GPT的成績從班級倒數(shù)第十名,躍升為班級前十,這太驚人了!你說,應(yīng)試教育該怎么辦?
04
第三個區(qū)別在于, GPT-4對誤導(dǎo)性輸出和不恰當內(nèi)容有更好的防范機制。
比如,我分別讓GPT-3.5(上)和GPT-4(下)講講關(guān)公戰(zhàn)秦瓊的故事。GPT-3.5一本正經(jīng)地胡說八道,很容易產(chǎn)生誤導(dǎo);GPT-4就嚴謹了許多,多次明確告訴你——這是胡說的,別信。
官方數(shù)據(jù)也表明了GPT-4在防范機制中的提升。其中,響應(yīng)被禁止內(nèi)容請求的可能性降低了82%,產(chǎn)生事實響應(yīng)的可能性提升了40%,根據(jù)政策響應(yīng)敏感請求(如醫(yī)療建議和自我傷害)的頻率提高了29%。
05
從GPT-3.5到GPT-4,有點從DOS直接升級到Windows 95的氣氛。這家伙升級迭代的太快了。
那些模仿者和追隨者們,剛把摩托車組裝好想追汽車,沒想到汽車的標還沒貼上的時候,人家領(lǐng)先者已經(jīng)起飛了。唉,這摩托車怎么去追趕飛機??!
AI朝著革命性和顛覆性改變傳統(tǒng)工作方式的方向又大大邁進了一步,一個機器和算法生成的AI時代開始了。而人類最核心的競爭力和技能或許不再是編程、計算,甚至分析能力,而是和大模型的對話能力。
當前社會的主要矛盾已經(jīng)轉(zhuǎn)變?yōu)锳I 的能力和人類想象力之間的矛盾。
06
最后,還是讓我們暢想一下,未來GPT還會怎么發(fā)展或者說會產(chǎn)生什么樣的影響呢?
首先,肯定是更強大的分析處理能力以及更精準的應(yīng)答能力。
其次,多模態(tài)和跨領(lǐng)域融合:比如,在現(xiàn)有的文本、圖像的基礎(chǔ)上加上音頻、視頻等,這將有助于模型在更多領(lǐng)域發(fā)揮作用,實現(xiàn)真正意義上的人工智能。
此外,還要有低資源場景的適應(yīng)性:隨著算法和硬件技術(shù)的進步,之后的GPT版本可能在配置相對較低的設(shè)備上也能表現(xiàn)出色,比如老人機及其他入門級智能手機、智能家居等物聯(lián)網(wǎng)設(shè)備、低端筆記本電腦和平板電腦等,使得更多用戶能夠享受到先進的自然語言處理技術(shù)帶來的便利。
當然,隨著人工智能在各個領(lǐng)域的廣泛應(yīng)用,未來的語言模型更需要關(guān)注安全性和倫理問題,確保其在保護用戶隱私、減少偏見和歧視等方面取得進展。
最后,語言模型的發(fā)展將對各個行業(yè)產(chǎn)生深遠影響,從而推動相關(guān)政策和法規(guī)的制定和完善,這將有助于確保人工智能技術(shù)的發(fā)展能夠造福整個社會。
免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。