AI版《超級馬力歐兄弟》試玩:Claude 3.7操作驚艷,推理模型表現(xiàn)堪憂!

標(biāo)題:AI版《超級馬力歐兄弟》:Claude 3.7操作驚艷,推理模型表現(xiàn)堪憂!

隨著人工智能(AI)技術(shù)的飛速發(fā)展,越來越多的領(lǐng)域開始探索其應(yīng)用潛力。近日,加利福尼亞大學(xué)圣地亞哥分校的Hao人工智能實驗室將AI引入經(jīng)典游戲《超級馬力歐兄弟》中,進(jìn)行了一項獨(dú)特的研究,以測試其性能表現(xiàn)。實驗結(jié)果顯示,Anthropic的Claude 3.7在參與測試的AI模型中表現(xiàn)最為出色,而Claude 3.5緊隨其后。相比之下,谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o則表現(xiàn)不佳。

首先,我們需要明確一點(diǎn),此次實驗所使用的并非1985年最初發(fā)布的《超級馬力歐兄弟》版本。實驗室通過一個模擬器進(jìn)行游戲運(yùn)行,并通過一個名為GamingAgent的框架與AI進(jìn)行連接,從而讓AI能夠控制馬力歐。GamingAgent由實驗室自主研發(fā),它向AI提供基本指令,例如“如果附近有障礙物或敵人,向左移動或跳躍以躲避”。同時,它還提供游戲內(nèi)的截圖,為AI提供實時的反饋信息。隨后,AI通過生成Python代碼的形式來操控馬力歐。

這個實驗環(huán)境可謂是極具挑戰(zhàn)性,它迫使每個AI模型“學(xué)習(xí)”如何規(guī)劃復(fù)雜的操作并制定游戲策略。實驗結(jié)果反映出,非推理模型在實時游戲中表現(xiàn)更佳。這主要是因為推理模型在決定行動時通常需要花費(fèi)數(shù)秒時間,而在《超級馬力歐兄弟》中,時機(jī)至關(guān)重要,一秒鐘的差別可能意味著安全跳過和墜落死亡的不同結(jié)果。

數(shù)十年來,游戲一直是衡量AI性能的重要工具。然而,一些專家對將AI在游戲中的表現(xiàn)與技術(shù)進(jìn)步直接掛鉤的做法提出了質(zhì)疑。與現(xiàn)實世界相比,游戲往往是抽象且相對簡單的,因此AI在游戲中的表現(xiàn)并不能完全代表其在現(xiàn)實世界中的應(yīng)用能力。

盡管如此,我們?nèi)钥梢詮腁I版《超級馬力歐兄弟》中獲得許多樂趣和啟示。觀看AI玩馬力歐本身就是一種有趣的體驗,尤其是當(dāng)Claude 3.7等表現(xiàn)優(yōu)異的模型操控馬力歐時,其操作更是讓人驚艷。相比之下,推理模型在游戲中的表現(xiàn)就顯得有些堪憂。這并非是因為它們能力不足,而是因為游戲環(huán)境的特殊性質(zhì)所致。

此外,這項研究還為我們提供了對未來AI發(fā)展的思考。隨著更多像Claude 3.7這樣的模型被研發(fā)出來,我們是否可以期待更多的創(chuàng)新和突破?毫無疑問,AI在游戲領(lǐng)域的應(yīng)用前景是廣闊的。無論是從娛樂的角度,還是從技術(shù)的角度,我們都期待著更多的探索和創(chuàng)新。

總的來說,AI版《超級馬力歐兄弟》的試玩活動為我們提供了一個有趣的視角,讓我們看到了AI技術(shù)在游戲中的應(yīng)用潛力。盡管存在一些質(zhì)疑和挑戰(zhàn),但不可否認(rèn)的是,AI正在逐漸改變我們的生活,為我們帶來更多的可能性和機(jī)遇。讓我們期待著未來的發(fā)展,期待著更多令人驚奇的AI應(yīng)用出現(xiàn)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2025-03-04
AI版《超級馬力歐兄弟》試玩:Claude 3.7操作驚艷,推理模型表現(xiàn)堪憂!
AI版《超級馬力歐兄弟》中,Claude 3.7操作驚艷,推理模型表現(xiàn)不佳。AI在游戲中的應(yīng)用潛力巨大,期待更多創(chuàng)新。

長按掃碼 閱讀全文