123,123,123

AI版《超級馬力歐兄弟》試玩：Claude 3.7操作驚艷，推理模型表現(xiàn)堪憂！

人閱讀

2025-03-04 16:46:43

作者：極客AI
相關(guān)關(guān)鍵詞

標(biāo)題：AI版《超級馬力歐兄弟》：Claude 3.7操作驚艷，推理模型表現(xiàn)堪憂！

隨著人工智能（AI）技術(shù)的飛速發(fā)展，越來越多的領(lǐng)域開始探索其應(yīng)用潛力。近日，加利福尼亞大學(xué)圣地亞哥分校的Hao人工智能實驗室將AI引入經(jīng)典游戲《超級馬力歐兄弟》中，進(jìn)行了一項獨(dú)特的研究，以測試其性能表現(xiàn)。實驗結(jié)果顯示，Anthropic的Claude 3.7在參與測試的AI模型中表現(xiàn)最為出色，而Claude 3.5緊隨其后。相比之下，谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o則表現(xiàn)不佳。

首先，我們需要明確一點(diǎn)，此次實驗所使用的并非1985年最初發(fā)布的《超級馬力歐兄弟》版本。實驗室通過一個模擬器進(jìn)行游戲運(yùn)行，并通過一個名為GamingAgent的框架與AI進(jìn)行連接，從而讓AI能夠控制馬力歐。GamingAgent由實驗室自主研發(fā)，它向AI提供基本指令，例如“如果附近有障礙物或敵人，向左移動或跳躍以躲避”。同時，它還提供游戲內(nèi)的截圖，為AI提供實時的反饋信息。隨后，AI通過生成Python代碼的形式來操控馬力歐。

這個實驗環(huán)境可謂是極具挑戰(zhàn)性，它迫使每個AI模型“學(xué)習(xí)”如何規(guī)劃復(fù)雜的操作并制定游戲策略。實驗結(jié)果反映出，非推理模型在實時游戲中表現(xiàn)更佳。這主要是因為推理模型在決定行動時通常需要花費(fèi)數(shù)秒時間，而在《超級馬力歐兄弟》中，時機(jī)至關(guān)重要，一秒鐘的差別可能意味著安全跳過和墜落死亡的不同結(jié)果。

數(shù)十年來，游戲一直是衡量AI性能的重要工具。然而，一些專家對將AI在游戲中的表現(xiàn)與技術(shù)進(jìn)步直接掛鉤的做法提出了質(zhì)疑。與現(xiàn)實世界相比，游戲往往是抽象且相對簡單的，因此AI在游戲中的表現(xiàn)并不能完全代表其在現(xiàn)實世界中的應(yīng)用能力。

盡管如此，我們?nèi)钥梢詮腁I版《超級馬力歐兄弟》中獲得許多樂趣和啟示。觀看AI玩馬力歐本身就是一種有趣的體驗，尤其是當(dāng)Claude 3.7等表現(xiàn)優(yōu)異的模型操控馬力歐時，其操作更是讓人驚艷。相比之下，推理模型在游戲中的表現(xiàn)就顯得有些堪憂。這并非是因為它們能力不足，而是因為游戲環(huán)境的特殊性質(zhì)所致。

此外，這項研究還為我們提供了對未來AI發(fā)展的思考。隨著更多像Claude 3.7這樣的模型被研發(fā)出來，我們是否可以期待更多的創(chuàng)新和突破？毫無疑問，AI在游戲領(lǐng)域的應(yīng)用前景是廣闊的。無論是從娛樂的角度，還是從技術(shù)的角度，我們都期待著更多的探索和創(chuàng)新。

總的來說，AI版《超級馬力歐兄弟》的試玩活動為我們提供了一個有趣的視角，讓我們看到了AI技術(shù)在游戲中的應(yīng)用潛力。盡管存在一些質(zhì)疑和挑戰(zhàn)，但不可否認(rèn)的是，AI正在逐漸改變我們的生活，為我們帶來更多的可能性和機(jī)遇。讓我們期待著未來的發(fā)展，期待著更多令人驚奇的AI應(yīng)用出現(xiàn)。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請進(jìn)一步核實，并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）