AI組成的DOTA戰(zhàn)隊(duì)?wèi)?zhàn)勝了人類高分選手

過去在電子競(jìng)技項(xiàng)目中與人類爭(zhēng)鋒的AI選手其實(shí)通常會(huì)使用相當(dāng)于作弊的方式。

曾在即時(shí)戰(zhàn)略游戲《星際爭(zhēng)霸》中戰(zhàn)勝人類的AI可以直接以內(nèi)部調(diào)用的方式操作單位,實(shí)現(xiàn)真正的多線操作,這對(duì)于使用鼠標(biāo)鍵盤實(shí)現(xiàn)輸入的人類選手來說,是不可能做到的。而在moba對(duì)戰(zhàn)類游戲里,如DOTA,AI可以讀取對(duì)方的操作指令集,能實(shí)現(xiàn)對(duì)人類來說極其不可思議的躲避瞬時(shí)法術(shù)的驚人操作。(AI能用隱刀躲掉紅杖……)

這些看似有利的情況其實(shí)削弱了AI的存在價(jià)值,畢竟,人們制造出人工智能是希望它們能以正面的方式超越人類,突破思想上的極限。


OpenAI ——Elon Musk和Sam Altman 合作創(chuàng)立的非商業(yè)AI研究組織——向世人宣布,他們研發(fā)的算法,在公平環(huán)境下,戰(zhàn)勝了五位DOTA2高分段人類玩家,平均天梯分?jǐn)?shù)超過4200分。

秋天,Dota 2世界冠軍賽The International就將拉開戰(zhàn)幕,OpenAI將派出5個(gè)運(yùn)行不同算法的AI組成戰(zhàn)隊(duì)報(bào)名參賽。 通過和頂級(jí)選手同場(chǎng)較量,實(shí)地檢驗(yàn)AI的性能。

AI參加并贏得了去年大賽中的1v1solo游戲環(huán)節(jié),職業(yè)選手說,看比賽回放,他們發(fā)現(xiàn)機(jī)器人有值得他們借鑒之處。但是,作為一個(gè)團(tuán)隊(duì)來進(jìn)行游戲引入了不同類型的復(fù)雜性, OpenAI必須教會(huì)AI機(jī)器人進(jìn)行協(xié)作。

在任何時(shí)候,英雄(或角色)可以從1000個(gè)動(dòng)作中選擇出一個(gè)來執(zhí)行;機(jī)器人必須做出有效的判斷,同時(shí)處理大約20000個(gè)值,這些數(shù)值代表特定時(shí)間游戲時(shí)刻正在發(fā)生的事情。國際象棋中可能采取的行動(dòng)的平均數(shù)量為35,因此它比在90年代擊敗國際象棋特級(jí)大師加里·卡斯帕羅夫的超級(jí)電腦深藍(lán)還要來得稍微復(fù)雜點(diǎn)。

OpenAI使用強(qiáng)化學(xué)習(xí)算法。這基本上是一種試錯(cuò)法,隨著時(shí)間的推移,人工智能從完全隨機(jī)的行為發(fā)展出有方向性的游戲風(fēng)格。 OpenAI在超過100000個(gè)CPU上運(yùn)行Dota 2,并且AI每天的訓(xùn)練量大概相當(dāng)于人類180年的游戲時(shí)間,給AI提供充足的學(xué)習(xí)機(jī)會(huì)。此處鏈接為此前AI學(xué)習(xí)dota的畫面。

處理河道刷出的神符對(duì)AI來說是一個(gè)挑戰(zhàn),因?yàn)樗鼈兛梢愿淖冇螒虻淖呦?。由于不允許作弊,AI的視野也被限制在一屏上的內(nèi)容,人工智能需要推斷對(duì)手正在做的事情,并根據(jù)推斷做出后續(xù)決定。所以,在前面提到的團(tuán)隊(duì)測(cè)試中,人類玩家不能購買水瓶和真假眼一類的物品,以及雙方可選的對(duì)戰(zhàn)陣容也相對(duì)狹窄——以免游戲走向?qū)Τ绦騺碚f過于復(fù)雜的局面。

但我們有理由相信這僅僅是個(gè)開始。

機(jī)器人具有先天優(yōu)勢(shì),例如80ms的反應(yīng)時(shí)間,這比人類更快。他們每分鐘執(zhí)行150-170次動(dòng)作,這與頂級(jí)人類選手相當(dāng)。而隨著游戲時(shí)間累積,程序開發(fā)出的戰(zhàn)術(shù)思想與人類玩家越來越接近,比如打野、pick游戲中特定的核心戰(zhàn)略角色,合理分路,Gank 和支援隊(duì)友等。

當(dāng)然,OpenAI的目標(biāo)不是打造一支無與倫比的Dota 2戰(zhàn)隊(duì),在把1500萬美元的大賽獎(jiǎng)金帶回家,而是嘗試訓(xùn)練AI解決各種復(fù)雜的問題。與此同時(shí),在保留部分限制的條件下,吊打Dota人類冠軍團(tuán)隊(duì)也足以令OpenAI的科學(xué)家感到心滿意足。

本文譯自engadget,由譯者 majer 基于創(chuàng)作共用協(xié)議(BY-NC)發(fā)布。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2018-12-11
AI組成的DOTA戰(zhàn)隊(duì)?wèi)?zhàn)勝了人類高分選手
過去在電子競(jìng)技項(xiàng)目中與人類爭(zhēng)鋒的AI選手其實(shí)通常會(huì)使用相當(dāng)于作弊的方式。

長(zhǎng)按掃碼 閱讀全文