AI又贏了!Facebook人工智能擊敗全球頂尖德?lián)溥x手

Darren Elias是一名撲克玩家。今年32歲的他是唯一一個(gè)贏得過四次世界撲克巡回賽冠軍的人,在錦標(biāo)賽上獲得的獎(jiǎng)金累計(jì)超過700萬美元。盡管他已經(jīng)相當(dāng)專業(yè)了,但今年春天他還是從一個(gè)人工智能機(jī)器人身上學(xué)到了一些新東西。

Elias正在幫助測試由Facebook人工智能實(shí)驗(yàn)室和卡耐基梅隆大學(xué)研究人員共同開發(fā)的一款新軟件。他和另一名職業(yè)玩家Chris Ferguson各打出了5000手,對(duì)戰(zhàn)五個(gè)名為Pluribus的機(jī)器人副本。

最后,機(jī)器人以很大的優(yōu)勢領(lǐng)先。在這個(gè)過程中,Elias注意到一些事情:雖然機(jī)器通常被認(rèn)為是缺乏靈感的,但這個(gè)機(jī)器人比一般的撲克專家更有膽量。Elias說:“它會(huì)賭上兩三倍的賭注,而人類不會(huì)這么做。我對(duì)它們下的巨額賭注很感興趣,以后將在自己的撲克比賽中嘗試。”

Pluribus的勝利具有里程碑式的意義,不僅僅是因?yàn)橐粋€(gè)新機(jī)器人向?qū)I(yè)的玩家教授了新策略。這款軟件是第一款在多人游戲《德州撲克》中擊敗頂級(jí)專業(yè)人士的游戲。周四發(fā)表在《科學(xué)》雜志上的一篇論文描述了Pluribus是如何戰(zhàn)勝Elias和Ferguson的;在一個(gè)機(jī)器人副本與5名人類專業(yè)人士進(jìn)行的10000手撲克游戲中,Pluribus也輕松獲勝。

“如果你讓這個(gè)機(jī)器人與5名精英專業(yè)人士在一起比賽,機(jī)器人可以打敗他們,而且能從他們身上賺錢。”Facebook人工智能實(shí)驗(yàn)室研究員、Pluribus聯(lián)合創(chuàng)始人Noam Brown表示,“就撲克而言,這真的是黃金標(biāo)準(zhǔn)。”

布朗大學(xué)教授Michael Littman曾從事電腦撲克研究,雖然沒有參與該項(xiàng)目,但他對(duì)此表示贊同。撲克一直被視為人工智能研究人員的一大挑戰(zhàn),其特點(diǎn)與許多現(xiàn)實(shí)世界的情況相似。與國際象棋不同的是,撲克玩家必須在不知道對(duì)手持有什么牌的情況下選擇行動(dòng),這在政治、商業(yè)和戰(zhàn)爭中都是如此。之前大多數(shù)工作都是關(guān)于雙人游戲的,現(xiàn)在在多玩家游戲中取得了進(jìn)展。Littman說,現(xiàn)在撲克人工智能的最后一個(gè)重要里程碑已經(jīng)建立。他說:“這是許多研究人員數(shù)十年努力的結(jié)果?!?/p>

Brown與卡內(nèi)基梅隆大學(xué)教授Tuomas Sandholm共同創(chuàng)建了Pluribus。Brown之前是桑德霍爾姆實(shí)驗(yàn)室的一名研究生,兩人于2017年建造了一個(gè)名為Libratus的機(jī)器人,成為第一個(gè)在雙人模式下?lián)魯I(yè)人士的軟件。

Brown在加入Facebook后啟動(dòng)了Pluribus項(xiàng)目,但他說這家社交媒體巨頭并沒有考慮這項(xiàng)技術(shù)的具體應(yīng)用。他說:“項(xiàng)目的目標(biāo)是對(duì)不完全信息和大規(guī)模多代理系統(tǒng)進(jìn)行基礎(chǔ)研究,”,這句話也恰當(dāng)?shù)孛枋隽薋acebook的主要服務(wù)。長期來看,在Pluribus上測試的想法可以幫助自動(dòng)駕駛汽車預(yù)測其他司機(jī)的行為,或者改進(jìn)欺詐檢測算法。

Sandholm說,他已經(jīng)證明了這款軟件的商業(yè)價(jià)值,以及國家安全價(jià)值。他創(chuàng)辦了兩家公司,將他實(shí)驗(yàn)室的人工智能戰(zhàn)略技術(shù)商業(yè)化。

其中一家名為Strategic Machine的公司致力于改進(jìn)電子游戲中的機(jī)器人,并幫助公司設(shè)定最優(yōu)價(jià)格,以考慮競爭對(duì)手的反應(yīng)。另一個(gè)是Strategy Robot。2018年他與五角大樓簽署了一份為期兩年的合同,價(jià)值高達(dá)1000萬美元;Sandholm和五角大樓都拒絕對(duì)這份合同透露更多細(xì)節(jié)。但Sandholm表示,Strategy Robot的賣點(diǎn)之一是利用撲克和他的其他人工智能項(xiàng)目中已得到驗(yàn)證的理念,使模擬的、甚至是真實(shí)戰(zhàn)場的戰(zhàn)略對(duì)敵人的行動(dòng)更加有效。盡管Pluribus的一些核心技術(shù)早于該項(xiàng)目,但與Facebook合作的項(xiàng)目中沒有任何一項(xiàng)將授權(quán)給Sandholm的公司。

Pluribus與Libratus的相似之處在于,它通過與自己的版本進(jìn)行數(shù)萬億手的對(duì)弈來積累技能。在每一次嘗試之后,系統(tǒng)都會(huì)回顧發(fā)生了什么,以及哪些可能會(huì)有更好的表現(xiàn)。所有改進(jìn)都會(huì)添加到它的核心策略中。

在很大程度上,這款新機(jī)器人能夠玩比它之前的版本復(fù)雜得多的游戲,因?yàn)樗瞄L微調(diào)核心策略,通過預(yù)測游戲中某個(gè)特定點(diǎn)的可能結(jié)果,即搜索功能。Brown和Sandholm早期的機(jī)器人試圖繪制出游戲最后可能出現(xiàn)的所有問題。但六人游戲的可能性幾乎無窮無盡,要探索需要太多的計(jì)算能力。

相反,Brown和Sandholm開發(fā)了一個(gè)搜索功能,它一次只向前移動(dòng)幾步。為了避免令人不快的意外,還將考慮如果對(duì)手改變策略,不同行動(dòng)的價(jià)值將如何變化。因?yàn)樵谙駬淇诉@樣的游戲中,有些信息是隱藏的,所以這種搜索功能以前還沒有很好地應(yīng)用。

Brown表示,這種新方法的優(yōu)勢還在于對(duì)計(jì)算能力的要求不高,使得運(yùn)行Pluribus的成本相對(duì)較低。這款機(jī)器人需要在一個(gè)64位處理器內(nèi)核的強(qiáng)大服務(wù)器上與自己進(jìn)行8天的對(duì)戰(zhàn),才能掌握這款游戲,而為DOTA 2等復(fù)雜電子游戲開發(fā)的人工智能機(jī)器人則需要在數(shù)十萬個(gè)處理器上進(jìn)行數(shù)周的培訓(xùn)。“花150美元在云計(jì)算服務(wù)上就可以開發(fā)類似的東西,因此將其應(yīng)用到其他領(lǐng)域是切實(shí)可行的,”Brown說。

這對(duì)搭檔在編寫代碼時(shí)沒有考慮的一點(diǎn)是要在撲克中贏錢?!拔覀儾粫?huì)發(fā)布代碼,部分原因是這將對(duì)在線撲克社區(qū)產(chǎn)生重大影響,”Brown說?!拔覀冋噲D讓人工智能社區(qū)的人們能夠接觸到這一點(diǎn),而不是那些想制作撲克人工智能的人。”

盡管如此,他承認(rèn)這些技術(shù)無論如何都有可能傳播開來。一年后,還會(huì)有人開發(fā)出類似于Pluribus的機(jī)器人嗎?“我認(rèn)為這完全有可能,”Brown說。

Elias對(duì)此有所期待。他說,自從Libratus出現(xiàn)以來,由于機(jī)器人變得更加復(fù)雜,人們不再那么熱衷于玩高風(fēng)險(xiǎn)的在線游戲。他還表示:“如果你在玩一個(gè)高風(fēng)險(xiǎn)的在線游戲,你很可能是在和一個(gè)機(jī)器人或由機(jī)器人幫助的人類對(duì)戰(zhàn)。”

Elias說,撲克專業(yè)人士和愛好者不應(yīng)該被最新的人工智能技術(shù)所嚇倒,它可以提高游戲的水平。他很樂意幫助測試Pluribus,因?yàn)樗蕾p人工智能的科學(xué),以及像押注更大價(jià)值這樣的新見解的潛力。

盡管如此,他還是承認(rèn)自己有點(diǎn)難過。終極撲克機(jī)器人Pluribus的問世,標(biāo)志著撲克游戲的一個(gè)歷史性轉(zhuǎn)折點(diǎn)。他說:“從16歲開始,我就開始打撲克,并把我的一生都奉獻(xiàn)給了它,現(xiàn)在被機(jī)器打敗是一件很丟臉的事。自人工智能第一次獲勝之后,人類就很難再贏過它了?!?/p>

AD:還在為資金緊張煩惱嗎?獵云銀企貸,全面覆蓋京津冀地區(qū)主流銀行及信托、擔(dān)保公司,幫您細(xì)致梳理企業(yè)融資問題,統(tǒng)籌規(guī)劃融資思路,合理撬動(dòng)更大杠桿。填寫只需兩分鐘,剩下交給我們! (來源:獵云網(wǎng))

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-07-12
AI又贏了!Facebook人工智能擊敗全球頂尖德?lián)溥x手
“自人工智能第一次獲勝之后,人類就很難再贏過它了。

長按掃碼 閱讀全文