始于游戲,造福世界:微軟打造史上最強(qiáng)麻將AI

提起棋牌類AI,可能許多人第一時(shí)間都會(huì)在腦海里想起近年來(lái)聲名顯赫的AlphaGo。

作為第一個(gè)戰(zhàn)勝人類職業(yè)圍棋選手的AI,AlphaGo的表現(xiàn)確實(shí)給我們留下了深刻印象。但是與象棋、圍棋這類完美信息游戲相比,我們所生活的現(xiàn)實(shí)世界往往是由非常復(fù)雜的隨機(jī)事件構(gòu)成,無(wú)法提前知曉和不確定的信息要遠(yuǎn)遠(yuǎn)超過(guò)我們已知和可以確定的信息。

那么在信息如此復(fù)雜和不完全的條件下,我們是否仍然可以依靠AI來(lái)做出相對(duì)正確的決策?從而更好地解決更多高度復(fù)雜的現(xiàn)實(shí)問(wèn)題?

回答是肯定的。

來(lái)自微軟亞洲研究院的AI技術(shù),正在讓許多不可思議的事情變成現(xiàn)實(shí)。

史上最強(qiáng)麻將AI的誕生

在2019世界人工智能大會(huì)上,微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋博士正式宣布微軟創(chuàng)造出了史上最強(qiáng)的麻將AI——Suphx。

雖然只是初試啼聲,但是微軟Suphx的表現(xiàn)已經(jīng)足夠讓人驚艷:在全球頂級(jí)的專業(yè)麻將平臺(tái)“天鳳”的公開房間競(jìng)賽中,微軟Suphx通過(guò)與人類玩家的五千多場(chǎng)對(duì)戰(zhàn)成功晉級(jí)十段,這也是目前AI系統(tǒng)在麻將領(lǐng)域取得的最好成績(jī)。這意味著作為“史上最強(qiáng)麻將AI”,微軟Suphx的實(shí)力已經(jīng)超過(guò)了公開房間級(jí)別中頂級(jí)人類選手的平均水平。業(yè)界人士更是針對(duì)其表現(xiàn)給出了“風(fēng)格自成一派,穩(wěn)定段位顯著超越頂尖人類選手”的評(píng)價(jià)。

從國(guó)際跳棋,到國(guó)際象棋,到德州撲克,再到圍棋,最后再到麻將,其信息集的復(fù)雜度可以說(shuō)是經(jīng)歷了量變到質(zhì)變的過(guò)程。其中麻將隱藏的信息集平均大小更是高達(dá)10的48次方,遠(yuǎn)遠(yuǎn)超出其他棋牌類游戲。

“很多人都在問(wèn):為什么要做麻將AI這樣的技術(shù)?實(shí)際上這里面有很多真正的AI技術(shù),譬如說(shuō)如何有效處理不確定性?如何幫助人類去學(xué)習(xí)和提升技巧?這些技術(shù)不光可以用來(lái)做游戲AI,而且還可以引申到其他應(yīng)用場(chǎng)景?!鄙蛳蜓蟛┦勘硎?,“與象棋、圍棋、德州撲克等棋牌類游戲相比,麻將具有更高的復(fù)雜度和更豐富的隱藏信息,因此麻將AI的難度也更高。Suphx可以有效處理麻將中的高度不確定性,在對(duì)戰(zhàn)中表現(xiàn)出了類似人類的直覺(jué)、預(yù)測(cè)、推理、模糊決策能力以及大局意識(shí)?!?/p>

由此我們可以看到,與象棋、圍棋等完美信息游戲相比,屬于不完美信息游戲的麻將包含了復(fù)雜的推理策略和帶有隨機(jī)性的博弈過(guò)程,但也正因?yàn)槿绱?,麻將也要比象棋和圍棋更加貼近人類復(fù)雜的真實(shí)生活。而作為“史上最強(qiáng)麻將AI”,微軟Suphx的誕生和技術(shù)突破,也將有助于幫助人類應(yīng)對(duì)現(xiàn)實(shí)世界中更多高度復(fù)雜的問(wèn)題。

探索麻將AI的新邊界,推動(dòng)AI技術(shù)的新發(fā)展

“麻將跟其他棋牌不一樣,除了選手本身的技術(shù)之外,還要取決于隨機(jī)抓到的牌。當(dāng)對(duì)手的手牌不同,底牌不同,出牌順序不一樣,甚至一次碰、吃、杠,都可能改變之前的策略。跟可以精準(zhǔn)復(fù)刻的圍棋相比,每一局麻將都是一次全新的游戲。因此可能要經(jīng)過(guò)上千盤的對(duì)弈,才能顯示出選手的技術(shù)和實(shí)力?!蔽④泚喼扪芯吭焊痹洪L(zhǎng)、機(jī)器學(xué)習(xí)領(lǐng)域負(fù)責(zé)人劉鐵巖博士向趣味科技介紹到。

劉鐵巖博士透露,在做相關(guān)AI研究的過(guò)程中,微軟亞洲研究院也遇到了許多瓶頸和難以解決的問(wèn)題,因此這是一個(gè)不斷試錯(cuò)、發(fā)現(xiàn)挑戰(zhàn)、想辦法解決、再進(jìn)行迭代的過(guò)程?!拔④泚喼扪芯吭赫峭ㄟ^(guò)這樣一種方式,不斷探索麻將AI的新邊界?!?/p>

Suphx 以“大三元”役滿胡牌

劉鐵巖博士表示,從推動(dòng)AI技術(shù)的新發(fā)展來(lái)看,微軟Suphx的誕生也有著重大意義:

1、Suphx基于多項(xiàng)微軟亞洲研究院發(fā)明的創(chuàng)新人工智能技術(shù):先知教練、全盤預(yù)測(cè)、自適應(yīng)決策等。

2、Suphx可以有效處理麻將的高度不確定性,在游戲中表現(xiàn)出類人的直覺(jué)、預(yù)測(cè)、推理、模糊決策能力,和大局觀意識(shí)。

3、Suphx的成果對(duì)于探索機(jī)器學(xué)習(xí)的技術(shù)邊界、推動(dòng)麻將社區(qū)發(fā)展,以及解決真實(shí)場(chǎng)景中的復(fù)雜問(wèn)題都具有重要意義。譬如在智能交通、金融投資等存在大量未知信息,容易受到隨機(jī)突發(fā)狀況影響,并存在多人博弈的領(lǐng)域,Suphx的技術(shù)都將大有可為。

“我們期待通過(guò)游戲AI的研究,推動(dòng)AI技術(shù)的創(chuàng)新發(fā)展,讓人工智能真正走進(jìn)人類的生活,幫助我們解決更加錯(cuò)綜復(fù)雜的現(xiàn)實(shí)挑戰(zhàn)?!眲㈣F巖博士說(shuō)道。

始于游戲,但并不終于游戲

“和其他棋牌類游戲相比,麻將可以說(shuō)是趣味性最高、可以讓人一直玩下去的游戲。為什么這么說(shuō)?”微軟全球資深副總裁、微軟亞太研發(fā)集團(tuán)主席兼微軟亞洲研究院院長(zhǎng)洪小文向趣味科技表示,“因?yàn)樵诼閷⒆郎蠜](méi)有永遠(yuǎn)的勝利者,即使你技術(shù)差,但是憑借手氣好也有贏的可能。要換成跳棋、象棋、圍棋等游戲,如果你水平不夠的話,基本上永遠(yuǎn)都不可能下贏機(jī)器。所以麻將的復(fù)雜度、不完美信息、隱藏性和隨機(jī)性,就是它最好玩的地方,也是其最大的魅力所在?!?/p>

洪小文舉例說(shuō),和麻將類似的是,在我們的日常生活中,也存在很多不確定和非完美信息的場(chǎng)景。譬如收購(gòu)公司,與對(duì)手競(jìng)爭(zhēng),都可能要面對(duì)大量的不完整信息和博弈?!八晕覀冋娴目梢阅肧uphx這個(gè)游戲AI,來(lái)解決日常生活中最重要、最困難,具有隱藏信息的各種問(wèn)題?!?/p>

洪小文透露,通過(guò)AI,微軟正在幫助各個(gè)產(chǎn)業(yè)做智能化轉(zhuǎn)型。包括醫(yī)療、物流、零售、制造、金融、教育……而這些只是首批獲利的行業(yè)?!笆聦?shí)上,我覺(jué)得各行各業(yè)只要能收集足夠的大量數(shù)據(jù),都可以找到最適合AI發(fā)揮作用的場(chǎng)景,這也是人工智能技術(shù)最可愛的地方?!?/p>

微軟全球資深副總裁、微軟亞太研發(fā)集團(tuán)主席兼微軟亞洲研究院院長(zhǎng)洪小文

談到微軟針對(duì)人工智能領(lǐng)域的戰(zhàn)略布局時(shí),洪小文透露,微軟主要有以下三個(gè)方向:

第一,把AI的門檻降低,讓其更加普及,這樣才能讓各行各業(yè)都能夠從AI中受惠。

第二,做AI一定要有平臺(tái)。微軟經(jīng)常提到ABC的概念,也就是AI+BigData+Cloud,AI、大數(shù)據(jù)、計(jì)算力三者缺一不可。讓微軟引以為豪的正是其擁有全世界領(lǐng)先的ABC平臺(tái),每一家公司都需要這樣的平臺(tái)。

第三,最可信賴的合作伙伴。為什么微軟最近能夠重回市值第一?因?yàn)橄鄬?duì)于其他一些什么都做的企業(yè)來(lái)說(shuō),作為平臺(tái)公司的微軟從來(lái)不與合作伙伴競(jìng)爭(zhēng),從來(lái)不涉及客戶的業(yè)務(wù),所以能夠成為廣大企業(yè)信賴的合作伙伴。

“普及化、ABC平臺(tái)、最可信賴的合作伙伴,這就是微軟在AI時(shí)代的核心戰(zhàn)略?!焙樾∥谋硎?。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-09-12
始于游戲,造福世界:微軟打造史上最強(qiáng)麻將AI
提起棋牌類AI,可能許多人第一時(shí)間都會(huì)在腦海里想起近年來(lái)聲名顯赫的AlphaGo。作為第一個(gè)戰(zhàn)勝人類職業(yè)圍棋選手的AI,AlphaGo的表現(xiàn)確實(shí)給我們留下了深刻印象。

長(zhǎng)按掃碼 閱讀全文