不靠深度學(xué)習(xí)靠“談判”?德?lián)銩I專家揭秘

卡耐基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長(zhǎng)安德魯·摩爾接受采訪卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長(zhǎng)安德魯·摩爾接受采訪

冷撲大師沒(méi)有使用深度學(xué)習(xí),這多少有點(diǎn)風(fēng)水輪流轉(zhuǎn)的意思。

4月6日,在美國(guó)擊敗人類頂尖德州撲克選手的人工智能Liberatus接受創(chuàng)新工場(chǎng)邀請(qǐng),化名“冷撲大師”,將在海南挑戰(zhàn)中國(guó)職業(yè)德州撲克選手組成的“龍之隊(duì)”。賽前在接受新浪科技專訪時(shí),開(kāi)發(fā)冷撲大師的卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長(zhǎng)安德魯·摩爾(Andrew Moore)揭示了在另一場(chǎng)人機(jī)大戰(zhàn)中,戰(zhàn)勝人類背后的基本原理:更加古老的線性規(guī)劃(Liner Programming)。

在解決面對(duì)不完整信息,獲得最佳策略的問(wèn)題方面,線性規(guī)劃早就已經(jīng)成為重要方法。在微觀經(jīng)濟(jì)學(xué)和商業(yè)管理領(lǐng)域當(dāng)中,這種算法已經(jīng)被大量應(yīng)用在降低生產(chǎn)流程成本。而在人工智能領(lǐng)域,它和深度學(xué)習(xí)火熱之前的主流:貝葉斯網(wǎng)絡(luò)技術(shù)息息相關(guān),而后者也目前互聯(lián)網(wǎng)的通用基礎(chǔ)技術(shù)之一。

2017年1月11日,職業(yè)撲克選手賈森·萊斯(Jason Les)在與Libratus較量德州撲克。1月30日,卡耐基梅隆大學(xué)開(kāi)發(fā)的人工智能結(jié)束了與4名頂尖德州撲克選手之間的比賽,取得勝利。  2017年1月11日,職業(yè)撲克選手賈森·萊斯(Jason Les)在與Libratus較量德州撲克。1月30日,卡內(nèi)基梅隆大學(xué)開(kāi)發(fā)的人工智能結(jié)束了與4名頂尖德州撲克選手之間的比賽,取得勝利。

在采訪開(kāi)始前,摩爾表示,德州撲克游戲中包含了大量的隱藏信息,在本質(zhì)上就是一種談判。而通過(guò)人工智能談判其實(shí)是卡內(nèi)基梅隆大學(xué)研究團(tuán)隊(duì)的初衷。他表示,贏得撲克游戲勝利能讓人感覺(jué)人工智能非常厲害,但他也很期待人工智能能夠在協(xié)商談判并解決問(wèn)題方面涌現(xiàn)出更多應(yīng)用。

以下為部分采訪實(shí)錄,新浪科技整理:

新浪科技:冷撲大師好像和AlphaGo不一樣,沒(méi)有從人類玩牌的結(jié)果中學(xué)習(xí)。德州撲克人工智能和圍棋人工智能有哪些不同?

安德魯·摩爾(以下簡(jiǎn)稱AM):撲克是一個(gè)規(guī)則非常簡(jiǎn)單的游戲,但是有很多隱藏信息,而圍棋沒(méi)有隱藏信息,所以做圍棋方面的人工智能,需要進(jìn)行非常深度的棋譜搜索。而做撲克游戲的人工智能要面對(duì)的問(wèn)題是有非常多的詐唬策略要一一考慮。

新浪科技:冷撲大師有沒(méi)有使用到神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)技術(shù)?

AM:冷撲大師沒(méi)有使用神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)方面的技術(shù),而是使用了最為傳統(tǒng)的線性規(guī)劃(Liner Programming)。

我可以講得稍微細(xì)一點(diǎn)。計(jì)算機(jī)需要算出最合適數(shù)量的詐,因?yàn)闊o(wú)論詐數(shù)量過(guò)多或者過(guò)少,都可能被其他牌手利用。數(shù)學(xué)家約翰·納什曾經(jīng)計(jì)算出的一個(gè)等式來(lái)解決類似的問(wèn)題,但是要想真的計(jì)算出最合適數(shù)量的詐,這個(gè)等式可能會(huì)有無(wú)數(shù)的變量,而我們?cè)诶鋼浯髱熒砩蠎?yīng)用的計(jì)算機(jī)技術(shù)可以得出最接近正確答案的解決方式。

新浪科技:李開(kāi)復(fù)之前寫過(guò)自己玩德州撲克的感受,他說(shuō)想要玩好,就要把人性擺在一邊。冷撲大師在比賽時(shí)是靠算牌,還是用統(tǒng)計(jì)方式研究對(duì)手打心理戰(zhàn)?

AM:算牌是贏牌的正確方式。不過(guò)這樣做的計(jì)算量很大,冷撲大師需要完成1000萬(wàn)小時(shí)的計(jì)算才能形成它的策略。

但用統(tǒng)計(jì)數(shù)據(jù)來(lái)研究對(duì)手玩法不是一個(gè)好辦法,因?yàn)橐坏┪抑滥阍诮y(tǒng)計(jì)我的玩法,我就會(huì)故意使用變換押注方法,實(shí)際上可以繞開(kāi)你。

所以就像我剛才說(shuō)的,冷撲大師沒(méi)有使用心理戰(zhàn)贏牌的企圖,只是使用數(shù)學(xué)方法而已。

實(shí)際上過(guò)去十年是大數(shù)據(jù)和機(jī)器學(xué)習(xí)發(fā)展的十年。但冷撲大師所用的線性規(guī)劃與這兩者有很大不同,它是實(shí)現(xiàn)最優(yōu)解(Big Optimization)的技術(shù),相信未來(lái)的技術(shù)前沿也是實(shí)現(xiàn)最優(yōu)解的技術(shù)。

4月6日,6位華人牌手組成的中國(guó)龍之隊(duì)將在海南挑戰(zhàn)Libratus。但隊(duì)長(zhǎng)杜悅(左四)表示,龍之隊(duì)的勝算可能只有10%。  4月6日,6位華人牌手組成的中國(guó)龍之隊(duì)將在海南挑戰(zhàn)Libratus。但隊(duì)長(zhǎng)杜悅(左四)表示,龍之隊(duì)的勝算可能只有10%。

新浪科技:和龍之隊(duì)比賽的賽制,與常見(jiàn)的多人德州撲克牌局不同。為什么會(huì)選擇一對(duì)一形式的比賽?是和算法限制有關(guān)嗎?

AM:德州撲克中最考驗(yàn)牌手技術(shù)的反而是雙人對(duì)戰(zhàn),如果有更多牌手的話,其他牌手間的技術(shù)差別反而會(huì)被利用。

新浪科技:除了德州撲克之外,冷撲大師所采用的技術(shù)還可以用在哪些領(lǐng)域?

AM:我最喜歡的商業(yè)用途當(dāng)然是商業(yè)談判,可以通過(guò)人工智能來(lái)實(shí)現(xiàn)在最合適的時(shí)間,以最合適的價(jià)格找到最合適的供應(yīng)商。

談判其實(shí)是非完整信息博弈理論中一個(gè)不錯(cuò)的例子,因?yàn)檎勁械臅r(shí)候,我們不一定會(huì)透露真實(shí)的想法。我們的研究人員認(rèn)為計(jì)算機(jī)能夠與人類或者其他計(jì)算機(jī)進(jìn)行交談和談判的能力非常重要。計(jì)算機(jī)的這種能力就是我們下一個(gè)研究方向。

實(shí)際上,除了德州撲克之外,相同算法還可以幫助很多需要器官移植的人,比方說(shuō)Kidney Exchange。在美國(guó),這個(gè)算法每年能幫助數(shù)百位患者實(shí)現(xiàn)腎臟移植的匹配。

新浪科技:所以冷撲大師背后的技術(shù)實(shí)際上是通用的。

AM:冷撲大師所采用的技術(shù)確實(shí)可以應(yīng)用到其他領(lǐng)域,來(lái)幫助人類找回丟失掉的信息。比如購(gòu)買一間公寓,這就是一個(gè)談判過(guò)程。如果我聘請(qǐng)的人類房產(chǎn)中介直接告訴賣家我愿意出多少錢買他的房子,那我肯定馬上炒他的魷魚(yú)。因?yàn)樗墓ぷ骶褪窃陔[藏我信息的前提下,和賣家達(dá)成交易。

新浪科技:怎么看待中國(guó)的人工智能市場(chǎng)?對(duì)人工智能開(kāi)發(fā)者有什么建議?

AM:從投資數(shù)量上能看出中國(guó)人工智能市場(chǎng)的發(fā)展是多么欣欣向榮。這是非常明智的投資,因?yàn)楦餍懈鳂I(yè)的自動(dòng)化是未來(lái)經(jīng)濟(jì)增長(zhǎng)的強(qiáng)勁動(dòng)力。

但是,我認(rèn)為一般意義上的人工智能技術(shù)工具,發(fā)展前景其實(shí)不大,而可以直接用于行業(yè)發(fā)展的人工智能才有真正的發(fā)展前景。我喜歡哪些可以將技術(shù)應(yīng)用在已有行業(yè)的人工智能初創(chuàng)公司,而不是那些研發(fā)一般性技術(shù)供其它公司使用的企業(yè)。

就我個(gè)人來(lái)說(shuō),如果你的初創(chuàng)公司有可以幫助自閉癥兒童快速學(xué)習(xí)的人工智能技術(shù),那我就會(huì)有非常強(qiáng)烈的興趣。而如果你的公司有可以讓機(jī)器學(xué)習(xí)更加準(zhǔn)確的技術(shù),那就不是很好了。

2015年,創(chuàng)新工場(chǎng)CEO李開(kāi)復(fù)獲得卡耐基梅隆大學(xué)授予榮譽(yù)博士畢業(yè)前,與安德魯·摩爾(右一)的合影。  2015年,創(chuàng)新工場(chǎng)CEO李開(kāi)復(fù)獲得卡內(nèi)基梅隆大學(xué)授予榮譽(yù)博士畢業(yè)前,與安德魯·摩爾(右一)的合影。

新浪科技: 2015年卡內(nèi)基梅隆大學(xué)有將近50名科學(xué)家陸續(xù)被Uber挖走。而人工智能領(lǐng)域的頂尖專家加入企業(yè)也是目前的趨勢(shì)。您對(duì)當(dāng)前人工智能教育環(huán)境是否有擔(dān)憂?

AM:從2015年1月起,我們新錄用了26名教職員工,而只有4個(gè)人離開(kāi)。目前匹茲堡(卡內(nèi)基梅隆大學(xué)所在地)也已經(jīng)成為了全世界的自動(dòng)駕駛技術(shù)中心。科研專家加入企業(yè)看似是個(gè)問(wèn)題,但這反而對(duì)大學(xué)和匹茲堡都有利。

實(shí)際上,我在擔(dān)任卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院院長(zhǎng)之前,在谷歌從事機(jī)器學(xué)習(xí)系統(tǒng)方面的工作。雖然我喜歡谷歌的哦概念股走,但我還是決定重新回到卡內(nèi)基梅隆大學(xué),因?yàn)楫?dāng)今世界上最頂尖大學(xué)所從事的研究共奏是極其重要的,也將決定21世紀(jì)的發(fā)展情況。而我所需要解決的一個(gè)問(wèn)題就是,在一個(gè)人工智能已經(jīng)實(shí)現(xiàn)商業(yè)化的世界里,大學(xué)可以扮演什么角色。

比如卡內(nèi)基梅隆在10-15年前就已經(jīng)開(kāi)發(fā)出了自動(dòng)駕駛技術(shù),那么下一步應(yīng)該做什么?我們不想一直關(guān)注業(yè)界已經(jīng)在做的事情,而是可以有哪些前瞻性的研究。

對(duì)于想離開(kāi)大學(xué)的教職工,我不是勸留,而是鼓勵(lì)他們這樣做。其實(shí)開(kāi)發(fā)冷撲大師的Toumas Sandholm就已經(jīng)建立了一家公司,叫Strategic Machine Inc.。這家公司就是從卡內(nèi)基梅隆大學(xué)拆分出來(lái)的。大學(xué)會(huì)將人工智能應(yīng)用在撲克上的技術(shù)授權(quán)給公司,公司再專注與不完整信息博弈的研發(fā)和商業(yè)應(yīng)用。

對(duì)于新錄用的人,我其實(shí)會(huì)建議他們?cè)谶@里做4-5年的研究,加入業(yè)界工作上3年,然后再回來(lái)做5年研究,這才是應(yīng)該有的職業(yè)生涯,二者都不耽誤。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2017-03-31
不靠深度學(xué)習(xí)靠“談判”?德?lián)銩I專家揭秘
2017年4月6日至10日,德?lián)銩I“冷撲大師”將在海南迎戰(zhàn)中國(guó)龍之隊(duì)。隊(duì)長(zhǎng)杜悅表示,龍之隊(duì)的勝算可能只有10%。

長(zhǎng)按掃碼 閱讀全文