卡內(nèi)基梅隆大學計算機科學學院院長安德魯·摩爾接受采訪
冷撲大師沒有使用深度學習,這多少有點風水輪流轉(zhuǎn)的意思。
4月6日,在美國擊敗人類頂尖德州撲克選手的人工智能Liberatus接受創(chuàng)新工場邀請,化名“冷撲大師”,將在海南挑戰(zhàn)中國職業(yè)德州撲克選手組成的“龍之隊”。賽前在接受新浪科技專訪時,開發(fā)冷撲大師的卡內(nèi)基梅隆大學計算機科學學院院長安德魯·摩爾(Andrew Moore)揭示了在另一場人機大戰(zhàn)中,戰(zhàn)勝人類背后的基本原理:更加古老的線性規(guī)劃(Liner Programming)。
在解決面對不完整信息,獲得最佳策略的問題方面,線性規(guī)劃早就已經(jīng)成為重要方法。在微觀經(jīng)濟學和商業(yè)管理領域當中,這種算法已經(jīng)被大量應用在降低生產(chǎn)流程成本。而在人工智能領域,它和深度學習火熱之前的主流:貝葉斯網(wǎng)絡技術息息相關,而后者也目前互聯(lián)網(wǎng)的通用基礎技術之一。
2017年1月11日,職業(yè)撲克選手賈森·萊斯(Jason Les)在與Libratus較量德州撲克。1月30日,卡內(nèi)基梅隆大學開發(fā)的人工智能結束了與4名頂尖德州撲克選手之間的比賽,取得勝利。
在采訪開始前,摩爾表示,德州撲克游戲中包含了大量的隱藏信息,在本質(zhì)上就是一種談判。而通過人工智能談判其實是卡內(nèi)基梅隆大學研究團隊的初衷。他表示,贏得撲克游戲勝利能讓人感覺人工智能非常厲害,但他也很期待人工智能能夠在協(xié)商談判并解決問題方面涌現(xiàn)出更多應用。
以下為部分采訪實錄,新浪科技整理:
新浪科技:冷撲大師好像和AlphaGo不一樣,沒有從人類玩牌的結果中學習。德州撲克人工智能和圍棋人工智能有哪些不同?
安德魯·摩爾(以下簡稱AM):撲克是一個規(guī)則非常簡單的游戲,但是有很多隱藏信息,而圍棋沒有隱藏信息,所以做圍棋方面的人工智能,需要進行非常深度的棋譜搜索。而做撲克游戲的人工智能要面對的問題是有非常多的詐唬策略要一一考慮。
新浪科技:冷撲大師有沒有使用到神經(jīng)網(wǎng)絡和深度學習技術?
AM:冷撲大師沒有使用神經(jīng)網(wǎng)絡和深度學習方面的技術,而是使用了最為傳統(tǒng)的線性規(guī)劃(Liner Programming)。
我可以講得稍微細一點。計算機需要算出最合適數(shù)量的詐,因為無論詐數(shù)量過多或者過少,都可能被其他牌手利用。數(shù)學家約翰·納什曾經(jīng)計算出的一個等式來解決類似的問題,但是要想真的計算出最合適數(shù)量的詐,這個等式可能會有無數(shù)的變量,而我們在冷撲大師身上應用的計算機技術可以得出最接近正確答案的解決方式。
新浪科技:李開復之前寫過自己玩德州撲克的感受,他說想要玩好,就要把人性擺在一邊。冷撲大師在比賽時是靠算牌,還是用統(tǒng)計方式研究對手打心理戰(zhàn)?
AM:算牌是贏牌的正確方式。不過這樣做的計算量很大,冷撲大師需要完成1000萬小時的計算才能形成它的策略。
但用統(tǒng)計數(shù)據(jù)來研究對手玩法不是一個好辦法,因為一旦我知道你在統(tǒng)計我的玩法,我就會故意使用變換押注方法,實際上可以繞開你。
所以就像我剛才說的,冷撲大師沒有使用心理戰(zhàn)贏牌的企圖,只是使用數(shù)學方法而已。
實際上過去十年是大數(shù)據(jù)和機器學習發(fā)展的十年。但冷撲大師所用的線性規(guī)劃與這兩者有很大不同,它是實現(xiàn)最優(yōu)解(Big Optimization)的技術,相信未來的技術前沿也是實現(xiàn)最優(yōu)解的技術。
4月6日,6位華人牌手組成的中國龍之隊將在海南挑戰(zhàn)Libratus。但隊長杜悅(左四)表示,龍之隊的勝算可能只有10%。
新浪科技:和龍之隊比賽的賽制,與常見的多人德州撲克牌局不同。為什么會選擇一對一形式的比賽?是和算法限制有關嗎?
AM:德州撲克中最考驗牌手技術的反而是雙人對戰(zhàn),如果有更多牌手的話,其他牌手間的技術差別反而會被利用。
新浪科技:除了德州撲克之外,冷撲大師所采用的技術還可以用在哪些領域?
AM:我最喜歡的商業(yè)用途當然是商業(yè)談判,可以通過人工智能來實現(xiàn)在最合適的時間,以最合適的價格找到最合適的供應商。
談判其實是非完整信息博弈理論中一個不錯的例子,因為談判的時候,我們不一定會透露真實的想法。我們的研究人員認為計算機能夠與人類或者其他計算機進行交談和談判的能力非常重要。計算機的這種能力就是我們下一個研究方向。
實際上,除了德州撲克之外,相同算法還可以幫助很多需要器官移植的人,比方說Kidney Exchange。在美國,這個算法每年能幫助數(shù)百位患者實現(xiàn)腎臟移植的匹配。
新浪科技:所以冷撲大師背后的技術實際上是通用的。
AM:冷撲大師所采用的技術確實可以應用到其他領域,來幫助人類找回丟失掉的信息。比如購買一間公寓,這就是一個談判過程。如果我聘請的人類房產(chǎn)中介直接告訴賣家我愿意出多少錢買他的房子,那我肯定馬上炒他的魷魚。因為他的工作就是在隱藏我信息的前提下,和賣家達成交易。
新浪科技:怎么看待中國的人工智能市場?對人工智能開發(fā)者有什么建議?
AM:從投資數(shù)量上能看出中國人工智能市場的發(fā)展是多么欣欣向榮。這是非常明智的投資,因為各行各業(yè)的自動化是未來經(jīng)濟增長的強勁動力。
但是,我認為一般意義上的人工智能技術工具,發(fā)展前景其實不大,而可以直接用于行業(yè)發(fā)展的人工智能才有真正的發(fā)展前景。我喜歡哪些可以將技術應用在已有行業(yè)的人工智能初創(chuàng)公司,而不是那些研發(fā)一般性技術供其它公司使用的企業(yè)。
就我個人來說,如果你的初創(chuàng)公司有可以幫助自閉癥兒童快速學習的人工智能技術,那我就會有非常強烈的興趣。而如果你的公司有可以讓機器學習更加準確的技術,那就不是很好了。
2015年,創(chuàng)新工場CEO李開復獲得卡內(nèi)基梅隆大學授予榮譽博士畢業(yè)前,與安德魯·摩爾(右一)的合影。
新浪科技: 2015年卡內(nèi)基梅隆大學有將近50名科學家陸續(xù)被Uber挖走。而人工智能領域的頂尖專家加入企業(yè)也是目前的趨勢。您對當前人工智能教育環(huán)境是否有擔憂?
AM:從2015年1月起,我們新錄用了26名教職員工,而只有4個人離開。目前匹茲堡(卡內(nèi)基梅隆大學所在地)也已經(jīng)成為了全世界的自動駕駛技術中心??蒲袑<壹尤肫髽I(yè)看似是個問題,但這反而對大學和匹茲堡都有利。
實際上,我在擔任卡內(nèi)基梅隆大學計算機科學學院院長之前,在谷歌從事機器學習系統(tǒng)方面的工作。雖然我喜歡谷歌的哦概念股走,但我還是決定重新回到卡內(nèi)基梅隆大學,因為當今世界上最頂尖大學所從事的研究共奏是極其重要的,也將決定21世紀的發(fā)展情況。而我所需要解決的一個問題就是,在一個人工智能已經(jīng)實現(xiàn)商業(yè)化的世界里,大學可以扮演什么角色。
比如卡內(nèi)基梅隆在10-15年前就已經(jīng)開發(fā)出了自動駕駛技術,那么下一步應該做什么?我們不想一直關注業(yè)界已經(jīng)在做的事情,而是可以有哪些前瞻性的研究。
對于想離開大學的教職工,我不是勸留,而是鼓勵他們這樣做。其實開發(fā)冷撲大師的Toumas Sandholm就已經(jīng)建立了一家公司,叫Strategic Machine Inc.。這家公司就是從卡內(nèi)基梅隆大學拆分出來的。大學會將人工智能應用在撲克上的技術授權給公司,公司再專注與不完整信息博弈的研發(fā)和商業(yè)應用。
對于新錄用的人,我其實會建議他們在這里做4-5年的研究,加入業(yè)界工作上3年,然后再回來做5年研究,這才是應該有的職業(yè)生涯,二者都不耽誤。
- 小米王昭程揭秘:米家健康秤如何助力運動健康App,實現(xiàn)全方位數(shù)據(jù)互聯(lián)
- 小米盧偉冰實測米家空調(diào)極限性能:挑戰(zhàn)-35℃低溫,新中央空調(diào)將挑戰(zhàn)頭部品牌!
- 小米米家洗衣機首次全鏈路 OTA 升級,雙區(qū)洗雙洗烘新體驗引爆市場
- 國產(chǎn)NAS新寵飛牛私有云:AI智能相冊功能驚艷,人臉識別、事物場景分類助力高效管理
- 索菲亞智能整家全新升級,米家App賦能,智能生活再升級
- 中央政策助力新能源汽車等綠色智能產(chǎn)品下鄉(xiāng),推動農(nóng)村消費升級
- Meta Orion 豪門夢碎:最強版本2027亮相,眼鏡內(nèi)置攝像頭,AR眼鏡新時代何時開啟?
- 蘋果在中國市場遭遇重大挫折:2024年第四季度銷量大跌18%,被華為和小米超越
- 跨生態(tài)互聯(lián)新篇章:綠米Aqara Matter高階橋接功能引領智能家居新潮流
- 極空間NAS新功能曝光:文檔同步2.0、多端播放器,辦公利器升級版等你來體驗
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。