會(huì)搭積木的AI,正在手眼并用地探索現(xiàn)實(shí)世界

原標(biāo)題:會(huì)搭積木的AI,正在手眼并用地探索現(xiàn)實(shí)世界

春節(jié)假休完,北上廣又開(kāi)始上演小城媽寶慘變五環(huán)內(nèi)社畜的慘劇?;謴?fù)到自己洗衣做飯收拾屋子的日子,年輕人們又深刻地感受到——科技不能改變生活,老媽才能。

人工智能雖然在各種游戲比賽中血虐人類,但在現(xiàn)實(shí)世界里卻不能幫助人類“血虐”家務(wù)活。在研究更適用于復(fù)雜現(xiàn)實(shí)場(chǎng)景的機(jī)器人這件事上,我們一直在努力。

一般來(lái)說(shuō)通過(guò)計(jì)算機(jī)視覺(jué)對(duì)外界進(jìn)行感知,再結(jié)合數(shù)據(jù)模擬計(jì)算規(guī)劃行動(dòng),是機(jī)器人訓(xùn)練研究的一個(gè)常見(jiàn)的方向。

比較典型的有伯克利一直在嘗試的少樣本強(qiáng)化學(xué)習(xí),類似于拿一段疊被子的視頻作為訓(xùn)練數(shù)據(jù),利用獎(jiǎng)勵(lì)機(jī)制引導(dǎo)AI進(jìn)行學(xué)習(xí),直到AI也學(xué)會(huì)疊被子為止。甚至還會(huì)引入“疊錯(cuò)被子”的視頻作為訓(xùn)練數(shù)據(jù),教導(dǎo)AI如何在任務(wù)執(zhí)行錯(cuò)誤的過(guò)程中進(jìn)行自我修正。

因?yàn)樵诂F(xiàn)實(shí)世界,尤其是家庭、門(mén)店、餐廳這種極具生活化的場(chǎng)景中,存在有太多不確定性,很難像自動(dòng)化技術(shù)那樣,規(guī)定好一套固定的流程。近年來(lái)研究較為深入的計(jì)算機(jī)視覺(jué),也包括雷達(dá)傳感、紅外傳感這樣的傳感技術(shù)便被利用起來(lái)了。

除去實(shí)驗(yàn)室的研究以外,我們?cè)谌粘I钪幸材芸吹胶芏嘁蕾囈曈X(jué)能力來(lái)判定現(xiàn)實(shí)問(wèn)題的機(jī)器人,例如工廠里通過(guò)視覺(jué)識(shí)別瑕疵品并進(jìn)行分揀的機(jī)械手臂。但僅僅依賴視覺(jué),或者激光雷達(dá)、紅外傳感等空間感知能力,也并不能幫助機(jī)器人們做好面對(duì)現(xiàn)實(shí)世界的準(zhǔn)備。

就像在電影里常常出現(xiàn)這樣的情節(jié):機(jī)器人已經(jīng)發(fā)展到高度智能化,甚至和人類無(wú)異,但在做一些類似于拿起一包牛奶,或者跟人類握手的動(dòng)作時(shí),往往會(huì)掌握不好力道。

這種情節(jié)并不是完全虛構(gòu)的,對(duì)于應(yīng)用視覺(jué)傳感技術(shù)的機(jī)器人來(lái)說(shuō),它們能夠辨識(shí)外界事物的形狀,卻很難判斷外界事物的質(zhì)地、密度和受力情況。所以在很多情況中,光有視覺(jué)技術(shù)是遠(yuǎn)不足夠的。

守序善良且秀:一位非人類的職業(yè)積木玩家

比如很多人都玩過(guò),或者在美劇里見(jiàn)過(guò)的桌游“疊疊樂(lè)”——用積木條堆疊成積木塔,參與玩家在不導(dǎo)致塔倒塌的前提下從塔身中抽出積木條,將積木條搭到塔頂端,塔在哪位玩家的回合中倒塌,哪位玩家就輸?shù)舯荣悺?/p>

“疊疊樂(lè)”就是典型的AI一定打不過(guò)人的游戲。因?yàn)檫@種游戲考驗(yàn)的不僅是策略性,還有動(dòng)手能力,取出和放置積木時(shí)動(dòng)作輕了重了,都可能導(dǎo)致游戲失敗。不光如此,疊疊樂(lè)的游戲過(guò)程還具有很大的不確定性,堆起積木塔時(shí)每條積木位置的輕微變化,對(duì)手玩家在拿走積木條時(shí)對(duì)其他積木位置帶來(lái)的改變,都在影響著整個(gè)積木塔的穩(wěn)定性,也直接決定了玩家的下一步動(dòng)作。

這種過(guò)程如果是用視覺(jué)技術(shù)理解,則需要難以想象的海量計(jì)算——堆起積木塔時(shí)每一條積木的位置、兩位玩家的每一步動(dòng)作,都會(huì)造成無(wú)數(shù)的分叉結(jié)果,幾乎是不可能完成的任務(wù)。

但只需要一點(diǎn)點(diǎn)小小的不同,這個(gè)難題就被解決了。

在最近的Science Robotics期刊中,來(lái)自MIT的科研人員公布了他們最新的研究成果——用機(jī)器手臂玩疊疊樂(lè)。

項(xiàng)目負(fù)責(zé)人Rodriguez提到,之所以選擇疊疊樂(lè)作為實(shí)驗(yàn)對(duì)象,是因?yàn)檫@個(gè)游戲中體現(xiàn)了機(jī)器人應(yīng)用的一個(gè)重要問(wèn)題——物理交互,也就是前面提到的動(dòng)手能力。

為了解決物理交互問(wèn)題,MIT為普通機(jī)械手臂添加了三樣?xùn)|西,柔性?shī)A鉗、有力量傳感作用的腕帶和拍攝全局畫(huà)面的攝像頭。

在進(jìn)行訓(xùn)練時(shí),機(jī)械手臂每抽取一塊積木時(shí),力量傳感器就會(huì)記錄下動(dòng)作的速度和力度,不斷和上一次的數(shù)據(jù)進(jìn)行對(duì)比,攝像頭也會(huì)從視覺(jué)角度進(jìn)行記錄,與力量數(shù)據(jù)進(jìn)行對(duì)應(yīng)在分層貝葉斯模型中進(jìn)行計(jì)算。在進(jìn)行過(guò)大概三百次游戲后,通過(guò)兩種數(shù)據(jù)維度的配合學(xué)習(xí),AI可以快速建立出一個(gè)聚類模型,從一個(gè)積木塔中尋找穩(wěn)定性更強(qiáng)的、不會(huì)破壞平衡的積木條。相比試圖找到一個(gè)能應(yīng)付所有情況的模型,這種在每次移動(dòng)積木時(shí)都重新聚類的方法顯然要高效很多。

在測(cè)試時(shí),機(jī)械手臂的表現(xiàn)也很優(yōu)異,參與測(cè)試的人類志愿者紛紛表示被秀一臉,機(jī)械手臂自己玩疊疊樂(lè)時(shí)的水平已經(jīng)接近人類了。不過(guò)在與人類對(duì)戰(zhàn)時(shí)還是要落后一籌,因?yàn)槿祟愅婕以诔槿》e木時(shí)會(huì)特意難為對(duì)手,在自己的回合破壞平衡性,讓積木塔很容易在下一回合倒塌。但AI還做不到這一點(diǎn),在這一模型中,AI的每一步操作都是為了增強(qiáng)整個(gè)積木塔的穩(wěn)定性——一位典型的秩序善良玩家。

這也導(dǎo)致了在疊疊樂(lè)上,AI還很難實(shí)現(xiàn)和人類對(duì)戰(zhàn)。不過(guò)項(xiàng)目負(fù)責(zé)人Rodriguez認(rèn)為,他們創(chuàng)造這個(gè)項(xiàng)目本來(lái)也不是為了和人類在疊疊樂(lè)游戲上一決高下的。

當(dāng)AI開(kāi)始多才多藝

BBC、CBS News和Wired等主流媒體都對(duì)這一研究結(jié)果給出了很高的評(píng)價(jià),原因就在于這一研究在AI的觸覺(jué)刺激上突破,具有很高的現(xiàn)實(shí)意義。

MIT提到,目前應(yīng)用在疊疊樂(lè)AI模型上的原理,同樣也可以被應(yīng)用在另外一些應(yīng)用機(jī)械手臂的場(chǎng)景中。

例如在一些數(shù)碼產(chǎn)品精細(xì)部分的組裝上,在擰一些很小的螺絲時(shí),很難實(shí)現(xiàn)以視覺(jué)方式進(jìn)行測(cè)量,只能通過(guò)觸覺(jué)進(jìn)行感應(yīng)。但有了“疊疊樂(lè)AI”的經(jīng)驗(yàn),普通機(jī)械手臂也能通過(guò)一些簡(jiǎn)單的改裝,增加力量傳感機(jī)制在短時(shí)間完成訓(xùn)練,學(xué)會(huì)以觸覺(jué)刺激為參考標(biāo)志的組裝、包裝等工作。

雖然現(xiàn)在自動(dòng)化工業(yè)生產(chǎn)線也能實(shí)現(xiàn)在無(wú)人狀態(tài)下進(jìn)行精細(xì)組裝工作,但其實(shí)現(xiàn)成本是非常巨大的??赡芤粭l生產(chǎn)線只能完成某一部件上的一小顆螺絲,對(duì)于中小型廠商來(lái)說(shuō)很難承擔(dān)得起。但擁有了觸覺(jué)刺激的機(jī)械手臂結(jié)合AI算法,卻可以幫助類似的功能走進(jìn)小型生產(chǎn)線甚至家庭。

其實(shí)這種結(jié)合兩種緯度數(shù)據(jù)進(jìn)行AI訓(xùn)練的方式并非MIT獨(dú)有,在去年我們?cè)谝恍╊愃朴谝曨l分析的領(lǐng)域中,也能看到諸如畫(huà)面分析+語(yǔ)音分析的多模態(tài)理解。

聚焦到機(jī)器人領(lǐng)域中,這幾年也有很多類似的研究。例如模擬人類手指力量感知能力的機(jī)械鋼琴手,通過(guò)操作時(shí)獲取鋼琴按鍵反彈時(shí)的數(shù)據(jù)反饋,來(lái)更精準(zhǔn)地模擬出人類彈鋼琴時(shí)的輕與重。還有低成本的生物感應(yīng)電子皮膚,可以貼合在機(jī)械設(shè)備上幫助尋找施力方向。

隨著觸覺(jué)機(jī)制越來(lái)越多地被引入機(jī)器人領(lǐng)域,與視覺(jué)系統(tǒng)、紅外/激光雷達(dá)等其他傳感模式的結(jié)合也越來(lái)越多。

可見(jiàn)在探索現(xiàn)實(shí)世界的旅途中,AI正在愈發(fā)多才多藝起來(lái)。相信當(dāng)機(jī)器人也開(kāi)始手眼并用時(shí),我們距離“科技改變生活”的未來(lái)也越來(lái)越近了。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-02-15
會(huì)搭積木的AI,正在手眼并用地探索現(xiàn)實(shí)世界
就像在電影里常常出現(xiàn)這樣的情節(jié):機(jī)器人已經(jīng)發(fā)展到高度智能化,甚至和人類無(wú)異,但在做一些類似于拿起一包牛奶,或者跟人類握手的動(dòng)作時(shí),往往會(huì)掌握不好力道。

長(zhǎng)按掃碼 閱讀全文