本文來自微信公眾號【AI商業(yè)報道】
高層速讀
關(guān)鍵信息:華盛頓大學(xué)和艾倫AI研究所的研究人員試圖用狗的行為數(shù)據(jù)訓(xùn)練AI系統(tǒng),他們通過傳感器等設(shè)備采集了一只愛斯基摩犬的運動數(shù)據(jù),基于數(shù)據(jù)建立了一個犬類機器學(xué)習(xí)系統(tǒng)。
關(guān)鍵數(shù)據(jù):研究員在犬的頭部裝了1個GoPro相機,6個慣性測量單元用以判斷物體的位置,1個麥克風(fēng)以及一個把這些數(shù)據(jù)綁在一起的Arduino開發(fā)板。論文將于今年6月在CVPR上發(fā)表。
關(guān)鍵意義:利用犬類AI系統(tǒng)模仿和預(yù)測狗的行為,更好地理解視覺智能和其他智能生物。
目前人類已經(jīng)訓(xùn)練了機器學(xué)習(xí)系統(tǒng)來識別物體,道路導(dǎo)航和識別面部表情,盡管實現(xiàn)它們可能很困難,但絕對沒有達(dá)到模擬狗所需要的復(fù)雜程度。
華盛頓大學(xué)和艾倫AI研究所的研究人員試圖用狗的行為數(shù)據(jù)訓(xùn)練AI系統(tǒng),他們通過傳感器等設(shè)備采集了一只愛斯基摩犬的運動數(shù)據(jù),基于這些數(shù)據(jù),建立了一個犬類機器學(xué)習(xí)系統(tǒng)。
這個系統(tǒng)的目的有三個:1、像狗一樣行動,預(yù)測未來動作;2、像狗一樣計劃任務(wù);3、從狗行為中學(xué)習(xí)。最終的論文將于6月份在CVPR上發(fā)表。
為什么要這么做?
計算機視覺通常專注于解決與視覺智能相關(guān)的各種子任務(wù)。但我們偏離了這種標(biāo)準(zhǔn)的計算機視覺方法;相反,我們試圖直接建模一個視覺智能體(visually intelligent agent)。我們的模型將視覺信息作為輸入,并直接預(yù)測agent的行為。
盡管業(yè)界已經(jīng)做了很多工作來模擬感知的子任務(wù),比如識別一個對象并將其拾取出來,但是在“理解視覺數(shù)據(jù)以使Agent能夠在視覺世界中采取行動和執(zhí)行任務(wù)”方面卻做得很少。換句話說,不是模擬眼睛的行為,而是模擬控制眼睛的主體。
為什么選擇狗?
因為他們是足夠復(fù)雜的視覺智能體,狗很聰明,我們不知道它們在想什么,因此“他們的目標(biāo)和動機是事先未知的。”作為對這一研究領(lǐng)域的第一次嘗試,研究小組想知道,如果通過密切監(jiān)測狗,并將其運動和行動映射到它所看到的環(huán)境中,他們是否能夠創(chuàng)建一個系統(tǒng),準(zhǔn)確地預(yù)測這些運動。
為了做到這一點,研究者把一套基礎(chǔ)傳感器裝在一只名叫Kelp M. Redmon的美國愛斯基摩犬身上。他們在Kelp的頭部裝上1個GoPro相機,6個慣性測量單元(分別在腿、尾巴和身體上)用以判斷物體的位置,1個麥克風(fēng)以及一個把這些數(shù)據(jù)綁在一起的Arduino開發(fā)板。
本文來自微信公眾號【AI商業(yè)報道】
他們記錄了Kelp許多小時的活動:在不同的環(huán)境中散步、取東西、在公園玩耍、吃東西等。研究人員把狗的動作和它所看到世界的同步起來,結(jié)果就產(chǎn)生了狗環(huán)境中以自我為中心的行為的數(shù)據(jù)集,該數(shù)據(jù)集稱為“DECADE數(shù)據(jù)集”,研究人員用數(shù)據(jù)集來訓(xùn)練一個犬類人工智能代理。
對這個agent,給定某種感官輸入——例如一個房間或街道的景象,或一個飛過的球——以預(yù)測狗在這種情況下會做什么。當(dāng)然,不用說特別細(xì)節(jié),哪怕只是弄清楚它的身體如何移動,移向哪里,已經(jīng)是一項相當(dāng)重要的任務(wù)。
華盛頓大學(xué)的Hessam Bagherinezhad是研究人員之一,他解釋道:“它學(xué)會了如何移動關(guān)節(jié)以走路,學(xué)會了再走路或跑步是如何避開障礙物。它學(xué)會了追著松鼠跑,跟隨者主人走,追逐飛起來的狗玩具(玩飛盤游戲時)。這些都是計算機視覺和機器人技術(shù)的一些基本AI任務(wù)(例如運動規(guī)劃、可步行的表面、物體檢測、物體跟蹤、人物識別),我們一直試圖通過為每個任務(wù)收集單獨的數(shù)據(jù)來解決?!?/p>
這可能會產(chǎn)生一些相當(dāng)復(fù)雜的數(shù)據(jù):例如,狗模型必須像狗一樣知道行動路線,當(dāng)它需要從這里走到那里時,它的行走路線是什么,它不能在樹上行走,也不能在汽車上行走,也不能在沙發(fā)上行走。因此,模型也學(xué)習(xí)了這一點,這個模型可以作為一個計算機視覺模型單獨部署,以找出寵物在給定圖像中的位置。
這只是一個初步的實驗,研究人員說,雖然成功但結(jié)果有限。該系統(tǒng)未來可能會考慮引入更多的感覺,例如嗅覺,或者看看一只狗(或多只)的模型是如何推廣到其他狗身上的。
研究員的結(jié)論是:“我們希望這項工作為更好地理解視覺智能和生活在我們這個世界上的其他智能生物鋪平道路?!?/p>
微信內(nèi)搜索并關(guān)注公眾號[AI商業(yè)報道],獲得人工智能領(lǐng)域第一手商業(yè)資訊
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準(zhǔn)AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。