高層速讀
關鍵信息:谷歌Deepmind的最新論文展示了一個突破:人工智能體展現(xiàn)出與人腦“網(wǎng)格細胞”高度一致的空間導航能力。人工智能在游戲中學會了“抄近路”,并超過職業(yè)玩家水平。
關鍵意義:這對于人工智能的可解釋性和神經(jīng)科學的算法性都具有重要意義。
大多數(shù)動物和人類,都能靈活地在世界中遨游,向前探索新的領域,也可以返回任何地方,還能走捷徑。這些能力是如此的簡單和自然,以至于我們根本不清楚潛在的過程到底有多復雜。相比之下,對于能力遠遠超過動物的人工智能體來說,空間導航仍然是一個巨大的挑戰(zhàn)。
2005年,一項驚人的發(fā)現(xiàn)揭示了空間行為神經(jīng)回路的關鍵部分:在動物探索環(huán)境的過程中,神經(jīng)元以一種非常規(guī)則的六邊形網(wǎng)格模式發(fā)射,這些六邊形的神經(jīng)元被稱為“網(wǎng)格細胞”,網(wǎng)格細胞有助于空間導航(GPS),類似于地圖上的網(wǎng)格線。
第一個發(fā)現(xiàn)網(wǎng)格細胞的小組獲得了2014年諾貝爾生理學和醫(yī)學獎,但是,即便他們發(fā)現(xiàn)了該理論已經(jīng)10多年,網(wǎng)格細胞的計算功能,以及它們是否支持基于矢量的導航的問題,仍然是個謎。
除了是動物內(nèi)部的坐標系統(tǒng)之外,網(wǎng)格細胞最近被假設支持基于矢量的導航。
DeepMind今天發(fā)表在Nature上的論文“Vector-based navigation using grid-like representations in artificial agents”中,研究人員開發(fā)了一種人工智能體(artificial agent)來測試“網(wǎng)格細胞支持基于矢量的導航”這一理論。
第一步,研究者訓練了一個循環(huán)網(wǎng)絡,來執(zhí)行在虛擬環(huán)境中給自己定位的任務,使用主要的運動相關的速度信號(線速度和角速度)。這種能力通常是哺乳動物在不熟悉的地方或黑暗中行走時使用的。
研究者發(fā)現(xiàn),網(wǎng)狀結(jié)構(gòu)自動出現(xiàn)了,這與覓食哺乳動物中觀察到的神經(jīng)活動模式有顯著的融合,也與網(wǎng)格單元為空間提供高效代碼的觀點一致。
接下來,研究者試圖測試網(wǎng)格細胞是否支持基于矢量的導航,他們通過將最初的“網(wǎng)格網(wǎng)絡”與更大的網(wǎng)絡架構(gòu)結(jié)合起來,創(chuàng)建了一個人工智能代理。
這個人工智能代理在經(jīng)過深度強化學習訓練之后,在虛擬現(xiàn)實游戲環(huán)境中自動導航找到了目標。該代理的水平超越了專業(yè)游戲玩家的能力,并展示了動物般靈活的導航類型,智能代理采用了捷徑,學會了“抄近路”。
通過一系列的實驗操作,研究者發(fā)現(xiàn)網(wǎng)格細胞對于基于矢量的導航是至關重要的。例如,當網(wǎng)絡中的網(wǎng)格單元被靜默時,會使智能代理的導航能力受損,距離和方向等關鍵指標的表示變得不那么準確。
此次研究是理解大腦中網(wǎng)格細胞基本計算的重要一步,同時也強調(diào)了它們對人工智能代理的好處。
更進一步,類似的方法可以用來測試那些對感知聲音或控制肢體有重要意義的大腦區(qū)域的理論。未來,這樣的網(wǎng)絡很可能為科學家們提供一種新的方法來進行“實驗”,提出新的理論,甚至對目前在動物身上進行的研究提供補充。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 東方甄選擬15億出售教育業(yè)務
- 虧764億上熱搜 蔚來裁員10%,銷量跌出前三
- IBM設立5億元AI創(chuàng)投基金
- 聯(lián)想發(fā)布 ThinkStation P8工作站
- 節(jié)奏大師回歸,11月7日重新上線 趙麗穎也玩節(jié)奏大師!
- 蘋果明年發(fā)布首款3nm平板:iPad Pro
- 暴雪、寒潮、大風 三預警齊發(fā) 羽絨服銷售爆火:價格上漲
- 飛天茅臺出廠價上調(diào) 平均上調(diào)幅度約為20%
- 蘋果發(fā)布新Mac 搭載M3芯片 MacBook Pro系列產(chǎn)品全面提速
- 華為申請“遙遙領先”商標 正在等待實質(zhì)審查
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。