如今,深度學(xué)習(xí)已經(jīng)在語音識別、計(jì)算機(jī)視覺等多個(gè)應(yīng)用領(lǐng)域取得了重大突破。然而,要說到它在機(jī)器人領(lǐng)域的發(fā)展,那就要另當(dāng)別論了——深度學(xué)習(xí)在機(jī)器人領(lǐng)域,不僅發(fā)展速度慢,甚至還遭到很多人的質(zhì)疑。為什么呢?
究其原因,最重要的一點(diǎn)在于所需數(shù)據(jù)難以共享——將深度學(xué)習(xí)應(yīng)用到機(jī)器人領(lǐng)域,涉及到許多具體物理系統(tǒng)的表達(dá)。這意味著,所需數(shù)據(jù)往往是機(jī)器人領(lǐng)域的特定數(shù)據(jù)集。因此,研究人員在收集數(shù)據(jù)時(shí),就要耗費(fèi)較多時(shí)間;而在處理和環(huán)境相交互的主動系統(tǒng)時(shí),則會更加費(fèi)時(shí)。
近日,來自魯汶大學(xué)的兩位研究人員Klaas Kelchtermans和Tinne Tuytelaars就為解決這一問題展開了研究,并將研究成果撰寫成論文《How hard is it to cross the room ? - Training (Recurrent) Neural Networks to steer a UAV》,發(fā)布在了arXiv上。雷鋒網(wǎng)對論文進(jìn)行了部分編譯。
論文地址:https://arxiv.org/abs/1702.07600
摘要
我們研究了在無人機(jī)導(dǎo)航控制中采用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)代替前饋神經(jīng)網(wǎng)絡(luò)(FNN),是否能增加其活動的靈活性。實(shí)驗(yàn)條件是:無人機(jī)在執(zhí)行高級導(dǎo)航任務(wù)時(shí),需要用前視攝像頭收集信息。
為了讓無人機(jī)通過模仿學(xué)習(xí)學(xué)會執(zhí)行導(dǎo)航任務(wù),我們建立了一個(gè)用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)、可應(yīng)用于空中和陸地兩種交通工具的通用框架。實(shí)驗(yàn)中,我們把框架應(yīng)用于在模擬環(huán)境中飛行的無人機(jī)中,讓它學(xué)習(xí)如何穿越有多障礙物的房間。
到目前為止,無人機(jī)控制的訓(xùn)練過程中通常只使用前饋神經(jīng)網(wǎng)絡(luò)。為了處理更多高難度的任務(wù),我們提出,引入循環(huán)神經(jīng)網(wǎng)絡(luò)代替前饋神經(jīng)網(wǎng)絡(luò),并且訓(xùn)練一個(gè)長短期存儲器(LSTM)來控制無人機(jī)。
通過視覺信息進(jìn)行控制屬于序列預(yù)測問題,并且需要高相關(guān)性的輸入數(shù)據(jù)。這一高相關(guān)性就使得訓(xùn)練神經(jīng)網(wǎng)絡(luò),尤其是循環(huán)神經(jīng)網(wǎng)絡(luò),變得不容易進(jìn)行。
為了克服這一問題,我們在訓(xùn)練網(wǎng)絡(luò)時(shí)采用了WW-TBPTT法(window-wise truncated backpropagation through time)。另外,考慮到端對端訓(xùn)練所需的數(shù)據(jù)通常無法獲得,我們將“只對全連接(FC)進(jìn)行再訓(xùn)練的控制層”和“只對長短期存儲器控制層(所需網(wǎng)絡(luò)為端到端的訓(xùn)練)進(jìn)行再訓(xùn)練的控制層”的表現(xiàn)進(jìn)行了對比。
最后,通過讓無人機(jī)穿越有障礙物房間這一相對簡單的實(shí)驗(yàn),我們已經(jīng)能看出訓(xùn)練神經(jīng)控制網(wǎng)絡(luò)所具有的重要指導(dǎo)意義和其良好的實(shí)踐效果??梢暬牟町愋杂兄诮忉専o人機(jī)學(xué)習(xí)到的行為。
雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))注:此圖為論文中的圖12——平均模仿?lián)p失對比圖
實(shí)驗(yàn)變量:已知和未知的房間、無人機(jī)用不同構(gòu)架的神經(jīng)網(wǎng)絡(luò)和不同訓(xùn)練方法進(jìn)行控制、是否有攝像頭;
S-LSTM 用S-TBPTT訓(xùn)練、WW-LSTM用WW-TBPTT。
探討和結(jié)論
此研究中,我們測試了在導(dǎo)航控制中,存儲器(圖12)能如何幫助深度神經(jīng)網(wǎng)絡(luò)更高效地運(yùn)作。
結(jié)果表明,用WW-TBPTT去除訓(xùn)練數(shù)據(jù)的相關(guān)性,在訓(xùn)練如長短期存儲器這樣的循環(huán)神經(jīng)網(wǎng)絡(luò)時(shí),極其有幫助。盡管使用WW-TBPTT 法會使實(shí)驗(yàn)方差增大,計(jì)算存儲值的過程也使訓(xùn)練變慢(如圖12最右邊一組條形圖),但它能通過時(shí)間長度有效避免滑動截?cái)喾聪騻鞑サ捻樞蚱睿╰he sequential bias of sliding truncated back propagation)。
另外,實(shí)驗(yàn)結(jié)果表明,預(yù)先訓(xùn)練網(wǎng)絡(luò)也非常有意義。在導(dǎo)航控制試驗(yàn)中,僅僅重訓(xùn)練最后一層卷積網(wǎng)絡(luò)全連接層(如Inception),比訓(xùn)練端對端訓(xùn)練網(wǎng)絡(luò)表現(xiàn)更好。訓(xùn)練端對端網(wǎng)絡(luò)不僅需要更多數(shù)據(jù),而且時(shí)間也更長。也正是上述這個(gè)原因,機(jī)器人(雷鋒網(wǎng)注:這里指無人機(jī))在實(shí)際應(yīng)用中才不夠靈活。
我們將公開“穿過房間一”和“穿過房間二”兩次實(shí)驗(yàn)的數(shù)據(jù)集(它們代表了實(shí)驗(yàn)所需數(shù)據(jù)的復(fù)雜程度),讓其他研究人員能以此為參考標(biāo)準(zhǔn),學(xué)習(xí)導(dǎo)航控制。
最后,我們還想強(qiáng)調(diào),想要打開深度學(xué)習(xí)這個(gè)黑箱子,差異化評價(jià)法和可視化是非常有必要的。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- vivo X200 Pro拍照炫光問題引關(guān)注 沖擊高端不能忽視產(chǎn)品質(zhì)量
- 天貓精靈發(fā)布哇哦閨蜜機(jī)新品,開啟AI智臻智享新時(shí)代
- 天貓精靈發(fā)布哇哦閨蜜機(jī)新品,更親民的高刷AI閨蜜機(jī)來了
- 華為MatePad Pro 12.2英寸流金典藏版(SIM卡版)發(fā)布,帶來專業(yè)戶外創(chuàng)作體驗(yàn)
- AI修圖讓出片更有趣 華為nova 13系列打造年輕人的“表情管理大師”
- 華為nova 13系列亮相原生鴻蒙之夜,全新洛登綠格紋設(shè)計(jì)引領(lǐng)美學(xué)新潮流
- 華為WATCH Ultimate非凡探索煥新推出“綠野傳奇”,引領(lǐng)高爾夫智能體驗(yàn)
- 中國循環(huán)經(jīng)濟(jì)協(xié)會:我國每年產(chǎn)生超4億部廢舊手機(jī),只有約5%被回收處理
- 蘋果AI發(fā)展遭內(nèi)部質(zhì)疑,被認(rèn)為落后行業(yè)巨頭兩年以上
- iPhone 16系列遭遇新挑戰(zhàn):用戶反映隨機(jī)死機(jī)和自動重啟問題
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。