伊人久在线观看视频,国产香蕉久久精品综合网

如何讓無人機靈活穿越滿是障礙的房間？訓練一個循環(huán)神經(jīng)網(wǎng)絡試試看

如今，深度學習已經(jīng)在語音識別、計算機視覺等多個應用領(lǐng)域取得了重大突破。然而，要說到它在機器人領(lǐng)域的發(fā)展，那就要另當別論了——深度學習在機器人領(lǐng)域，不僅發(fā)展速度慢，甚至還遭到很多人的質(zhì)疑。為什么呢？

究其原因，最重要的一點在于所需數(shù)據(jù)難以共享——將深度學習應用到機器人領(lǐng)域，涉及到許多具體物理系統(tǒng)的表達。這意味著，所需數(shù)據(jù)往往是機器人領(lǐng)域的特定數(shù)據(jù)集。因此，研究人員在收集數(shù)據(jù)時，就要耗費較多時間；而在處理和環(huán)境相交互的主動系統(tǒng)時，則會更加費時。

近日，來自魯汶大學的兩位研究人員Klaas Kelchtermans和Tinne Tuytelaars就為解決這一問題展開了研究，并將研究成果撰寫成論文《How hard is it to cross the room ? - Training (Recurrent) Neural Networks to steer a UAV》，發(fā)布在了arXiv上。雷鋒網(wǎng)對論文進行了部分編譯。

論文地址：https://arxiv.org/abs/1702.07600

摘要

我們研究了在無人機導航控制中采用循環(huán)神經(jīng)網(wǎng)絡（RNN）代替前饋神經(jīng)網(wǎng)絡（FNN），是否能增加其活動的靈活性。實驗條件是：無人機在執(zhí)行高級導航任務時，需要用前視攝像頭收集信息。

為了讓無人機通過模仿學習學會執(zhí)行導航任務，我們建立了一個用來訓練神經(jīng)網(wǎng)絡、可應用于空中和陸地兩種交通工具的通用框架。實驗中，我們把框架應用于在模擬環(huán)境中飛行的無人機中，讓它學習如何穿越有多障礙物的房間。

到目前為止，無人機控制的訓練過程中通常只使用前饋神經(jīng)網(wǎng)絡。為了處理更多高難度的任務，我們提出，引入循環(huán)神經(jīng)網(wǎng)絡代替前饋神經(jīng)網(wǎng)絡，并且訓練一個長短期存儲器（LSTM）來控制無人機。

通過視覺信息進行控制屬于序列預測問題，并且需要高相關(guān)性的輸入數(shù)據(jù)。這一高相關(guān)性就使得訓練神經(jīng)網(wǎng)絡，尤其是循環(huán)神經(jīng)網(wǎng)絡，變得不容易進行。

為了克服這一問題，我們在訓練網(wǎng)絡時采用了WW-TBPTT法（window-wise truncated backpropagation through time）。另外，考慮到端對端訓練所需的數(shù)據(jù)通常無法獲得，我們將“只對全連接（FC）進行再訓練的控制層”和“只對長短期存儲器控制層（所需網(wǎng)絡為端到端的訓練）進行再訓練的控制層”的表現(xiàn)進行了對比。

最后，通過讓無人機穿越有障礙物房間這一相對簡單的實驗，我們已經(jīng)能看出訓練神經(jīng)控制網(wǎng)絡所具有的重要指導意義和其良好的實踐效果?？梢暬牟町愋杂兄诮忉専o人機學習到的行為。

如何讓無人機靈活穿越滿是障礙的房間？訓練一個循環(huán)神經(jīng)網(wǎng)絡試試看

雷鋒網(wǎng)(公眾號：雷鋒網(wǎng))注：此圖為論文中的圖12——平均模仿?lián)p失對比圖

實驗變量：已知和未知的房間、無人機用不同構(gòu)架的神經(jīng)網(wǎng)絡和不同訓練方法進行控制、是否有攝像頭；

S-LSTM 用S-TBPTT訓練、WW-LSTM用WW-TBPTT。

探討和結(jié)論

此研究中，我們測試了在導航控制中，存儲器（圖12）能如何幫助深度神經(jīng)網(wǎng)絡更高效地運作。

結(jié)果表明，用WW-TBPTT去除訓練數(shù)據(jù)的相關(guān)性，在訓練如長短期存儲器這樣的循環(huán)神經(jīng)網(wǎng)絡時，極其有幫助。盡管使用WW-TBPTT 法會使實驗方差增大，計算存儲值的過程也使訓練變慢（如圖12最右邊一組條形圖），但它能通過時間長度有效避免滑動截斷反向傳播的順序偏差（the sequential bias of sliding truncated back propagation）。

另外，實驗結(jié)果表明，預先訓練網(wǎng)絡也非常有意義。在導航控制試驗中，僅僅重訓練最后一層卷積網(wǎng)絡全連接層（如Inception），比訓練端對端訓練網(wǎng)絡表現(xiàn)更好。訓練端對端網(wǎng)絡不僅需要更多數(shù)據(jù)，而且時間也更長。也正是上述這個原因，機器人（雷鋒網(wǎng)注：這里指無人機）在實際應用中才不夠靈活。

我們將公開“穿過房間一”和“穿過房間二”兩次實驗的數(shù)據(jù)集（它們代表了實驗所需數(shù)據(jù)的復雜程度），讓其他研究人員能以此為參考標準，學習導航控制。

最后，我們還想強調(diào)，想要打開深度學習這個黑箱子，差異化評價法和可視化是非常有必要的。

免責聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

如何讓無人機靈活穿越滿是障礙的房間？

下一篇

如何讓無人機靈活穿越滿是障礙的房間？