CVPR 2020 |用于3D目標檢測的層級圖網(wǎng)絡

論文:A Hierarchical Graph Network for 3D Object Detection on Point Clouds

由于大多數(shù)現(xiàn)有的點云對象檢測方法不能充分適應點云的特征(例如稀疏性),所以一些關(guān)鍵的語義信息(如物體形狀)不能被很好的捕捉到。本文提出了一種基于層級圖網(wǎng)絡(HGNet)的圖卷積(GConv),可以直接將點云作為輸入來預測 3D 的邊界框。形狀注意圖卷積(SA-GConv)可以通過劍魔點的位置星系來描述物體形狀,基于 SA-GConv 的 U 形網(wǎng)絡可以通過改進的 voting 模塊獲取多層級的特征進而生成候選,然后一個基于圖卷積的候選推理模塊考慮全局的場景語義來對邊界框進行預測。該框架在兩個大規(guī)模點云數(shù)據(jù)上的表現(xiàn)超過了目前最先進的模型。

論文背景

由于點云的稀疏性,一些已有的為網(wǎng)格形式數(shù)據(jù)設計的方法(如CNN)在點云上的表現(xiàn)并不好,為解決這一問題,最近有一些對點云數(shù)據(jù)的方法被提出,例如基于投影的方法、基于體卷積的方法和基于 PointNet 的方法。前兩種試圖將點云數(shù)據(jù)嚴格轉(zhuǎn)換為網(wǎng)格結(jié)構(gòu)數(shù)據(jù),而后一種則在不明確考慮點的幾何位置的情況下聚合特征。

與其他方法相比,PointNet++ 可以保留點的稀疏特點,因此被廣泛作為框架的骨架。當目前仍有一些未能很好解決的挑戰(zhàn),首先由于沒有考慮點的相對幾何位置,因此使用 PointNet++ 作為主干忽略了一些局部形狀信息。其次,框架的結(jié)構(gòu)沒有充分利用多級語義,這可能會忽略一些有助于目標檢測的信息。

本文提出了一個基于圖卷積(GCONV)的層級圖網(wǎng)絡(HGNet)用于基于點云的 3D 目標檢測。HGNet 包含三部分:一個基于圖卷積的 U 形網(wǎng)絡(GUnet)、一個候選生成器以及一個候選推理模塊(ProRe Module)。

整個 HGNet 以端到端的方式進行培訓。在本文的框架中,點云的局部形狀信息、多級語義和全局場景信息(候選的特征)已被層級圖模型充分捕獲、聚合和合并,充分考慮了點云數(shù)據(jù)的特征。

本文的主要貢獻如下:

(A)開發(fā)了一種新的層級圖網(wǎng)絡(HGNet),用于在點云上進行 3D 對象檢測,其表現(xiàn)好于已有方法。

(B)提出了一種新穎的 SA-(De)GConv,它可以有效地聚合特征并捕獲點云中對象的形狀信息。

(C)構(gòu)建了一個新的 GU-net,用于生成多級特征,這對于 3D 對象檢測至關(guān)重要。

(D)利用全局信息,ProRe 模塊通過對候選進行推理來提高效果。

論文模型

融合采樣

3D 目標檢測有基于點和基于體素兩種框架,前者更加耗時,由候選生成與預測細化兩個階段組成。

在第一個階段,SA 用于降采樣以獲得更高的效率以及擴大感受野,F(xiàn)P 用來為降采樣過程中丟掉的點傳播特征。在第二階段,一個優(yōu)化模塊最優(yōu)化 RPN 的結(jié)果以獲得更準確的預測。SA 對于提取點的特征是必需的。但 FP 和優(yōu)化模塊會限制效率。

形狀注意圖卷積

點云通常不能清楚地表示出物體的形狀,可以使用其相鄰點的相對幾何位置來描述點周圍的局部形狀。本文介紹了一種新穎的形狀注意圖卷積,它通過對點的幾何位置建模來捕獲對象形狀。

對于一個點集 X,其中每一個點由其集合位置 p_i 以及 D 維的特征 f_i 組成,我們想要生成一個 X’,本文設計了圖卷積用于聚合從 X 到 X’ 的特征。與 PointNet++的采樣層相類似,本文首先從 n 個點中采樣 n’ 個點,通常 K 最近鄰(KNN)被用來在采樣中保留局部信息將其作為中心點特征。

其中 g 表示 i 和 j 的相對位置,通過一個卷積將三維變?yōu)橐痪S,f 是 mlp,然后二者的乘積就是中心點的 knn,其中最大的作為 i 的特征。形狀注意操作不同于簡單的基于 mlp 的操作主要就是因為這個 g 函數(shù)。雖然形式上沒有 attention 中的 softmax 這樣的歸一化,但是 g 的輸出就和 attention一樣,每個點的 weights,然后對應的乘以特征。

12下一頁>

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2020-09-01
CVPR 2020 |用于3D目標檢測的層級圖網(wǎng)絡
論文:A Hierarchical Graph Network for 3D Object Detection on Point Clouds由于大多數(shù)現(xiàn)有的點云對象檢測方法不能充分適應點云的特征(例

長按掃碼 閱讀全文