123,123,123

CVPR 2020 |用于3D目標(biāo)檢測(cè)的層級(jí)圖網(wǎng)絡(luò)

人閱讀

2020-09-01 11:44:00

相關(guān)關(guān)鍵詞
- 人工智能
- AI

論文：A Hierarchical Graph Network for 3D Object Detection on Point Clouds

由于大多數(shù)現(xiàn)有的點(diǎn)云對(duì)象檢測(cè)方法不能充分適應(yīng)點(diǎn)云的特征（例如稀疏性），所以一些關(guān)鍵的語義信息（如物體形狀）不能被很好的捕捉到。本文提出了一種基于層級(jí)圖網(wǎng)絡(luò)（HGNet）的圖卷積（GConv），可以直接將點(diǎn)云作為輸入來預(yù)測(cè) 3D 的邊界框。形狀注意圖卷積（SA－GConv）可以通過劍魔點(diǎn)的位置星系來描述物體形狀，基于 SA－GConv 的 U 形網(wǎng)絡(luò)可以通過改進(jìn)的 voting 模塊獲取多層級(jí)的特征進(jìn)而生成候選，然后一個(gè)基于圖卷積的候選推理模塊考慮全局的場(chǎng)景語義來對(duì)邊界框進(jìn)行預(yù)測(cè)。該框架在兩個(gè)大規(guī)模點(diǎn)云數(shù)據(jù)上的表現(xiàn)超過了目前最先進(jìn)的模型。

論文背景

由于點(diǎn)云的稀疏性，一些已有的為網(wǎng)格形式數(shù)據(jù)設(shè)計(jì)的方法（如CNN）在點(diǎn)云上的表現(xiàn)并不好，為解決這一問題，最近有一些對(duì)點(diǎn)云數(shù)據(jù)的方法被提出，例如基于投影的方法、基于體卷積的方法和基于 PointNet 的方法。前兩種試圖將點(diǎn)云數(shù)據(jù)嚴(yán)格轉(zhuǎn)換為網(wǎng)格結(jié)構(gòu)數(shù)據(jù)，而后一種則在不明確考慮點(diǎn)的幾何位置的情況下聚合特征。

與其他方法相比，PointNet＋＋可以保留點(diǎn)的稀疏特點(diǎn)，因此被廣泛作為框架的骨架。當(dāng)目前仍有一些未能很好解決的挑戰(zhàn)，首先由于沒有考慮點(diǎn)的相對(duì)幾何位置，因此使用 PointNet＋＋作為主干忽略了一些局部形狀信息。其次，框架的結(jié)構(gòu)沒有充分利用多級(jí)語義，這可能會(huì)忽略一些有助于目標(biāo)檢測(cè)的信息。

本文提出了一個(gè)基于圖卷積（GCONV）的層級(jí)圖網(wǎng)絡(luò)（HGNet）用于基于點(diǎn)云的 3D 目標(biāo)檢測(cè)。HGNet 包含三部分：一個(gè)基于圖卷積的 U 形網(wǎng)絡(luò)（GUnet）、一個(gè)候選生成器以及一個(gè)候選推理模塊（ProRe Module）。

整個(gè) HGNet 以端到端的方式進(jìn)行培訓(xùn)。在本文的框架中，點(diǎn)云的局部形狀信息、多級(jí)語義和全局場(chǎng)景信息（候選的特征）已被層級(jí)圖模型充分捕獲、聚合和合并，充分考慮了點(diǎn)云數(shù)據(jù)的特征。

本文的主要貢獻(xiàn)如下：

（A）開發(fā)了一種新的層級(jí)圖網(wǎng)絡(luò)（HGNet），用于在點(diǎn)云上進(jìn)行 3D 對(duì)象檢測(cè)，其表現(xiàn)好于已有方法。

（B）提出了一種新穎的 SA－（De）GConv，它可以有效地聚合特征并捕獲點(diǎn)云中對(duì)象的形狀信息。

（C）構(gòu)建了一個(gè)新的 GU－net，用于生成多級(jí)特征，這對(duì)于 3D 對(duì)象檢測(cè)至關(guān)重要。

（D）利用全局信息，ProRe 模塊通過對(duì)候選進(jìn)行推理來提高效果。

論文模型

融合采樣

3D 目標(biāo)檢測(cè)有基于點(diǎn)和基于體素兩種框架，前者更加耗時(shí)，由候選生成與預(yù)測(cè)細(xì)化兩個(gè)階段組成。

在第一個(gè)階段，SA 用于降采樣以獲得更高的效率以及擴(kuò)大感受野，F(xiàn)P 用來為降采樣過程中丟掉的點(diǎn)傳播特征。在第二階段，一個(gè)優(yōu)化模塊最優(yōu)化 RPN 的結(jié)果以獲得更準(zhǔn)確的預(yù)測(cè)。SA 對(duì)于提取點(diǎn)的特征是必需的。但 FP 和優(yōu)化模塊會(huì)限制效率。

形狀注意圖卷積

點(diǎn)云通常不能清楚地表示出物體的形狀，可以使用其相鄰點(diǎn)的相對(duì)幾何位置來描述點(diǎn)周圍的局部形狀。本文介紹了一種新穎的形狀注意圖卷積，它通過對(duì)點(diǎn)的幾何位置建模來捕獲對(duì)象形狀。

對(duì)于一個(gè)點(diǎn)集 X，其中每一個(gè)點(diǎn)由其集合位置 p＿i 以及 D 維的特征 f＿i 組成，我們想要生成一個(gè) X’，本文設(shè)計(jì)了圖卷積用于聚合從 X 到 X’ 的特征。與 PointNet＋＋的采樣層相類似，本文首先從 n 個(gè)點(diǎn)中采樣 n’ 個(gè)點(diǎn)，通常 K 最近鄰（KNN）被用來在采樣中保留局部信息將其作為中心點(diǎn)特征。

其中 g 表示 i 和 j 的相對(duì)位置，通過一個(gè)卷積將三維變?yōu)橐痪S，f 是 mlp，然后二者的乘積就是中心點(diǎn)的 knn，其中最大的作為 i 的特征。形狀注意操作不同于簡單的基于 mlp 的操作主要就是因?yàn)檫@個(gè) g 函數(shù)。雖然形式上沒有 attention 中的 softmax 這樣的歸一化，但是 g 的輸出就和 attention一樣，每個(gè)點(diǎn)的 weights，然后對(duì)應(yīng)的乘以特征。

12下一頁>

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）