近期,特斯拉自動(dòng)駕駛事故被頻頻報(bào)道,同時(shí)華為“自動(dòng)駕駛”技術(shù)驚艷亮相,被廣大網(wǎng)友認(rèn)為其已經(jīng)達(dá)到了L4的自動(dòng)駕駛水平,這使得關(guān)于汽車輔助駕駛系統(tǒng)的討論再度熱鬧了起來。其中最關(guān)鍵的核心就是有關(guān)汽車視覺的感知系統(tǒng)。
事實(shí)上,隨著AR+AI時(shí)代的到來,AI視覺作為實(shí)現(xiàn)工業(yè)自動(dòng)化和智能化的關(guān)鍵核心技術(shù),正成為人工智能發(fā)展最快的一個(gè)分支。當(dāng)機(jī)器可以“看懂這個(gè)世界”時(shí),它將如眼睛之于人類的價(jià)值一般,不僅會(huì)改變我們的出行方式,還將改變我們的娛樂、學(xué)習(xí)等等與生活有關(guān)的一切。
一直以來,亮亮視野都在AR和AI上投入了巨大的精力,在為行業(yè)提供支撐企業(yè)數(shù)字化轉(zhuǎn)型的硬件和平臺(tái)的同時(shí),與中科院自動(dòng)化所建立聯(lián)合實(shí)驗(yàn)室,通過對(duì)算法協(xié)同、多模態(tài)任務(wù)、環(huán)境測試等多方面進(jìn)行綜合研究,努力實(shí)現(xiàn)AI多模態(tài)感知融合。近期,其多項(xiàng)研究成果成功入選計(jì)算機(jī)視覺世界的頂級(jí)會(huì)議。
“基于結(jié)構(gòu)信息保持的弱監(jiān)督目標(biāo)定位”入選CVPR2021
Unveiling the Potential of Structure-Preserving for Weakly Supervised Object Localization. CVPR 2021.
CVPR2021是計(jì)算機(jī)視覺世界三大頂會(huì)之一!本次大會(huì)收到來自全球共7015篇有效投稿,最終有1663篇突出重圍被錄取,錄用率僅為23.7%。
本論文研究的是弱監(jiān)督目標(biāo)定位(WSOL)能力,這是當(dāng)下仍富有挑戰(zhàn)的計(jì)算機(jī)視覺任務(wù),雖然現(xiàn)有的工作通過利用空間正則化策略可以明顯提高目標(biāo)定位精度,但往往忽略了如何從訓(xùn)練好的分類網(wǎng)絡(luò)中提取目標(biāo)結(jié)構(gòu)信息,使得性能和效率還有大幅提高的空間。
本次研究提出了一種兩階段的方法“結(jié)構(gòu)保持激活(SPA)”,以充分利用WSOL卷積特征中包含的結(jié)構(gòu)信息。在包括CUB-200-2011和ILSVRC在內(nèi)的兩個(gè)公開基準(zhǔn)上進(jìn)行的大量實(shí)驗(yàn)表明,與基準(zhǔn)方法相比,本文提出的SPA方法取得了顯著的性能提升。
分析并提醒行進(jìn)中存在的警示和風(fēng)險(xiǎn)
而這種提升就可以在汽車駕駛時(shí),對(duì)感知系統(tǒng)下的更多物體實(shí)現(xiàn)更為精準(zhǔn)的檢測與判定,降低事故發(fā)生率。
“SiamCPN:基于孿生中心預(yù)測網(wǎng)絡(luò)的視覺跟蹤”入選CVM 2021
SiamCPN: Visual tracking with the Siamese center-prediction network. CVM 2021.
CVM是亞洲圖形學(xué)學(xué)會(huì)(ASIA Graphics Association)旗下的三大系列會(huì)議之一,由清華大學(xué)圖形學(xué)實(shí)驗(yàn)室于2012年在北京創(chuàng)辦,發(fā)展至今,已經(jīng)在國際上形成較大影響力。此次入選CVM2021的論文也同步入選SCI索引源。
本論文主要針對(duì)的是目標(biāo)跟蹤問題,通過一種anchor-free的孿生網(wǎng)絡(luò)SiamCPN,給定初始幀中的參考追蹤對(duì)象,可直接預(yù)測后續(xù)幀中對(duì)象的中心點(diǎn)和大小。相比其它先進(jìn)的孿生網(wǎng)絡(luò)算法,該方法GOT-10K、UAV123數(shù)據(jù)集上取得了更好的結(jié)果,推理速度也有1.5-2.0倍的提升。
讓虛擬NPC始終坐在人物肩膀上
這一成果可應(yīng)用于互動(dòng)游戲之中,可以讓虛擬的場景與現(xiàn)實(shí)自然融合,讓虛擬創(chuàng)造的NPC更真實(shí)的與玩家互動(dòng),從而讓玩家獲得更具沉浸感的增強(qiáng)現(xiàn)實(shí)游戲體驗(yàn)。
其實(shí)不止于這些場景,這兩項(xiàng)科研成果還可以應(yīng)用于更多領(lǐng)域。目前,亮亮視野正將這些技術(shù)帶到工業(yè)巡檢領(lǐng)域,從而促進(jìn)技術(shù)快速成熟,將技術(shù)帶到國民用戶的普通生活之中。
例如,“基于結(jié)構(gòu)信息保持的弱監(jiān)督目標(biāo)定位”現(xiàn)正應(yīng)用于電力、制造、能源等領(lǐng)域的生產(chǎn)車間中,通過該技術(shù)賦予AVG機(jī)器人之中,機(jī)器人可以在復(fù)雜的環(huán)境中實(shí)現(xiàn)自主行走、避障等,從而提升機(jī)器人搬運(yùn)、分揀等效率。此外,將該技術(shù)植入進(jìn)AR智能眼鏡中,可以為現(xiàn)場人員提供實(shí)景導(dǎo)航、安全提示等,從而提高生產(chǎn)安全性。
而“基于孿生中心預(yù)測網(wǎng)絡(luò)的視覺跟蹤”技術(shù)則可以將數(shù)字孿生技術(shù)、三維建模技術(shù)更好的應(yīng)用起來,工作人員可更方便的查看設(shè)備圖紙、操作設(shè)備虛擬三維模型,提高生產(chǎn)、運(yùn)維、遠(yuǎn)程培訓(xùn)的效率。
AI是進(jìn)入未來世界的關(guān)鍵,是成就改變世界夢想的鑰匙。截至目前,亮亮視野已經(jīng)有數(shù)篇AI科研成果登陸世界頂級(jí)會(huì)議,并將這些技術(shù)產(chǎn)業(yè)化,為不同行業(yè)帶去智能化的解決方案。未來,亮亮?xí)^續(xù)加大AI領(lǐng)域的研究工作,通過人工智能與增強(qiáng)現(xiàn)實(shí)技術(shù),以第一視角交互讓人與人、人與機(jī)器、人與數(shù)據(jù)的溝通變得更自然高效。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )