極客網(wǎng)·人工智能9月11日消息,9月8日-14日,備受矚目的2018歐洲計(jì)算機(jī)視覺(jué)大會(huì)(ECCV 2018)在德國(guó)慕尼黑召開(kāi),吸引了全球AI從業(yè)者的眼球。兩年一屆的ECCV與CVPR、ICCV共稱(chēng)為計(jì)算機(jī)視覺(jué)領(lǐng)域三大頂級(jí)學(xué)術(shù)會(huì)議,每年錄用論文約300篇。根據(jù)ECCV 2018宣布的最終結(jié)果,商湯科技及聯(lián)合實(shí)驗(yàn)室共有37篇論文入選,超過(guò)微軟、谷歌、Facebook等科技巨頭。
極客網(wǎng)了解到,商湯科技ECCV 2018錄取論文在以下領(lǐng)域?qū)崿F(xiàn)突破:大規(guī)模人臉與人體識(shí)別、物體檢測(cè)與跟蹤、自動(dòng)駕駛場(chǎng)景理解與分析、視頻分析、3D視覺(jué)、底層視覺(jué)算法、視覺(jué)與自然語(yǔ)言的綜合理解等。這些新穎的計(jì)算機(jī)視覺(jué)算法不僅有著豐富的應(yīng)用場(chǎng)景,使得更多的智能視覺(jué)算法能應(yīng)用于日常生活之中,還為后續(xù)研究提供了可貴的經(jīng)驗(yàn)和方向。
例如,商湯入選ECCV 2018論文《人臉識(shí)別的瓶頸在于數(shù)據(jù)集噪聲(The Devil of Face Recognition is in the Noise)》中,對(duì)于現(xiàn)有人臉數(shù)據(jù)集中的標(biāo)簽噪聲問(wèn)題進(jìn)行了深入研究,對(duì)MegaFace和MS-Celeb-1M數(shù)據(jù)集中的噪聲特性和來(lái)源做了全面的分析,發(fā)現(xiàn)干凈子集對(duì)于提高人臉識(shí)別精度效果顯著
再如入選論文《量化模仿-訓(xùn)練面向物體檢測(cè)的極小CNN模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》,本文提出一種簡(jiǎn)單而通用的框架—量化模仿,來(lái)訓(xùn)練面向物體檢測(cè)任務(wù)的極小CNN模型。作者提出聯(lián)合模仿與量化的方法來(lái)減小物體檢測(cè)CNN模型的參數(shù)量實(shí)現(xiàn)加速。在有限計(jì)算量的限制下,該框架在Pascal VOC和WIDER Face數(shù)據(jù)集的物體檢測(cè)性能均超越了當(dāng)前物體檢測(cè)的先進(jìn)水平。
而在幾個(gè)月前舉行的CVPR 2018會(huì)議上,商湯科技、香港中文大學(xué)-商湯科技聯(lián)合實(shí)驗(yàn)室以及其他商湯科技聯(lián)合實(shí)驗(yàn)室共有44篇論文中稿,商湯科技今年累計(jì)入選計(jì)算機(jī)視覺(jué)頂會(huì)論文數(shù)量達(dá)到81篇!
商湯科技聯(lián)合創(chuàng)始人、商湯研究院院長(zhǎng)王曉剛表示:商湯始終堅(jiān)持對(duì)原創(chuàng)技術(shù)的極致追求,正是這種精益求精的精神讓商湯在諸多計(jì)算機(jī)視覺(jué)前沿技術(shù)領(lǐng)域上不斷取得新突破,也在行業(yè)應(yīng)用方面全面落地。本次會(huì)議,華人入選ECCV 2018 的論文數(shù)量非常搶眼,近年來(lái)華人學(xué)者們對(duì)原創(chuàng)研究孜孜不倦的堅(jiān)守,鑄就CV技術(shù)領(lǐng)域的一股新力量。
參加COCO 2018和VOT 2018均奪冠
商湯原創(chuàng)技術(shù)的不斷進(jìn)步也在重要的比賽中得到驗(yàn)證。在2018年的COCO比賽中,商湯科技研究員和香港中文大學(xué)-商湯聯(lián)合實(shí)驗(yàn)室同學(xué)組成的團(tuán)隊(duì),在最核心的物體檢測(cè)(Detection)項(xiàng)目中奪得冠軍。
香港中文大學(xué)-商湯聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)MMDet
在COCO 2018的Detection項(xiàng)目奪冠
在此次競(jìng)賽中,商湯團(tuán)隊(duì)創(chuàng)造性地開(kāi)發(fā)了三項(xiàng)全新的技術(shù),獲得了大幅度的性能提升:
(1)新的多任務(wù)混合級(jí)聯(lián)架構(gòu)(hybrid cascade)。通過(guò)把不同子任務(wù)進(jìn)行逐級(jí)混合,這種新架構(gòu)有效地改善了整個(gè)檢測(cè)過(guò)程中的信息流動(dòng)。
(2)通過(guò)特征導(dǎo)引產(chǎn)生稀疏錨點(diǎn),而不是使用傳統(tǒng)的規(guī)則分布的密集錨點(diǎn)。這種特征導(dǎo)引的方案使得錨點(diǎn)的投放更為精準(zhǔn),平均召回率提升了超過(guò)10個(gè)百分點(diǎn)。
(3)采用一種新型的FishNet網(wǎng)絡(luò)結(jié)構(gòu),它有效地保留和修正多個(gè)尺度的信息,能更有效地用于圖像級(jí),區(qū)域級(jí),以及像素級(jí)預(yù)測(cè)任務(wù)。
在test-dev上,商湯團(tuán)隊(duì)對(duì)上述框架進(jìn)行了全面測(cè)試,其中單模型和多模型(最終提交的結(jié)果來(lái)自于五個(gè)模型混合的框架)的mask AP分別達(dá)到了47.4% 和49.0%,比去年冠軍(也是商湯團(tuán)隊(duì)獲得)的結(jié)果,44.0% 和 46.3%,有約3個(gè)百分點(diǎn)的明顯提高。 在傳統(tǒng)的基于檢測(cè)框的指標(biāo)bbox AP上,這個(gè)新的框架也分別達(dá)到了單模型54.1%和多模型的56.0%的性能,比去年冠軍的結(jié)果,50.5%和52.6%,也有較大的提升。
值得一提的是,為了推動(dòng)視覺(jué)檢測(cè)技術(shù)的進(jìn)一步發(fā)展,在ECCV期間,香港中文大學(xué)-商湯聯(lián)合實(shí)驗(yàn)室還開(kāi)源了檢測(cè)庫(kù)mm-detection(https://github.com/open-mmlab/mmdetection)。這個(gè)開(kāi)源庫(kù)提供了已公開(kāi)發(fā)表的多種視覺(jué)檢測(cè)核心模塊。通過(guò)這些模塊的組合,可以迅速搭建出各種著名的檢測(cè)框架,比如Faster RCNN,Mask RCNN,和R-FCN等,以及各種新型框架,從而大大加快檢測(cè)技術(shù)研究的效率。
此外,商湯科技團(tuán)隊(duì)還參加了視覺(jué)目標(biāo)跟蹤大賽VOT Challenge,并在實(shí)時(shí)跟蹤項(xiàng)目獲得第一名,這一成績(jī)體現(xiàn)了商湯在視覺(jué)目標(biāo)跟蹤技術(shù)的新突破。
VOT Challenge是視覺(jué)目標(biāo)跟蹤領(lǐng)域一年一度的國(guó)際權(quán)威比賽,其為跟蹤領(lǐng)域提供了精細(xì)的數(shù)據(jù)標(biāo)注和評(píng)測(cè)方式,并在2017年引入了實(shí)時(shí)比賽:被評(píng)測(cè)算法在跟蹤物體的同時(shí)必須保持至少60fps跟蹤速率,來(lái)模擬現(xiàn)實(shí)場(chǎng)景中的跟蹤情況。
今年的VOT 2018在ECCV 2018期間舉辦,共有72只隊(duì)伍參賽,包括微軟亞洲研究院、牛津大學(xué)等知名企業(yè)與高校。商湯科技的參賽算法能夠在60FPS的速率下獲得精確的跟蹤結(jié)果,并且在其他兩項(xiàng)項(xiàng)目(普通跟蹤和長(zhǎng)時(shí)跟蹤)也獲得了驕人的成績(jī)。
舉辦新型大賽 推動(dòng)人工智能行業(yè)發(fā)展
商湯不止于在頂級(jí)計(jì)算機(jī)視覺(jué)大賽上獲得好成績(jī),還致力舉辦行業(yè)大賽,制定行業(yè)標(biāo)準(zhǔn),推動(dòng)人工智能行業(yè)發(fā)展。
今年8月,商湯科技攜手香港中文大學(xué)、亞馬遜、南洋理工大學(xué)、悉尼大學(xué)聯(lián)合舉辦的首屆WIDER Face and Pedestrian Challenge 2018(簡(jiǎn)稱(chēng):WIDER Challenge)挑戰(zhàn)賽獲得圓滿成功。作為一項(xiàng)全新的全球頂級(jí)計(jì)算機(jī)視覺(jué)競(jìng)賽,共吸引來(lái)自世界各國(guó)超過(guò)400支隊(duì)伍報(bào)名。
商湯作為主辦方制定了全新標(biāo)準(zhǔn)數(shù)據(jù)集——WIDER Face人臉檢測(cè)數(shù)據(jù)集、WIDER Pedestrian專(zhuān)門(mén)用于行人檢測(cè)的大規(guī)模數(shù)據(jù)集和WIDER Person Search人物檢索數(shù)據(jù)集,促進(jìn)高性能算法涌現(xiàn)。
WIDER Workshop現(xiàn)場(chǎng)
參賽隊(duì)伍既有中科院計(jì)算所、微軟亞洲研究院、北京大學(xué)、上海交通大學(xué)、中國(guó)科學(xué)院大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、NtechLab、卡耐基梅隆大學(xué)、香港大學(xué)、香港理工大學(xué)全球頂尖學(xué)府和研究機(jī)構(gòu),也有雅虎、京東、曠視、科大訊飛、滴滴等科技公司。
未來(lái),商湯將繼續(xù)賦能AI創(chuàng)新大賽,加速推進(jìn)以人工智能為核心的創(chuàng)新技術(shù),帶動(dòng)行業(yè)應(yīng)用和產(chǎn)業(yè)融合的持續(xù)深入。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )