今日,由商湯科技SenseTime攜手香港中文大學、亞馬遜、南洋理工大學、悉尼大學聯(lián)合舉辦的首屆WIDER Face and Pedestrian Challenge 2018挑戰(zhàn)賽圓滿落幕。作為一項全新的全球頂級計算機視覺競賽,挑戰(zhàn)賽共吸引來自世界各國超過400支隊伍報名。在競賽組織、設計、數(shù)據(jù)選取等全過程中,商湯科技充分發(fā)揮產(chǎn)學研協(xié)同的優(yōu)勢,提出了諸多切合實際場景及產(chǎn)業(yè)應用需求的競賽課題及規(guī)則,以全新的行業(yè)規(guī)范和標準,促進產(chǎn)業(yè)與學術界的交流,開拓計算機視覺研究的新發(fā)展方向。
制定全新標準數(shù)據(jù)集 促進高性能算法涌現(xiàn)
隨著應用需求與場景的增多,人臉檢測、行人檢測及人物檢測已成為計算機視覺研究中的熱門項目。挑戰(zhàn)賽聚焦這三大熱點,設計了WIDER Face,WIDER Pedestrian及WIDER Person Search三項子任務,同時基于不斷增加的復雜場景需求,啟用了更加貼近真實場景的數(shù)據(jù)集,以提升競賽的實用、創(chuàng)新及挑戰(zhàn)性,進而促進計算機視覺領域人臉及行人檢測高性能算法的涌現(xiàn)。
WIDER Face人臉檢測數(shù)據(jù)集是人臉檢測領域中的標準數(shù)據(jù)集。WIDER Face數(shù)據(jù)集于2016年由商湯-香港中文大學聯(lián)合實驗室搜集、標注并作為口頭報告發(fā)布在當年的計算機視覺頂級會議CVPR大會上。在一年多時間里,WIDER Face已成為人臉檢測領域廣泛使用的標準數(shù)據(jù)集。相比較于之前的人臉檢測數(shù)據(jù)集,WIDER Face數(shù)據(jù)集在數(shù)據(jù)難度,圖片和標注數(shù)量上都有一個數(shù)量級的提升。
WIDER Pedestrian提供了專門用于行人檢測的大規(guī)模數(shù)據(jù)集??紤]當前行人檢測兩大熱門應用(監(jiān)控和自動駕駛),選用監(jiān)控攝像頭和車載攝像機采集的圖片,拍攝角度、行人尺度、光照等方面都具有很大不同,參賽者必須提出更加魯棒和普適性的方法來應對不同場景。并且部分數(shù)據(jù)來自夜景拍攝,給檢測帶來更大難度。同時,相比其他的行人檢測數(shù)據(jù)集,WIDER Pedestrian提供了行人和騎車人兩種不同行人的標注具有更多的檢測目標數(shù)和不同尺度的行人。檢測目標的密集,更小尺度的行人和行人之間的遮擋等都給參賽者帶來了更多挑戰(zhàn)。
WIDER Person Search是一個新穎的從192部電影中檢索人物的任務,需要根據(jù)演員的標準照,從一個大的數(shù)據(jù)庫中將對應角色的實例全部檢索出來。人物檢索不但具有實用性,還非常具有挑戰(zhàn)性。演員的標準照和他們在電影里的裝扮往往是完全不同的。即使在同一部電影里演員的衣著和環(huán)境也會發(fā)生極大變化。此外電影里的還存在光線過暗、遮擋、動作模糊等各種增加識別難度的障礙。這個更具有挑戰(zhàn)性的任務為人物搜索算法的未來發(fā)展提供了新的舞臺。
全球400余隊伍參賽各項目前三脫穎而出
WIDER Face and Pedestrian Challenge挑戰(zhàn)賽共吸引來自全球?qū)W術、產(chǎn)業(yè)界的432人/隊報名參賽,收到73支隊伍提交結果。參賽者來自中國、俄羅斯、日本、美國、澳大利亞等多個國家。參賽者隸屬的機構既包括中科院計算所、微軟亞洲研究院、北京大學、上海交通大學、中國科學院大學、中國科學技術大學、NtechLab、卡耐基梅隆大學、香港大學、香港理工大學、悉尼科技大學、日本中部大學、美國圣塔克拉拉大學、美國喬治城大學、伊利諾伊大學、慕尼黑理工大學等大學和研究機構,也有京東、雅虎、曠視、科大訊飛、滴滴等商業(yè)公司。
面對三個挑戰(zhàn)性極高,同時頗具實用價值的子任務,參賽隊伍們各展神通。WIDER Face人臉檢測任務比賽的三支獲獎隊伍,均使用了深度學習技術來設計實現(xiàn)人臉檢測算法,并且均使用或借鑒了特征金字塔的思想對主干網(wǎng)絡的特征進行增強,并對初始匹配模板(anchor box)進行了分組和重設計。冠軍隊伍還使用了模型融合來取得更好的結果。
在WIDER Pedestrian監(jiān)控和自動駕駛下的行人檢測任務中,獲勝者使用傳統(tǒng)Faster RCNN方法,利用ResNet網(wǎng)絡加金字塔結構(FPN)抽取并融合多層次語義特征。并通過在檢測模塊中添加級聯(lián)網(wǎng)絡(Cascade R-CNN),訓練得到更好的檢測框回歸器(bounding box regression),采用RoI-Align代替Faster RCNN中的RoI-Pooling,幫助檢測小尺度行人,使用注意力機制(channel-wise attention)處理遮擋問題。
在第三項子任務WIDER Person Search中,獲獎隊伍則都把任務拆分為兩個階段,第一個階段做人臉識別,把人臉相似度非常高的加入到查詢集(query expand)。第二階段做行人重識別,利用身體特征處理人臉特征無法準確判斷的待查詢圖片。最終綜合人臉和人體的特征相似度得到排序結果。冠軍和亞軍都使用了杰卡德距離和歐式距離來進行排序。
作為挑戰(zhàn)賽的聯(lián)合主辦方,商湯科技并未派隊伍參與此次競賽。挑戰(zhàn)賽頒獎儀式將于今年9月ECCV 2018會議期間在德國慕尼黑舉行,同時還將舉辦相關研討會。此外,全體獲獎者將被邀請共同撰寫競賽論文,并在ECCV2018研討會上做報告。競賽結束后,組織者仍會開放驗證集的測試服務器供參賽者進行科學研究。
商湯科技秉承“堅持原創(chuàng),讓AI引領人類進步”的使命,一直以來專注于推動計算機視覺與深度學習技術的發(fā)展,不但擁有自主研發(fā)的原創(chuàng)深度學習平臺Parrots和全球頂級超算中心,是亞洲最大的AI研發(fā)基地,同時以產(chǎn)學研協(xié)同創(chuàng)新的模式,借助在人臉識別、圖像識別等技術領域豐富的應用落地經(jīng)驗,不斷推動學術和工業(yè)界的緊密連接。通過舉辦WIDER Face and Pedestrian Challenge 2018挑戰(zhàn)賽,商湯科技以多年研究積累與落地經(jīng)驗反哺學術,制定全新行業(yè)標準,引領產(chǎn)業(yè)與學術發(fā)展潮流,推動計算機視覺領域技術進步。
關于商湯科技:
商湯科技SenseTime是全球領先的人工智能平臺公司,同時也是“全球最具價值的AI創(chuàng)新企業(yè)”。以20年人工智能科研技術為積淀,并以“堅持原創(chuàng),讓AI引領人類進步”為使命,商湯科技建立了全球頂級、自主研發(fā)的深度學習超算中心,是亞洲最大的AI研發(fā)基地;在人臉識別、圖像識別、文本識別、醫(yī)療影像識別、視頻分析、無人駕駛等技術領域的創(chuàng)新成果,支撐了十多個垂直行業(yè)的AI變革。
除了技術實力領跑行業(yè),商業(yè)營收方面,商湯科技的市場占有率亦居多個垂直領域首位。目前,商湯科技已與國內(nèi)外700多家知名高校、企業(yè)及機構建立合作,包括美國麻省理工學院、香港中文大學、Qualcomm、英偉達、本田、阿里巴巴、蘇寧、中國移動、銀聯(lián)、萬達、海航、華為、小米、OPPO、vivo、微博、科大訊飛、中央網(wǎng)信辦等,涵蓋智慧城市、智能手機、互娛廣告、汽車、金融、零售等諸多行業(yè),共同推動AI對各行業(yè)的技術升級,引領AI時代發(fā)展大潮。
2018年5月,商湯科技宣布完成6.2億美元C+輪融資,總?cè)谫Y額超過16億美元,估值超過45億美金,繼續(xù)保持全球總?cè)谫Y額最大、估值最高的人工智能獨角獸地位。商湯科技現(xiàn)已在香港、北京、深圳、上海、成都、杭州、日本京都、東京和新加坡成立分部,匯集世界各地頂尖人才,合力打造一家世界一流的原創(chuàng)人工智能技術公司。中國“智”造,“慧”及全球。
- 為什么年輕人不愛換手機了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應欠薪有補償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學
- 窺見“新紀元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進,核心技術決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領域達成戰(zhàn)略合作伙伴關系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。