騰訊優(yōu)圖再次刷新三大ReID公開數(shù)據(jù)集紀(jì)錄,首位命中率最高近99%

近日,騰訊優(yōu)圖實(shí)驗(yàn)室在行人重識別(ReID)技術(shù)上再次取得突破,通過引入跨場景ReID,其ReID模型性能刷新了三大權(quán)威主流ReID公開數(shù)據(jù)集CUHK03,DUKE-MTMC和Market1501的記錄,算法關(guān)鍵指標(biāo)首位命中率(RANK1 Accuracy)和平均精度均值(Mean Average Precision)獲得業(yè)內(nèi)最好成績。

表1: ReID公開數(shù)據(jù)集性能比較

騰訊優(yōu)圖再次刷新三大ReID公開數(shù)據(jù)集紀(jì)錄,首位命中率最高近99%

  數(shù)據(jù)來源于網(wǎng)絡(luò)

行人重識別(Person ReID)是指對不同攝像機(jī)捕捉到的行人圖像建立身份對應(yīng)關(guān)系(即關(guān)聯(lián)行人ID),對行人實(shí)現(xiàn)在整個(gè)場景下的行動(dòng)路線的全面刻畫。簡單來說,在看不到人臉的復(fù)雜多場景下也能通過體態(tài)等對人進(jìn)行識別。相較于人臉識別技術(shù),ReID對人體圖像的遮擋、朝向和清晰度具有較高的魯棒性,對攝像頭的清晰度、架設(shè)位置、角度沒有硬性要求。正因此ReID技術(shù)成為繼人臉識別技術(shù)后計(jì)算機(jī)視覺領(lǐng)域又一熱門課題。

鑒于ReID技術(shù)的技術(shù)優(yōu)勢和在各個(gè)領(lǐng)域的廣泛應(yīng)用前景,近年來,騰訊優(yōu)圖在這一方向上做出了大量技術(shù)投入和全面的技術(shù)布局,在CVPR、TPAMI、AAAI、IJCAI等國際頂級學(xué)術(shù)會(huì)議和期刊上發(fā)表了超過15篇相關(guān)領(lǐng)域?qū)W術(shù)論文。

騰訊優(yōu)圖再次刷新三大ReID公開數(shù)據(jù)集紀(jì)錄,首位命中率最高近99%

圖一:行人ReID示意圖

雖然ReID技術(shù)已經(jīng)過多年的演進(jìn),但現(xiàn)實(shí)中復(fù)雜多變的場景,也讓跨場景識別(cross-domain person re-identification)成為ReID技術(shù)的一大難題,此次騰訊優(yōu)圖刷新三大數(shù)據(jù)集所引入的跨場景ReID,便是在此難點(diǎn)上進(jìn)行了技術(shù)突破。

跨場景識別的難點(diǎn)在于,不同場景由于環(huán)境光照、攝像頭角度、背景等因素,例如室內(nèi)大型商場、小型門店的側(cè)面和高俯角相機(jī)、室外道路、社區(qū)的強(qiáng)光和夜晚環(huán)境等,都會(huì)對人體圖像的視覺特征造成影響。如何讓ReID技術(shù)適應(yīng)復(fù)雜多變的場景,實(shí)現(xiàn)跨場景行人圖像的檢索,是一項(xiàng)重大的技術(shù)挑戰(zhàn),也是實(shí)現(xiàn)室內(nèi)外行人動(dòng)線聯(lián)動(dòng)、全城聯(lián)動(dòng)的關(guān)鍵性技術(shù)。突破此技術(shù)難點(diǎn)對拓展ReID的落地場景和業(yè)態(tài),實(shí)現(xiàn)大規(guī)模行人識別有巨大的作用。

騰訊優(yōu)圖再次刷新三大ReID公開數(shù)據(jù)集紀(jì)錄,首位命中率最高近99%

圖二:公開數(shù)據(jù)集MSMT17中的室內(nèi)外行人圖像視覺差異

為解決ReID技術(shù)難點(diǎn),騰訊優(yōu)圖通過在遮擋匹配、全角度匹配、跨域檢索等業(yè)務(wù)問題上的針對性優(yōu)化,以及在模型結(jié)構(gòu)、損失函數(shù)、訓(xùn)練算法等各項(xiàng)技術(shù)上的大量積累和創(chuàng)新,提出了一種跨場景行人重識別技術(shù)框架,采用基于圖卷積和孿生網(wǎng)絡(luò)的模型,使得神經(jīng)網(wǎng)絡(luò)對多朝向、多姿態(tài)等跨場景的人體具有更強(qiáng)的識別能力。這一技術(shù)能夠?yàn)椴煌瑘鼍?、不同拍攝角度和光照條件的行人視覺特征學(xué)習(xí)統(tǒng)一的特征表達(dá),有效提升了ReID技術(shù)在行人圖像室內(nèi)外、跨場景的相互檢索的精度。

騰訊優(yōu)圖再次刷新三大ReID公開數(shù)據(jù)集紀(jì)錄,首位命中率最高近99%

圖三:跨場景行人重識別

通過引入跨場景ReID,騰訊優(yōu)圖在三個(gè)數(shù)據(jù)集中刷新業(yè)內(nèi)最好的水平,其中Market-1501數(shù)據(jù)集的RANK1達(dá)到98.99%。RANK1和MAP作為衡量ReID技術(shù)水平的核心指標(biāo),首位命中率高,就意味著算法能夠在眾多圖像中準(zhǔn)確找出最容易識別或匹配的那張。

在此基礎(chǔ)上,騰訊優(yōu)圖的ReID算法在多場景行人圖像相互檢索也處于業(yè)界領(lǐng)先水平,在跨場景ReID數(shù)據(jù)集MSMT-17上超越已有算法達(dá)到業(yè)內(nèi)頂尖水平。

表2:跨場景行人重識別性能比較

騰訊優(yōu)圖再次刷新三大ReID公開數(shù)據(jù)集紀(jì)錄,首位命中率最高近99%

騰訊優(yōu)圖的ReID技術(shù)不僅在相關(guān)數(shù)據(jù)集上已經(jīng)取得了領(lǐng)先的性能,依托ReID技術(shù)的應(yīng)用系統(tǒng)也已在多種場景達(dá)到商用水平并實(shí)現(xiàn)廣泛落地。未來,隨著跨場景行人重識別能力的逐步成熟,騰訊優(yōu)圖的ReID技術(shù)也將在更多的場景和業(yè)態(tài)實(shí)現(xiàn)價(jià)值。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )