讓AI更懂人,OPPO獲人工智能頂會CVPR 2021多項佳績

近日,一年一度的全球計算機視覺頂級會議CVPR落下帷幕。OPPO在本次會議上屢獲佳績,在六大賽道共十二項賽項中取得一項第一,七項第二,四項第三,排名僅次于百度等國內(nèi)第一梯隊的參賽選手,再次展示了OPPO強勁的AI創(chuàng)新實力。

本次參加CVPR2021競賽的團隊是來自O(shè)PPO研究院智能感知與交互研究部和OPPO美國研究所,他們先后在多目標行為分析、足球行為分析、長視頻理解、時空行為檢測、跨模態(tài)分析及人機交互識別六大賽道上取得優(yōu)異的成績。他們通過對算法的優(yōu)化、訓練,不斷強化OPPO的AI能力,讓AI更好地為人類服務(wù),讓AI更懂人。

而由OPPO智能感知首席科學家郭彥東與清華學者等共同發(fā)表的論文《View-GuidedPointCloudCompletion》,也被本次CVPR收錄。該論文通過執(zhí)行有效的跨模態(tài)和跨級別融合框架,為點云補全任務(wù)提出了一套視圖引導的全新解決方案。

其中,OPPO在多目標行為分析(Multi-AgentBehavior)賽道中收獲頗豐,其所應(yīng)用的AI算法能基于特征點信息準確判別、預(yù)測動物及人在復雜交互內(nèi)容下的行為。OPPO憑借著領(lǐng)先的AI算法能力,從全球240多個頂尖參賽團隊中脫穎而出,獲得子賽項少樣本行為分類任務(wù)(LearningNewBehavior)第一,及傳統(tǒng)分類(ClassicalClassification)與標注風格遷移任務(wù)(AnnotationStyleTransfer)賽項的第二與第三名。目前,這項技術(shù)正在OPPO智慧工廠發(fā)揮作用,生產(chǎn)線上的工人們在這套算法的輔助下,可以避免關(guān)鍵生產(chǎn)環(huán)節(jié)的錯漏錯放,讓自身和產(chǎn)線更安全。

多目標行為分析賽道

從計算智能到人本智能,OPPO讓AI更“懂”人

在基于多張2D圖片的3D人臉重建(3DFaceReconstructionFromMultiple2DImages)挑戰(zhàn)賽中,OPPO自研的AI算法所還原的三維人臉模型與真實人臉誤差僅為1mm左右,在主要指標成績排名中取得第二名。該算法克服了在實際生活中,特別是動態(tài)視頻拍攝時,因為動作導致的人臉五官點不明晰、表情夸張、甚至圖片數(shù)據(jù)失真等問題。

事實上,OPPO自研的人臉檢測算法已能夠識別635個人臉特征關(guān)鍵點,并實現(xiàn)30次/秒的高速運行。在不久前發(fā)布的OPPOReno6系列上,依托于該算法架構(gòu)的AI煥采美妝視頻技術(shù)為用戶輕松打造了動態(tài)的自然美妝效果。這項技術(shù)將推動人像視頻技術(shù)“升維”進化,以3D級的特征點識別、令“上妝”效果更服帖;也將在社交平臺上制作出更豐富更貼合的AR特效,實現(xiàn)“上鏡自由”讓用戶在日常生活中享受到技術(shù)帶來的美好瞬間。

基于多張2D圖片的3D人臉重建賽項

讓AI理解我們所處的時間和空間

OPPO的AI能力目前已發(fā)展到可以識別人在時空環(huán)境中的行為狀態(tài)了。在足球行為分析(SoccerNet)賽道中,OPPO取得動作定位(ActionSpotting)和回放定位(ReplayGrounding)兩個賽項第二名,僅次于百度。這項挑戰(zhàn)需要在一段足球比賽視頻中辨別出十幾種關(guān)鍵動作,包括越位、紅牌等行為。這些動作基礎(chǔ)規(guī)則復雜,動作幅度小,連人類都很難識別出來。同時AI算法還需要排除攝影機位等干擾因素,準確定位回放片段在原始比賽視頻中發(fā)生的時間點。在不久的將來,這項技術(shù)將為體育愛好者們帶來福利,在比賽后AI可以實時整理精彩集錦。在該技術(shù)的幫助下,手機相冊也可以自動制作類似“精彩一周”的視頻集錦,讓用戶可以隨時回顧自己生活中的美好瞬間。

足球行為分析賽道

在跨模態(tài)行為分析(MMact)賽道上,OPPO分別在行為識別(Cross-ModalActionRecognition)與行為定位(Cross-ModelActionTemporalLocalization)兩個子賽項中取得第二名的成績。OPPO強大的AI算法僅通過視覺信息便可準確識別一段視頻中人物在特定空間內(nèi)發(fā)生的交談、屈膝、走動等十余種動作。這種行為識別和行為定位在未來有望成為家中的貼心保鏢。當父母不在身邊時,AI可以在寶寶下意識做出危險性動作的時候,及時提醒父母,避免寶寶受到傷害。

此外,OPPO還在時空行為定位(AVA-Kinetics)賽道獲得第三名。AVA數(shù)據(jù)集作為行業(yè)內(nèi)第一個開辟時空行為檢測的數(shù)據(jù)集,使用該數(shù)據(jù)集的定位賽項歷來是人工智能的熱門賽道之一,每年不乏國際頂尖科技公司與院校的知名團隊參與其中。時空行為定位算法不僅可以準確識別視頻中人們的行為,還可以同步定位其所處的時間段和空間范圍。這也意味著,OPPO的AI技術(shù)不僅能理解你在做什么,還可以在時空中“找到”你。

OPPO正在向更高維度的AI技術(shù)探索

本次CVPR上,OPPO在學術(shù)界前沿領(lǐng)域長視頻理解(LOVEU,Long-formVideoUnderstanding)挑戰(zhàn)中,獲得兩大賽項第三名。這賽道對算法的泛化性提出了極大挑戰(zhàn),它需要AI在預(yù)先沒有特定分類標準的情況下,自行理解視頻的意義并分割出其邊界的時間段落。AI需要像人一樣思考,理解視頻中人類動作、顏色、物品、乃至光源的變化,并對變化點進行判斷。未來,這項技術(shù)可以廣泛應(yīng)用在視頻領(lǐng)域,作為AI處理視頻的基礎(chǔ)工序,為后續(xù)包括人臉識別、行為識別等AI任務(wù)的選擇和執(zhí)行奠定基礎(chǔ)。

OPPO研究院美國研究所參與了稠密深度估計挑戰(zhàn)賽道,展示了能夠基于2D圖像輸出稠密3D深度信息的技術(shù),獲得自監(jiān)督學習賽項第二名的成績,并獲得“最佳創(chuàng)意獎”。該技術(shù)通過利用深度學習模型直接從普通圖像輸出深度信息,未來有可能替代ToF這樣的深度傳感器,帶來體驗更好的室內(nèi)外導航。

OPPO始終秉持著“科技為人以善天下”的企業(yè)使命,在構(gòu)建自身AI能力時也一直圍繞著“以人為本”不斷努力,向著更智能、更前沿的方向努力,讓AI能夠真正地為人所用,為我們帶來更智能更便捷的生活。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-06-24
讓AI更懂人,OPPO獲人工智能頂會CVPR 2021多項佳績
近日,一年一度的全球計算機視覺頂級會議CVPR(Conference on Computer Vision and Pattern Recognition)落下

長按掃碼 閱讀全文