2018年7月,在國際權(quán)威計算機視覺競賽PASCAL VOC comp4目標檢測競賽中,Yi+ AI團隊獲得了目標檢測單模型第一名,超越了現(xiàn)有排行榜中的微軟研究院、谷歌 、阿里達摩院、Face++等國內(nèi)外眾多知名公司,以精度90.7%的成績打破了世界記錄,成為世界第一家總成績突破90%計算機視覺企業(yè)。同時在Pascal VOC“comp3”中,首次突破80%,刷新世界紀錄。
Pascal VOC comp4是眾多國內(nèi)外企業(yè)物體檢測團隊證明自己實力的地方,此次Yi+力壓群雄,取得了90.7%的成績,比第二名的阿里達摩院高了1.5個百分點,在物體檢測領(lǐng)域,1.5個百分點意味著需要比對方“多”檢測正確6000多個框,同時值得注意的是,此次Yi+AI團隊使用的是難度更高的單模型,而第二名的方法是多模型融合。
PASCAL VOC可謂視覺識別類競賽的鼻祖,包含了物體分類、目標檢測、圖像分割等任務(wù)。PASCAL VOC對計算機視覺的發(fā)展具有深遠而巨大的影響,后續(xù)的ImageNet競賽的任務(wù)設(shè)置就基本沿用了它的設(shè)定。此前,微軟、英特爾、CMU、Facebook、UC Berkeley等國際頂尖研發(fā)團隊先后在這個排行榜上刷新紀錄。
Yi+AI的負責人表示,在此次Pascal VOC comp4競賽中,Yi+AI團隊使用的方法叫做FXRCNN,其中“X”,代表“多元”的意思,意味著Yi+AI使用的結(jié)構(gòu)不僅僅是高準確率的模型,同時也適用多元場景,包括移植到移動端(通過更改Backbone和Head),實現(xiàn)圖像分割(增加Mask分支),實現(xiàn)人體關(guān)鍵點(增加Key point分支),實現(xiàn)人臉檢測(增加Face分支)。
Yi+提交的深度學習模型,雖然采用了Faster RCNN的基本結(jié)構(gòu),但有很多不同之處:1)采用ResNeXt作為基礎(chǔ)網(wǎng)絡(luò),結(jié)合FPN實現(xiàn)多尺度特征融合,2)在后處理階段,采用SoftNMS和多框投票融合;3)通過Yi+海量數(shù)據(jù)進行預(yù)訓練;4)多尺度訓練,進一步加強數(shù)據(jù)增強。
近年來Yi+不斷加大對人工智能、大數(shù)據(jù)等新技術(shù)的研發(fā)和應(yīng)用,本次提交的模型,是Yi+多年來技術(shù)積累的結(jié)果,是通過不斷的攻克實際問題的結(jié)果,是Yi+內(nèi)部模型不斷優(yōu)化的結(jié)果,Yi+ AI的FXRCNN在速度,內(nèi)存,精度,應(yīng)用范圍等多維度進行了全面的優(yōu)化。
在人工智能領(lǐng)域,目標檢測技術(shù)應(yīng)用廣泛,是Yi+AI場景落地的關(guān)鍵性技術(shù)之一。Yi+將目標檢測技術(shù)應(yīng)用在圖像搜索引擎和圖片視頻結(jié)構(gòu)化引擎中,Yi+圖像搜索引擎可檢測類目超100類,覆蓋服飾、3C商超、家居、日用品、交通工具等;Yi+圖片視頻結(jié)構(gòu)化引擎則采用目前業(yè)界最領(lǐng)先的基于深度學習的通用目標檢測算法,支持超過300類常用物體的目標檢測、識別,可實現(xiàn)對視頻和圖像中的場景、人、車輛、物體(輪廓)檢測、識別、分割、跟蹤;可識別近10,000種物品,400種場景。
目前Yi+AI已將目標檢測技術(shù)應(yīng)用在多個使用場景中,包括“智能硬件”、“營銷”、“新零售”、“智慧城市”等解決方案,具體則應(yīng)用在場景廣告平臺、新零售平臺、大屏AI助手、智慧安防、智慧交通、智慧社區(qū)等多項領(lǐng)域之中。
下一步,Yi+將結(jié)合現(xiàn)有技術(shù)優(yōu)勢繼續(xù)深耕智慧城市、新零售、智能營銷、智能硬件等多個領(lǐng)域,讓計算機看懂世界,用科技提供人工智能服務(wù),幫助人們看見非凡,see different。
Yi+獲得阿里巴巴等B輪融資。服務(wù)了眾多500強客戶。團隊成員大多來自頂尖企業(yè)與高校,如哥倫比亞大學、帝國理工、耶魯、普林斯頓、普渡大學、新加坡國大、南洋理工、清華、北大等及微軟、IBM、英特爾、阿里巴巴、騰訊、百度、華為等企業(yè)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 現(xiàn)代汽車:明年起為電動車用戶免費提供NACS適配器,開啟智能出行新篇章
- 特斯拉Model Y優(yōu)惠大放送:尾款減1萬,5年0息貸政策再續(xù)1個月
- 半導(dǎo)體未來之三大支柱:智造封裝、微縮晶體管與革新互連,共創(chuàng)智能時代
- 蘋果破局:iPhone 18 Pro系列顛覆性革新,首次實現(xiàn)可變光圈,拍照體驗再升級
- 電動飛機初創(chuàng)公司Lilium裁員1000人:從輝煌到衰落的啟示
- 法拉第未來神秘新品牌FX將在拉斯維加斯揭開神秘面紗,顛覆未來駕駛體驗
- 肯德基漲價引爭議:瘋狂星期四不加價,能否平息市場風波?
- 豐田汽車在華戰(zhàn)略大調(diào)整:電動雷克薩斯工廠獨資進軍上海,2027年搶占市場先機
- 蘋果M5芯片即將問世:新一代MacBook Pro蓄勢待發(fā)
- 劉強東兌現(xiàn)承諾,京東員工年終獎爆表:5-8個月工資,你心動了嗎?
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。