作者:ImageDT圖匠數(shù)據(jù)
人工智能一浪接一浪地席卷全球,AI的其中一個重要分支——計算機視覺,也如雨后春筍,不斷涌現(xiàn)出新的想法和應(yīng)用。人臉識別已經(jīng)逐漸滲透我們的日常生活,機器能夠認(rèn)準(zhǔn)人臉,想必大家都有所耳聞;而另一類計算機視覺的應(yīng)用,是進行商品識別。
當(dāng)前新興的一些無人零售店,背后就需要機器對商品進行自動識別,拍圖購物、AR互動營銷等場景,也運用了商品識別技術(shù)。人工智能商業(yè)公司ImageDT,則利用商品圖像識別技術(shù)提供2B商業(yè)服務(wù),包括基于互聯(lián)網(wǎng)圖片大數(shù)據(jù)的商業(yè)分析,以及基于門店貨架識別的渠道數(shù)據(jù)洞察,幫助消費品企業(yè)提升業(yè)績。今天,圖醬就跟大家科普應(yīng)用在無人店、新零售中的商品識別技術(shù)。
數(shù)據(jù)邏輯
1?讓小孩“記住”超市里的所有商品
我們教一個小孩識物的時候,比如“蘋果”,首先要讓他反復(fù)的看到 “蘋果”,他便能認(rèn)識“蘋果”;他可能會認(rèn)錯,把“梨”認(rèn)成“蘋果”,這個時候應(yīng)該幫他指出來。小孩看到的“蘋果”越多,辨識的能力就越強。
基于深度神經(jīng)網(wǎng)絡(luò)的人工智能,讓機器具備理解的能力,基本過程就像教一個小孩認(rèn)蘋果一樣。首先要有大量的數(shù)據(jù), 比如“蘋果”的圖片;同時,要增加大量機器會認(rèn)錯的“負(fù)樣本”,比如“梨”的圖片;然后經(jīng)過一個深度神經(jīng)網(wǎng)絡(luò),反復(fù)學(xué)習(xí),最終獲得一個有效的識別模型。對于快消商品的識別,我們不僅要認(rèn)出一個瓶子包裝,還要認(rèn)出是一瓶酸奶還是啤酒;不僅要認(rèn)出酸奶,還要認(rèn)出是哪個品牌的酸奶,甚至是哪個口味和規(guī)格。要讓機器能夠準(zhǔn)確識別成千上萬的快消商品SKU,是一項極其龐大而復(fù)雜的AI工程。
數(shù)據(jù)采集
2?讓機器獲得學(xué)習(xí)的原始素材
首先,我們需要梳理出所有的目標(biāo)商品清單,并設(shè)法獲得每一件商品的圖片數(shù)據(jù)。根據(jù)商品的特征辨識度,通常需要幾十到幾百張的有效圖片。數(shù)據(jù)采集是一套組合拳。電商平臺上擁有結(jié)構(gòu)化的商品介紹圖片以及大量的買家曬圖,社交平臺上也能獲取到大量的消費者曬圖,是性價比最高的數(shù)據(jù)源。超市店內(nèi)的真實貨架數(shù)據(jù),是最可靠的數(shù)據(jù)源,但獲取和后期處理的成本都比較高。除此之外,ImageDT還通過自主研發(fā)智能燈箱和智能采集車,模擬各種不同的場景對商品進行360°拍攝從而建立龐大的訓(xùn)練數(shù)據(jù)庫,以此來獲取最豐富的訓(xùn)練數(shù)據(jù)。
數(shù)據(jù)標(biāo)注
3?有多少人工,才有多少智能采集到原始圖片數(shù)據(jù),通常會混雜許多“臟數(shù)據(jù)”,需要進行清洗;大部分情況下,還需要對圖片中的物體進行標(biāo)注和分類。只有可靠的數(shù)據(jù)才能產(chǎn)生高質(zhì)量的識別模型。在每一個人工智能公司,都有一支特殊的軍隊——數(shù)據(jù)標(biāo)注團隊。ImageDT也不例外,在背后支撐這個團隊的是一個充滿黑科技的標(biāo)注系統(tǒng)。
比如,圖片在標(biāo)注前通常會先經(jīng)過弱模型的處理,讓機器先解決?50%的問題;系統(tǒng)有支持批量標(biāo)注的小圖模式,讓標(biāo)注員可以一目十行,成倍提高標(biāo)注的速度;產(chǎn)品經(jīng)理反復(fù)打磨每一個功能,做A/B測試,從每處細(xì)節(jié)提高標(biāo)注的體驗和效率。除此之外,標(biāo)注團隊還為不同任務(wù)配置了不同等級的質(zhì)量保證機制,包括抽樣審核、全量審核、交叉校驗、埋點校驗等,確保讓機器學(xué)習(xí)最準(zhǔn)確最可靠的訓(xùn)練數(shù)據(jù)。
模型訓(xùn)練
4?“活到老學(xué)到老”,機器也要不斷學(xué)習(xí)
準(zhǔn)備好了數(shù)據(jù),下一步就是讓機器進行學(xué)習(xí),建立識別模型的過程。同樣的數(shù)據(jù),選擇不同的神經(jīng)網(wǎng)絡(luò)算法、以及不同的參數(shù)設(shè)置,將會影響最終模型的效果。模型建立之后,還需要進行管理:模型之間存在層次關(guān)系,數(shù)據(jù)和模型會存在版本的迭代,這些問題,當(dāng)遇到大量商品類別的時候,顯得非常艱難。在ImageDT內(nèi)部,有一個自助式的深度學(xué)習(xí)平臺,支持拖拉拽的算法和參數(shù)測試,甚至一個非程序員都可以傻瓜式的完成一次建模任務(wù),并獲得模型的效果評估報告。每一位ImageDT的新員工,不管是工程師,還是前臺,都會接受一次半小時的建模培訓(xùn);而在培訓(xùn)結(jié)束后,每個人都將能夠獨立的建立一個圖像識別模型,整個過程只需要半小時。
同時,深度學(xué)習(xí)平臺就像一個模型倉庫,兼顧著對象、數(shù)據(jù)和模型的管理。整個建模的過程已經(jīng)標(biāo)準(zhǔn)化,最快只需要一天,就能完成從數(shù)據(jù)采集、標(biāo)注、建模到上線的整個流程。ImageDT的研發(fā)團隊分為四個組,產(chǎn)品組、建模組、數(shù)據(jù)組和研究組。前三個組,負(fù)責(zé)實現(xiàn)流水線的搭建和經(jīng)營,使得每天都能井井有條地建立大量新的商品識別模型,并快速上線,對每天數(shù)千萬的圖片數(shù)據(jù)進行識別和分析。研究組,則要克服各種疑難雜癥,比如容易產(chǎn)生褶皺的軟包裝、商品側(cè)面和背面的識別、遮擋和反光環(huán)境下的識別等等。
目前,在實際生產(chǎn)環(huán)境下,已經(jīng)達到95%以上的識別準(zhǔn)確率。人臉都有眼睛、鼻子、嘴巴等固定的特征,而超市中琳瑯滿目的商品,則千奇百態(tài)。與人臉識別相比,商品識別有更高的工程復(fù)雜度。ImageDT正在做的,就是實現(xiàn)這個龐大的AI工程,讓機器能夠自動地、準(zhǔn)確地識別每一件商品。零售智能貨架演示
- 消息稱去年全球IT支出超過5萬億美元 數(shù)據(jù)中心系統(tǒng)支出大幅增加
- 2025年全球數(shù)據(jù)中心:數(shù)字基礎(chǔ)設(shè)施的演變
- 谷歌押注多模態(tài)AI,BigQuery湖倉一體是核心支柱
- 數(shù)字化轉(zhuǎn)型支出將飆升:到2027年將達到4萬億美元
- 量子與人工智能:數(shù)字化轉(zhuǎn)型的力量倍增器
- 華為OceanStor Dorado全閃存存儲榮獲CC認(rèn)證存儲設(shè)備最高認(rèn)證級別證書
- 2024年終盤點 | 華為攜手伙伴共筑鯤鵬生態(tài),openEuler與openGauss雙星閃耀
- 特朗普宣布200億美元投資計劃,在美國多地建設(shè)數(shù)據(jù)中心
- 工信部:“點、鏈、網(wǎng)、面”體系化推進算力網(wǎng)絡(luò)工作 持續(xù)提升算網(wǎng)綜合供給能力
- 2025年超融合基礎(chǔ)設(shè)施的4大趨勢
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。