推出面向企業(yè)的ProductAI 商品識別領域的AI賦能者

凱文·凱利曾說,未來20年最偉大的事情可能還沒有出現(xiàn),但可以預測的是,人工智能將是未來20年內(nèi)最重要的技術趨勢,創(chuàng)業(yè)企業(yè)的方向應該很明確,就是將人工智能應用于某個領域。

近兩年,人工智能創(chuàng)業(yè)公司如雨后春筍一般不斷涌現(xiàn),但是大部分的企業(yè)是關注于如何讓自家的產(chǎn)品更加智能,但有這么一家公司卻立下 flag,要做商品識別領域的人工智能賦能者,讓別人的產(chǎn)品更加智能。

專訪 AI,這家公司要做商品識別領域的 AI 賦能者" />

Matt Scott

在2017年北京GMIC大會期間,碼隆科技聯(lián)合創(chuàng)始人兼 CTO 碼特(Matt Scott)告訴雷鋒網(wǎng),和其他人工智能公司不同,碼隆科技是將商品識別方面的技術開放給其他企業(yè),使得他們能夠運用這些技術去搭建屬于自己的商品識別引擎。

而碼特提及的人工智能技術,碼隆科技已將其搭建成一個人工智能平臺—ProductAI

什么是ProductAI 平臺?

商品識別

在弄清楚 ProductAI 平臺之前,需要先介紹一下商品識別的概念。碼特告訴雷鋒網(wǎng),大家都熟悉人臉識別,通過人工智能分類技術可以提取出如性別、年齡、種族等信息,那么商品識別也類似,拿時尚領域來說,通過人工智能技術可以提取出服飾的材質、色彩、風格等特征。

但是區(qū)別之處在于,商品里既包含酒瓶、車輛、家具這樣的剛性物體,也包含服飾面料等易折疊的柔性物體。除了易褶皺這樣的屬性,柔性物體上的面料紋路和圖案也不盡相同,所以相對介于剛性和柔性之間的人臉,柔性物體的識別難度更大,而這個也正是碼隆科技投入大量精力去鉆研并且擅長的領域,碼特說。

專訪

ProductAI 的登錄界面

ProductAI

碼特告訴雷鋒網(wǎng),商品識別技術的背后需要有海量商品數(shù)據(jù)的支持,通過收集針對某些垂直行業(yè)的商品圖像數(shù)據(jù),運用適用于這個行業(yè)的算法去搭建這些垂直領域的模型,由此產(chǎn)生針對垂直領域的商品識別結果,如:分類(Classification)、檢測(Detection)、分割(Segmentation)、檢索(Retrieval)等等。

企業(yè)能夠運用這些功能去搭建他們自己的商品識別服務,而碼隆則將上述提供的服務進行整合,搭建成一個人工智能平臺—ProductAI。也就是說,ProductAI是企業(yè)運用人工智能商品識別服務的入口。

專訪

ProductAI的核心技術服務

據(jù)碼特介紹,針對垂直領域,ProductAI有兩大核心技術服務:

垂直領域圖像檢索(Vertical AI Image Retrieval)

垂直領域自動標注(Vertical Auto-Tagging)

垂直領域商品檢索服務

在圖像檢索方面,除了上文中提到的碼隆擅長的時尚、紡織面料等領域,碼特告訴雷鋒網(wǎng),現(xiàn)在又新增了在車輛、酒類、家具等垂直領域的模型,未來還將持續(xù)擴充人工智能在商品識別的垂直場景。

在擴充了使用場景后,問題也隨之而來:這個橫跨多領域的智能識別系統(tǒng),如何能保證其既能實時處理上億數(shù)據(jù),又能處理不同類別的調(diào)用請求? 還能保證高性價比?對此,碼特分享了碼隆的做法:

第一點:我們首次提出“場景選擇” (Scenario Selection)的概念,用戶可在圖像檢索服務中,選擇所屬行業(yè)的場景服務,然后運用到自己的產(chǎn)品中,以獲得最好的性能。提到圖像檢索服務,人們會想到谷歌和百度的以圖搜圖功能,但是他們大多使用的是通用模型,相較于我們使用垂直領域專用語言(Domain Specific Language)進行搜索引擎搭建,通用模型的商品檢索精確度往往差強人意。

第二點:算法。除了擁有億級以上的垂直行業(yè)圖像數(shù)據(jù)以外,在每個垂直行業(yè)的基礎上,我們使用了多任務的深度度量學習(Deep Metric Learning)來訓練端到端的圖像檢索模型,這使得我們相較于其他人工智能公司,在商品識別方面,特別是難度最大的柔性商品識別領域,能夠獲得更加精確的檢索結果。

關于精確度的考量,可以說碼隆現(xiàn)已在業(yè)內(nèi)遙遙領先,而且我們有信心與 CVPR, ICCV, ECCV 等國際頂尖論文的公開基準點(Public Benchmarks)進行比較。

第三點:速度。我們花費了非常多的精力將二值神經(jīng)網(wǎng)絡和分布計算的技術運用在深度學習網(wǎng)絡當中,以實現(xiàn)大規(guī)模且高效率的查詢檢索。

第四點:費用。我們一直在努力降低服務成本,以便讓更多企業(yè)能夠受益于這項服務。

垂直領域的商品圖像自動標注服務

專訪

如上圖所示,除了商品檢索之外,ProductAI 的圖像識別技術還能對圖片進行實體檢測,定位圖中實體,同時提供可定制的標注信息,碼特告訴雷鋒網(wǎng)。

說起圖像標注,碼特說,讓我們來聊一個當下比較熱的話題:如何提升訓練數(shù)據(jù)的效率?

對于人工智能公司而言,想要獲取到海量的有標注數(shù)據(jù)難度是比較大的,我們內(nèi)部有專門的團隊負責這部分的信息收集,從而提供數(shù)以百萬計的標注數(shù)據(jù),目前做得很不錯。

這個就是業(yè)界普遍在做的監(jiān)督學習,但我們同時也正在往半監(jiān)督學習(Semi-supervise Learning) 的階段前進,生成對抗網(wǎng)絡GAN(Generative Adversarial Networks)就是一種很好的方法。

有了生成對抗網(wǎng)絡,我們就可以不需要像過去那么多高質量的標簽數(shù)據(jù),而是通過一些技術去獲取這些數(shù)據(jù)。在以一定數(shù)量的標注數(shù)據(jù)作為訓練基礎的情況下,將這些技術應用于訓練分割、檢測、分類、圖像檢索這些任務,從而減輕訓練海量標注數(shù)據(jù)的負擔。

有哪些實際的應用?

以圖搜圖

1、布料搜索

專訪

顧名思義,通過在 ProductAI 平臺上建立的 “以圖搜布” 面料商品圖像搜索引擎,人們只需要對著想要購買的面料拍攝一張照片,系統(tǒng)會先識別出面料的圖形與花色,然后生成相應的購買鏈接。碼特說道,這個案例是 ProductAI 的第一個應用,目前中國前 10 大紡織面料企業(yè),有 7 家已經(jīng)接入了這個服務。

圖像搜索引擎有非常廣闊的行業(yè)應用空間,尤其針對一些難以用語言描述的場景,比如布料的花紋和質地,用視覺方式檢索就會很直接。碼特補充道。

2、時尚商品搜索

專訪

只要將服裝網(wǎng)站上的喜歡的款式截圖,復制粘貼到基于 ProductAI 的圖像搜索引擎上,便可以迅速得到服裝的批發(fā)購買鏈接。即使服裝商品圖片經(jīng)過PS、翻轉、變形,即使有些相同衣服的模特不同,也能夠搜索出來。同時,同樣款式的衣服可以一起被搜索出來,供消費者進行比價挑選。

時尚分析與趨勢預測

專訪

作為面料紡織行業(yè)權威機構,中國紡織信息中心需要預測流行色等未來的趨勢,再把預測信息和整個產(chǎn)業(yè)進行分享,起到引領風潮的作用。通過自動抽取海量T臺圖像信息中的主體色彩,ProductAI 能夠在短時間內(nèi)完成顏色分析,總結出整體趨勢,減少了人力觀測成本,碼特說。

出版物識別

專訪

ProductAI 還可以提供出版物識別技術,一個典型的例子是《光明日報》在嵌入人工智能識別技術后,只要對著報紙拍一張照片,便可實時識別出與之相關聯(lián)的全媒體信息,如視頻等,搭建起了虛擬與現(xiàn)實的橋梁。

碼隆科技創(chuàng)業(yè)路線

2014年7月,黃鼎隆與曾經(jīng)微軟的同事Matt Scott(碼特) 聯(lián)合創(chuàng)立了碼隆科技,可以看出公司的名稱就是兩位創(chuàng)業(yè)者名字的結合。

2015年1月,碼隆科技入選微軟創(chuàng)投加速器。同時推出了面向C端的以圖搜圖的移動應用StyleAI,希望用圖像識別結合深度學習來破解時尚密碼。

2015年3月,達晨創(chuàng)投和遠鏡創(chuàng)投共同為碼隆科技注入1200萬元天使投資。

2016年7月,碼隆科技完成了6200萬人民幣的A輪融資。

2016年10月,碼隆科技正式發(fā)布人工智能視覺應用平臺—ProductAI 。

對中美人工智能發(fā)展的看法

專訪

專訪

作為一個在中國創(chuàng)業(yè)的美國人,碼特擁有 40 多項中美專利、發(fā)表了 13 篇國際頂級論文,有著十多年的開發(fā)經(jīng)驗和微軟亞洲研究院高級研發(fā)主管的工作經(jīng)歷,所以談及中美在人工智能方面學術與商業(yè)化的話題,他感觸頗深:

就學術研究而言,根據(jù)2016年美國白宮發(fā)表的人工智能戰(zhàn)略報告,自2014年起,中國在人工智能領域所發(fā)表的論文與期刊數(shù)量,及被引用文章數(shù)皆已位居世界之首。中國近幾年在人工智能領域的研究發(fā)展已超越美國,成為世界領先的代表。

商業(yè)化方面,因為中國更大、人更多、企業(yè)也更多,同時中國專注于某些美國不會重點關注的領域,如:制造業(yè)、硬件等。在中國,人工智能更有機會在垂直行業(yè)中發(fā)揮更大的影響力。當人工智能遇上攝像頭這類的硬件產(chǎn)品,會發(fā)揮巨大的價值。而當人工智能助力制造業(yè)時,對全世界都能夠帶來更大的影響力。舉例來說在中國深圳,這個制造業(yè)之鄉(xiāng),機器人產(chǎn)業(yè)最為繁榮的中國城市,現(xiàn)階段達到如此巨大規(guī)模的發(fā)展,放眼世界,只有在中國才可能發(fā)生。

當雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))問及碼隆下一步的計劃時,碼特的回答簡潔而有力,我們希望能夠在垂直領域做得更加深入,并進軍國際市場。

凱文·凱利曾說,未來20年最偉大的事情可能還沒有出現(xiàn),但可以預測的是,人工智能將是未來20年內(nèi)最重要的技術趨勢,創(chuàng)業(yè)企業(yè)的方向應該很明確,就是將人工智能應用于某個領域。

近兩年,人工智能創(chuàng)業(yè)公司如雨后春筍一般不斷涌現(xiàn),但是大部分的企業(yè)是關注于如何讓自家的產(chǎn)品更加智能,但有這么一家公司卻立下 flag,要做商品識別領域的人工智能賦能者,讓別人的產(chǎn)品更加智能。

專訪

Matt Scott

在2017年北京GMIC大會期間,碼隆科技聯(lián)合創(chuàng)始人兼 CTO 碼特(Matt Scott)告訴雷鋒網(wǎng),和其他人工智能公司不同,碼隆科技是將商品識別方面的技術開放給其他企業(yè),使得他們能夠運用這些技術去搭建屬于自己的商品識別引擎。

而碼特提及的人工智能技術,碼隆科技已將其搭建成一個人工智能平臺—ProductAI。

什么是ProductAI 平臺?

商品識別

在弄清楚 ProductAI 平臺之前,需要先介紹一下商品識別的概念。碼特告訴雷鋒網(wǎng),大家都熟悉人臉識別,通過人工智能分類技術可以提取出如性別、年齡、種族等信息,那么商品識別也類似,拿時尚領域來說,通過人工智能技術可以提取出服飾的材質、色彩、風格等特征。

但是區(qū)別之處在于,商品里既包含酒瓶、車輛、家具這樣的剛性物體,也包含服飾面料等易折疊的柔性物體。除了易褶皺這樣的屬性,柔性物體上的面料紋路和圖案也不盡相同,所以相對介于剛性和柔性之間的人臉,柔性物體的識別難度更大,而這個也正是碼隆科技投入大量精力去鉆研并且擅長的領域,碼特說。

專訪

ProductAI 的登錄界面

ProductAI

碼特告訴雷鋒網(wǎng),商品識別技術的背后需要有海量商品數(shù)據(jù)的支持,通過收集針對某些垂直行業(yè)的商品圖像數(shù)據(jù),運用適用于這個行業(yè)的算法去搭建這些垂直領域的模型,由此產(chǎn)生針對垂直領域的商品識別結果,如:分類(Classification)、檢測(Detection)、分割(Segmentation)、檢索(Retrieval)等等。

企業(yè)能夠運用這些功能去搭建他們自己的商品識別服務,而碼隆則將上述提供的服務進行整合,搭建成一個人工智能平臺—ProductAI。也就是說,ProductAI是企業(yè)運用人工智能商品識別服務的入口。

專訪

ProductAI的核心技術服務

據(jù)碼特介紹,針對垂直領域,ProductAI有兩大核心技術服務:

垂直領域圖像檢索(Vertical AI Image Retrieval)

垂直領域自動標注(Vertical Auto-Tagging)

垂直領域商品檢索服務

在圖像檢索方面,除了上文中提到的碼隆擅長的時尚、紡織面料等領域,碼特告訴雷鋒網(wǎng),現(xiàn)在又新增了在車輛、酒類、家具等垂直領域的模型,未來還將持續(xù)擴充人工智能在商品識別的垂直場景。

在擴充了使用場景后,問題也隨之而來:這個橫跨多領域的智能識別系統(tǒng),如何能保證其既能實時處理上億數(shù)據(jù),又能處理不同類別的調(diào)用請求? 還能保證高性價比?對此,碼特分享了碼隆的做法:

第一點:我們首次提出“場景選擇” (Scenario Selection)的概念,用戶可在圖像檢索服務中,選擇所屬行業(yè)的場景服務,然后運用到自己的產(chǎn)品中,以獲得最好的性能。提到圖像檢索服務,人們會想到谷歌和百度的以圖搜圖功能,但是他們大多使用的是通用模型,相較于我們使用垂直領域專用語言(Domain Specific Language)進行搜索引擎搭建,通用模型的商品檢索精確度往往差強人意。

第二點:算法。除了擁有億級以上的垂直行業(yè)圖像數(shù)據(jù)以外,在每個垂直行業(yè)的基礎上,我們使用了多任務的深度度量學習(Deep Metric Learning)來訓練端到端的圖像檢索模型,這使得我們相較于其他人工智能公司,在商品識別方面,特別是難度最大的柔性商品識別領域,能夠獲得更加精確的檢索結果。

關于精確度的考量,可以說碼隆現(xiàn)已在業(yè)內(nèi)遙遙領先,而且我們有信心與 CVPR, ICCV, ECCV 等國際頂尖論文的公開基準點(Public Benchmarks)進行比較。

第三點:速度。我們花費了非常多的精力將二值神經(jīng)網(wǎng)絡和分布計算的技術運用在深度學習網(wǎng)絡當中,以實現(xiàn)大規(guī)模且高效率的查詢檢索。

第四點:費用。我們一直在努力降低服務成本,以便讓更多企業(yè)能夠受益于這項服務。

垂直領域的商品圖像自動標注服務

專訪

如上圖所示,除了商品檢索之外,ProductAI 的圖像識別技術還能對圖片進行實體檢測,定位圖中實體,同時提供可定制的標注信息,碼特告訴雷鋒網(wǎng)。

說起圖像標注,碼特說,讓我們來聊一個當下比較熱的話題:如何提升訓練數(shù)據(jù)的效率?

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2017-05-19
推出面向企業(yè)的ProductAI 商品識別領域的AI賦能者
凱文·凱利曾說,未來20年最偉大的事情可能還沒有出現(xiàn),但可以預測的是,人工智能將是未來20年內(nèi)最重要的技術趨勢,創(chuàng)業(yè)企業(yè)的方向應該很明確,就是將人工智能應用于某

長按掃碼 閱讀全文