超盟數(shù)據(jù)李健豪——硅谷極客如何挖掘國內(nèi)零售大數(shù)據(jù)“金礦”

超盟數(shù)據(jù)CTO李健豪

在校創(chuàng)業(yè)被收購,進入亞馬遜和IBM研究數(shù)據(jù)挖掘

從澳門高中畢業(yè)后,李健豪來到美國UIUC(伊利諾伊大學厄巴納-香檳分校)攻讀CS專業(yè)。大學期間,一位在保險公司實習的朋友向他抱怨,手動填寫保單費時費力還難以保證準確性。2010年還未畢業(yè)的李健豪創(chuàng)辦Synchronize,通過實現(xiàn)保單簽名電子化來改進傳統(tǒng)的保險行業(yè)。在拿下美國三家最大保險公司后,公司進入快速發(fā)展期,并成功被收購。

隨后,抱有更遠大志向的李健豪進入亞馬遜,在支付部門處理數(shù)據(jù)流。一年多的時間里,李健豪對數(shù)據(jù)挖掘產(chǎn)生了濃厚的興趣,便決定重返校園,師從全球大數(shù)據(jù)專家被譽為“數(shù)據(jù)挖掘第一人”的韓家煒教授專門研究數(shù)據(jù)挖掘,而具體的研究方向,便是通過數(shù)據(jù)挖掘來研究用戶的購買行為。

當時,李健豪所在的實驗室和IBM合作拿到了顆粒度很細的數(shù)據(jù),也通過研究順利拿到和購買行為相關的專利。但對于李健豪來說,他想要做的不僅是學術科研,更想把研究應用起來。

一直以來,李健豪對零售都有很濃厚的興趣:為什么一款產(chǎn)品換了新的包裝就會有新的購買群體?人們選擇購買或者不購買背后的邏輯是什么?

2015年,李健豪創(chuàng)立StylePuzzle,通過數(shù)據(jù)挖掘解決新產(chǎn)品的市場定價問題,并成功拿到真格基金百萬美元投資。

有意思的是,李健豪發(fā)現(xiàn)StylePuzzle的大部分客戶來自北京,為了一探究竟,2015年李健豪第一次來到北京,到了年底便搭建了StylePuzzle的技術團隊。

邂逅另一位創(chuàng)業(yè)者,零售與數(shù)據(jù)碰撞出火花

經(jīng)過真格基金徐小平介紹,李健豪認識了超盟數(shù)據(jù)CEO李思賢,當時的李思賢想要做的就是通過采集零售商業(yè)數(shù)據(jù)后為商家提供數(shù)據(jù)營銷解決方案,于是兩個跳躍的因子碰撞在一起。

當時,國內(nèi)的新零售熱潮還未興起,而在國外,尤其是美國和日本,對于商品的信息化使用程度已經(jīng)成熟,“國內(nèi)對于商品的信息化一定是有需求的,只是遲早的問題,所以我們決定先進入這個市場?!?/p>

2016年4月,李健豪正式加入超盟數(shù)據(jù)擔任CTO,專注于提供線下通路零售渠道的大數(shù)據(jù)分析及人工智能產(chǎn)品。

在硅谷時,李健豪就曾贏過6次全美黑客馬拉松冠軍,在24小時內(nèi)把一個想法實現(xiàn)出來,證明自己算法的可行性。這種“小團體作戰(zhàn)”的經(jīng)驗李健豪快速組建起超盟數(shù)據(jù)的技術團隊。

“當時李思賢給我看了一張便利店的小票,上面的數(shù)據(jù)更加真實且顆粒度更細,研究起來也挺有意思?!币婚_始,李健豪負責數(shù)據(jù)的清洗、處理非結構化數(shù)據(jù)。

由于每個便利店的小票格式都不一樣,超盟數(shù)據(jù)會先把數(shù)據(jù)格式標準化,然后進行清洗, 之后再進行Named-entity recognition(NER),最后通過匹配超盟內(nèi)部的商品數(shù)據(jù)庫, 對每個商品進行維度擴充并打上標簽。比如說一個商品名稱進入系統(tǒng),我們會把商品品牌、外包裝顏色、規(guī)格、成分等50多個維度附加到這個商品上,因此合作一家新的便利店時,便能對產(chǎn)品進行快速的匹配,當需要用到數(shù)據(jù)時就可以快速提取出來。

“傳統(tǒng)的數(shù)據(jù)公司可能需要花6個小時來處理,我們能夠把時間縮短到2-3分鐘?!崩罱『勒f。

在超盟數(shù)據(jù)有更多數(shù)據(jù)可以被挖掘

超盟數(shù)據(jù)有數(shù)據(jù)化運營、品類管理、消費者洞察三類產(chǎn)品,可以服務連鎖便利店、社區(qū)超市等多個線下零售業(yè)態(tài)。

在數(shù)據(jù)化運營方面,主要是基于全量交易的大數(shù)據(jù)分析,精準定位促銷受眾、同時通過算法全自動實現(xiàn)異常數(shù)據(jù)的實時反饋,提高銷售機會和關聯(lián)消費。因為對于當下的便利店主來說,他們所能掌握的便是“一瓶紅茶以多少錢賣出,一天賣出多少瓶”這樣的基礎信息,不容易發(fā)現(xiàn)背后的銷售邏輯。要想看到更加具體的信息,便利店只能通過自己的ERP系統(tǒng)調(diào)取數(shù)據(jù),通過人工處理制作成表格,從數(shù)據(jù)生成到拿到報告一般會耗時多個工作日。超盟數(shù)據(jù)通過技術分析幫助便利店實時生成數(shù)據(jù)報告,讓店主能夠同時看到銷售業(yè)績、門店、庫存等不同維度的信息。

品類管理則是幫助企業(yè)提高庫存周轉率,有效提升前臺毛利。一般來說,2/7/1 或者 3/6/1比例來進行行商品劃分,再對其從銷售量和毛利兩個維度來細分,又可以分成AB、BA、AC等多種不同的組合。比如一件商品的評級為AA則意味著它銷量高、毛利高,評級為CA則意味著銷量低毛利高。超盟數(shù)據(jù)會在商品的評級中引進新的維度來進行評估,例如商品連帶購物籃系統(tǒng),連帶毛利等,重新計算商品評級,防止一些不該被淘汰的商品被淘汰掉。

當連鎖便利店數(shù)量越來越大時,靠以往的數(shù)據(jù)手段很難得到如此精準的分析,但是超盟數(shù)據(jù)可以通過分析店面周圍的商業(yè)及交通環(huán)境情況、周邊顧客人均工資、房租水平、GDP水平等做出精準的畫像,推薦合適的商品上架。李健豪認為多維度的門店相似度模型同時也是機器不斷調(diào)優(yōu)相關參數(shù)的權重的結果。精細化多維度的門店相似度算法可以更好地將門店進行分類,更甚于傳統(tǒng)的商圈劃分方法,更精準洞察消費者畫像。多維度的門店相似度模型同時也是機器不斷調(diào)優(yōu)相關參數(shù)的權重的結果。

零售+人工智能在中國將更有想象空間

“目前很多傳統(tǒng)連鎖便利店尚未全面信息化,所以超盟數(shù)據(jù)的任務就是為它們配備上信息化的武器?!痹诶罱『揽磥?,零售+人工智能在中國將更有想象空間。

超盟數(shù)據(jù)的科技壁壘主要體現(xiàn)在三個方面:一是提高數(shù)據(jù)清洗的效率,將用時從6小時縮短到2-3分鐘,目前超盟數(shù)據(jù)每天處理的數(shù)據(jù)在百萬億級別;第二是在大量的數(shù)據(jù)基礎上,算法可以越來越精準;第三則是在團隊的組合上,CEO李思賢出身于華東區(qū)TOP3蜂蜜零售家族企業(yè),對于快消品零售有深厚積累,李健豪長于數(shù)據(jù)挖掘,快消零售和數(shù)據(jù)科學高度融合。

目前,超盟數(shù)據(jù)已經(jīng)覆蓋超過1萬家門店,包括北京、廣東、河北、內(nèi)蒙古、陜西等連鎖便利店品牌,市場占有率在18%左右。

今年11月,超盟數(shù)據(jù)已完成由襄禾資本和遠鏡創(chuàng)投投資的數(shù)百萬美金A輪融資,此前還曾獲得真格基金和力合清源數(shù)百萬人民幣的天使輪投資和山行資本千萬級人民幣的Pre-A輪投資。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2017-12-19
超盟數(shù)據(jù)李健豪——硅谷極客如何挖掘國內(nèi)零售大數(shù)據(jù)“金礦”
超盟數(shù)據(jù)CTO李健豪在校創(chuàng)業(yè)被收購,進入亞馬遜和IBM研究數(shù)據(jù)挖掘從澳門高中畢業(yè)后,李健豪來到美國UIUC(伊利諾伊大學厄巴納-香檳分校)攻讀CS專業(yè)。大學期間,一位在保險公司實習的朋友向他抱怨,手動填寫保單費時費力還難以保證準確性。2010年還未畢業(yè)的李健豪創(chuàng)辦Synchronize,通

長按掃碼 閱讀全文