星圖數(shù)據(jù) : 大數(shù)據(jù)的想象空間

商業(yè)上的決策,通常有數(shù)據(jù)和直覺兩種產(chǎn)生機(jī)制,而后者往往意味著不成熟和不靠譜。大數(shù)據(jù)概念炙手可熱的今天,數(shù)據(jù)驅(qū)動的設(shè)計(jì)、生產(chǎn)和營銷顯然是主流。

云計(jì)算從提出到進(jìn)化出完善的 PaaS、IaaS 和 SaaS 架構(gòu),再到被市場廣泛接受,用掉了將近十年。而大數(shù)據(jù)概念從知名學(xué)者舍恩伯格提出到現(xiàn)在,剛剛不到三年,最常見的用途不過是為碎片化的營銷渠道提供參考坐標(biāo)。大數(shù)據(jù)的潛力和商業(yè)能量顯然還沒被充分挖掘出來。

就大數(shù)據(jù)的應(yīng)用場景和未來的發(fā)展趨勢,我們采訪了星圖數(shù)據(jù) (Syntun) 的創(chuàng)始人谷熠。

產(chǎn)品經(jīng)理出身的谷熠曾在 SaaS 企業(yè)級軟件行業(yè)工作十多年,主要為企業(yè)客戶開發(fā)數(shù)據(jù)類和信息類產(chǎn)品;他的合伙人之一,也是星圖數(shù)據(jù)的首席數(shù)據(jù)官 (CDO) 曾在市場研究行業(yè)做調(diào)研類工作。隨著從業(yè)年限的逐漸增加,兩個人慢慢發(fā)現(xiàn)了傳統(tǒng)數(shù)據(jù)收集方法的落后和不全面。

由于經(jīng)由人工獲取的有效數(shù)據(jù)本身就非常有限,在后續(xù)進(jìn)行數(shù)據(jù)處理時,就不得不采用樣本推總的思路。而事實(shí)上,建立在這個邏輯上的統(tǒng)計(jì)處理很可能會因?yàn)闃颖静粔蛉娑鴮?dǎo)致比較大的誤差。在大數(shù)據(jù)的幫助下,這些誤差和不可控因素的勢力范圍有可能進(jìn)一步縮小,從而為更加明智的決策和及時深度的洞察創(chuàng)造條件。

谷熠眼中的大數(shù)據(jù) (Big Data) 更像是 Mass Data。星圖團(tuán)隊(duì)自主搭建了獨(dú)立的服務(wù)器,并開發(fā)了一套大數(shù)據(jù)供應(yīng)鏈系統(tǒng)。從數(shù)據(jù)的采集、解析、存儲、清洗到后期的數(shù)據(jù)標(biāo)準(zhǔn)化、建模和自學(xué)習(xí),整個流程只需很短的時間就能跑完。公開網(wǎng)絡(luò)環(huán)境下的電商交易數(shù)量、成交金額、客戶評價(jià)等數(shù)據(jù),星圖都可以通過自己的采集系統(tǒng)收錄進(jìn)來;緊接著是對源數(shù)據(jù)進(jìn)行分門別類,即解析。解析完成后,這些初步處理過的數(shù)據(jù)會被快速清洗,那些有潛在使用價(jià)值的數(shù)據(jù)會被長久保存下來。而標(biāo)準(zhǔn)化、建模和自學(xué)習(xí)才是星圖真正擅長的重頭戲——他們根據(jù)數(shù)據(jù)的種類和行業(yè)區(qū)別開發(fā)了一系列分析算法來對已有的數(shù)據(jù)進(jìn)行多方位和多角度的解讀,這也是輸出最終結(jié)果的最后步驟。

以星圖目前的計(jì)算能力,每天大約有 5TB 容量的數(shù)據(jù)進(jìn)入星圖的自有數(shù)據(jù)庫,每分鐘可以完成六千條左右的數(shù)據(jù)處理。與那些互聯(lián)網(wǎng)巨頭相比,這個速度還基本構(gòu)不成威脅。而數(shù)據(jù)的價(jià)值并不能簡單地從容量這個維度上來看。數(shù)據(jù)內(nèi)部的精巧結(jié)構(gòu)、關(guān)聯(lián)關(guān)系和廣度、時效性等指標(biāo)都能反映自身的價(jià)值。用電商行業(yè)來舉例,這里的數(shù)據(jù)可以分為相對穩(wěn)定的用戶數(shù)據(jù)和隨時發(fā)生變化的時序數(shù)據(jù)。對于網(wǎng)上零售行業(yè)的從業(yè)者而言,這兩類數(shù)據(jù)的重要意義不言而喻。前者能告訴你顧客是誰,有哪些特點(diǎn),后者則會告訴你和同行相比到底賣得怎么樣。于是,中小賣家就有了審時度勢的機(jī)會,依托于大數(shù)據(jù)的市場反饋能迅速做出決策和響應(yīng),免于因信息閉塞而決策失誤。

從另一個角度看,電商行業(yè)的用戶和交易數(shù)據(jù)被阿里、京東等平臺型巨頭持有,這些數(shù)據(jù)是相互獨(dú)立、互不開放的。其實(shí)割據(jù)在互聯(lián)網(wǎng)的很多細(xì)分領(lǐng)域都已經(jīng)稀松見慣,而星圖卻打算用這樣一套數(shù)據(jù)供應(yīng)鏈系統(tǒng)打破數(shù)據(jù)層面的割據(jù),通過對全網(wǎng)數(shù)據(jù)的挖掘,反映真實(shí)的電商運(yùn)行情況。媒體和電商分析師們又多了一個客觀的視角。

在零售以外的領(lǐng)域,大數(shù)據(jù)的魔力并沒有減弱。比如,在占據(jù)國民經(jīng)濟(jì)主體地位的制造業(yè),利用大數(shù)據(jù)的用戶和市場研究結(jié)果,產(chǎn)品設(shè)計(jì)人員可以及時了解消費(fèi)者對功能和外觀的喜好,獲知他們在使用中的具體困惑,反過來影響產(chǎn)品設(shè)計(jì)之初的具體方案。這就避免了采購浪費(fèi)和供應(yīng)鏈臨時調(diào)整的麻煩,產(chǎn)品方案一旦確定即可大規(guī)模投入生產(chǎn)。在谷熠看來,歐美等發(fā)達(dá)工業(yè)國家的先進(jìn)之處在于供應(yīng)量的柔性管理能力——市場反應(yīng)不達(dá)預(yù)期,可以迅速停止生產(chǎn)或改用備選方案,非常機(jī)動靈活。有了大數(shù)據(jù)的支撐,中國的制造業(yè)脈搏能更加有條不紊,逐漸改變過去低水平重復(fù)建設(shè)的生產(chǎn)模式。

談到大數(shù)據(jù),另一個無法回避的永恒話題是用戶隱私。

在采訪中,創(chuàng)始人谷熠并沒有對此顧左右而言他。星圖在數(shù)據(jù)積累早期就在內(nèi)部建立了一個用戶信息分級機(jī)制,能夠有效預(yù)防隱私泄露情況的發(fā)生。

事實(shí)上,互聯(lián)網(wǎng)的使用者幾乎一定會在網(wǎng)絡(luò)上留下些許痕跡,隱私本質(zhì)上是一個度的概念。如果不貢獻(xiàn)任何數(shù)據(jù),這個商業(yè)世界的很多美好事物將永遠(yuǎn)不會出現(xiàn)。大數(shù)據(jù)的想象空間正是在對用戶數(shù)據(jù)的合理使用基礎(chǔ)上建立起來,隨之而來的便利、智能和自動化也應(yīng)該讓大數(shù)據(jù)的參與創(chuàng)造者盡快享用到。

到那時,數(shù)據(jù)反哺農(nóng)業(yè)、制造業(yè)乃至服務(wù)業(yè)的愿景才會一步步實(shí)現(xiàn)。

via:創(chuàng)見

End.

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2015-07-14
星圖數(shù)據(jù) : 大數(shù)據(jù)的想象空間
商業(yè)上的決策,通常有數(shù)據(jù)和直覺兩種產(chǎn)生機(jī)制,而后者往往意味著不成熟和不靠譜。大數(shù)據(jù)概念炙手可熱的今天,數(shù)據(jù)驅(qū)動的設(shè)計(jì)、生產(chǎn)和營銷顯然是主流。

長按掃碼 閱讀全文