數(shù)據(jù)洪流時(shí)代,企業(yè)如何釋放數(shù)據(jù)價(jià)值才能步入發(fā)展“快車(chē)道”?

日前,國(guó)內(nèi)市場(chǎng)調(diào)查和咨詢(xún)公司艾瑞咨詢(xún)發(fā)布《2022 年中國(guó)數(shù)智融合發(fā)展洞察》報(bào)告。作為國(guó)內(nèi)最新的數(shù)智融合研究成果,該報(bào)告聚焦企業(yè)數(shù)智融合,圍繞中國(guó)數(shù)智融合發(fā)展背景、企業(yè)數(shù)智融合挑戰(zhàn)與應(yīng)對(duì)、數(shù)智融合典型實(shí)踐等進(jìn)行了深入分析,結(jié)論令人深思。

報(bào)告顯示,華為云數(shù)智融合解決方案綜合優(yōu)勢(shì)突出,憑借其獨(dú)家創(chuàng)新架構(gòu),為客戶(hù)進(jìn)一步降本增效,在行業(yè)技術(shù)創(chuàng)新上持續(xù)領(lǐng)跑。通過(guò) DataArts 和 ModelArts 的融合,打通了大數(shù)據(jù)和人工智能,兼顧成本與性能,實(shí)現(xiàn)統(tǒng)一管理、一數(shù)多用,同時(shí)實(shí)現(xiàn)敏捷用數(shù),全流程自動(dòng)化與智能化。

中國(guó)數(shù)智融合發(fā)展的典型特征

《2022 年中國(guó)數(shù)智融合發(fā)展洞察》報(bào)告指出,隨著數(shù)字化不斷推進(jìn),全球數(shù)據(jù)量以超過(guò) 59%的年增長(zhǎng)率快速增長(zhǎng),中國(guó)的數(shù)據(jù)量增速比全球更快。其中,80%是非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。并且,在企業(yè)內(nèi)部,非結(jié)構(gòu)化數(shù)據(jù)增速遠(yuǎn)高于結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)占比也越來(lái)越高。值得關(guān)注的是,數(shù)據(jù)多源異構(gòu)成為常態(tài),以數(shù)據(jù)庫(kù)種類(lèi)為例,除傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)外,還誕生了更適應(yīng)物聯(lián)網(wǎng)場(chǎng)景的時(shí)序數(shù)據(jù)庫(kù)、更適應(yīng)知識(shí)圖譜應(yīng)用的圖數(shù)據(jù)庫(kù)等。

同時(shí),報(bào)告還指出,在大數(shù)據(jù)行業(yè),企業(yè)仍然存在數(shù)據(jù)壁壘突出、碎片化問(wèn)題嚴(yán)重等瓶頸制約,大數(shù)據(jù)容量大、類(lèi)型多、速度快、精度準(zhǔn)和價(jià)值高的 5V 特性未能得到充分釋放。

此外,云原生領(lǐng)域,從微服務(wù)走向 Serverless,底層基礎(chǔ)設(shè)施被“屏蔽”,開(kāi)發(fā)者只需專(zhuān)注于編寫(xiě)應(yīng)用程序的業(yè)務(wù)邏輯,技術(shù)人員更貼近業(yè)務(wù)。為推進(jìn) AI 應(yīng)用的高質(zhì)量落地,開(kāi)展針對(duì)性的數(shù)據(jù)治理工作成為企業(yè)迫切需求。通過(guò)抽象解耦、水平擴(kuò)展、自動(dòng)化與智能化實(shí)現(xiàn)去過(guò)程化,企業(yè)業(yè)務(wù)需求可得到實(shí)時(shí)響應(yīng),進(jìn)一步實(shí)現(xiàn)敏捷和創(chuàng)新。

簡(jiǎn)言之,整個(gè)經(jīng)濟(jì)社會(huì)源源不斷地產(chǎn)生數(shù)據(jù),但是爆炸式增長(zhǎng)的數(shù)據(jù)并未發(fā)揮其真正價(jià)值,也未有效驅(qū)動(dòng)企業(yè)業(yè)務(wù)增長(zhǎng)。

橫亙?cè)谄髽I(yè)面前的數(shù)智融合四大挑戰(zhàn)

原因何在?《2022 年中國(guó)數(shù)智融合發(fā)展洞察》報(bào)告揭露出問(wèn)題所在。

第一,傳統(tǒng)架構(gòu)下,數(shù)據(jù)量、存儲(chǔ)成本和計(jì)算效率不可兼得。如果不考慮數(shù)據(jù)量和數(shù)據(jù)類(lèi)型,那么傳統(tǒng)數(shù)倉(cāng)或單體 DBMS 已足夠;不考慮計(jì)算效率,那么基于 HDFS 或公有云的對(duì)象存儲(chǔ)即可滿足。如果不考慮存儲(chǔ)成本,企業(yè)可使用 NVM(非易失性?xún)?nèi)存)。

其次,數(shù)倉(cāng)、數(shù)據(jù)湖和 AI 數(shù)據(jù)形成新的數(shù)據(jù)孤島。經(jīng)過(guò)多年發(fā)展,數(shù)據(jù)分析和 AI 分析出現(xiàn)面向不同任務(wù)的專(zhuān)用數(shù)據(jù)系統(tǒng)?;趯?duì)象存儲(chǔ)的大數(shù)據(jù)系統(tǒng)負(fù)責(zé)處理海量數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),數(shù)倉(cāng)系統(tǒng)處理結(jié)構(gòu)化數(shù)據(jù),AI 系統(tǒng)中的數(shù)據(jù)一般存儲(chǔ)在本地。這些專(zhuān)用系統(tǒng)“各自為政”,要么無(wú)法打通形成新的數(shù)據(jù)孤島,要么不同業(yè)務(wù)的開(kāi)發(fā)要遷移數(shù)據(jù),實(shí)施過(guò)程漫長(zhǎng),影響業(yè)務(wù)快速發(fā)展。

第三,雖然開(kāi)源產(chǎn)品非常豐富,但是開(kāi)發(fā)運(yùn)維難。即使有大量開(kāi)源產(chǎn)品,但是企業(yè)自行搭建數(shù)智平臺(tái)依然困難重重。比如在運(yùn)維上,很多企業(yè)主要依靠人工運(yùn)維,不僅效率低,而且成本高,無(wú)法很好應(yīng)對(duì)宕機(jī)事故。再比如體驗(yàn)上,因產(chǎn)品自產(chǎn)自用,復(fù)用率低,技術(shù)團(tuán)隊(duì)只保障基礎(chǔ)需求,對(duì)降低業(yè)務(wù)人員使用難度、提升使用體驗(yàn)的附加性需求響應(yīng)度低。

最后,數(shù)據(jù)準(zhǔn)備工作既復(fù)雜,又低效。在利用數(shù)據(jù)過(guò)程中,數(shù)據(jù)質(zhì)量至關(guān)重要,低質(zhì)量數(shù)據(jù)效用非常低。從數(shù)據(jù)生成、采集到應(yīng)用的長(zhǎng)生命周期,數(shù)據(jù)準(zhǔn)備工作異常耗時(shí)。據(jù) Cognilytica 調(diào)研顯示,機(jī)器學(xué)習(xí)中,超過(guò) 80%的時(shí)間被用于數(shù)據(jù)準(zhǔn)備。

這些挑戰(zhàn)猶如企業(yè)面前的“攔路虎”,阻礙著企業(yè)充分利用數(shù)據(jù)。只有那些跨越“攔路虎”的企業(yè)才能繼續(xù)前行,釋放數(shù)據(jù)價(jià)值,步入發(fā)展快車(chē)道。

如何“變身”數(shù)智融合的佼佼者

而興盛優(yōu)選則是其代表之一。作為一家互聯(lián)網(wǎng)新零售企業(yè),興盛優(yōu)選無(wú)疑是過(guò)去數(shù)年國(guó)內(nèi)互聯(lián)網(wǎng)創(chuàng)業(yè)中的“明星公司”。它主要定位于解決家庭消費(fèi)者的日常需求,包括蔬菜水果、肉禽水產(chǎn)、米面糧油、日用百貨等商品,以 “預(yù)售 + 自提” 模式為用戶(hù)提供服務(wù)。目前,它已是估值超過(guò) 100 億美金的獨(dú)角獸企業(yè)。

在興盛優(yōu)選總部,每一層樓都安裝有一塊約 60 寸的長(zhǎng)方形屏幕,淡藍(lán)色地圖背景上滾動(dòng)著興盛優(yōu)選當(dāng)日全國(guó)訂單數(shù),數(shù)字實(shí)時(shí)更新。

對(duì)興盛優(yōu)選而言,數(shù)據(jù)已經(jīng)成為其業(yè)務(wù)發(fā)展的底座,不僅與業(yè)務(wù)深度融合,而且致力于為業(yè)務(wù)發(fā)展創(chuàng)造更大價(jià)值。

據(jù)悉,該公司總數(shù)據(jù)量已達(dá) PB 級(jí)別,日新增數(shù)據(jù)量達(dá)到 TB 級(jí),其業(yè)務(wù)每個(gè)鏈路均有數(shù)據(jù)參與其中,實(shí)現(xiàn)相應(yīng)業(yè)務(wù)流程的迭代和增強(qiáng)。

業(yè)務(wù)快速發(fā)展中,興盛優(yōu)選在數(shù)據(jù)上也遇到很大挑戰(zhàn)。與很多企業(yè)一樣,它主要基于開(kāi)源大數(shù)據(jù)組件進(jìn)行搭建,但是基礎(chǔ)設(shè)施的穩(wěn)定性卻跟不上業(yè)務(wù)發(fā)展速度,于是面臨兩大難題:其一,機(jī)器資源采購(gòu)周期較長(zhǎng),如果周期內(nèi)機(jī)器不足以支撐業(yè)務(wù)發(fā)展,那么就會(huì)出現(xiàn)大數(shù)據(jù)組件運(yùn)行資源缺乏導(dǎo)致任務(wù)延時(shí)甚至失敗的情況;其二,大數(shù)據(jù)涉及的開(kāi)源組件比較多,而業(yè)務(wù)發(fā)展急需可靠的集群支撐,這就需要專(zhuān)業(yè)人才。在興盛優(yōu)選總部長(zhǎng)沙,找到維護(hù)龐大集群相應(yīng)組件的專(zhuān)業(yè)人才不僅需要時(shí)間,而且會(huì)帶來(lái)不小的人力成本。

興盛優(yōu)選基礎(chǔ)數(shù)據(jù)平臺(tái)部負(fù)責(zé)人補(bǔ)充道:“相比 OBS 的糾刪碼存儲(chǔ)機(jī)制而言,HDFS 的副本機(jī)制成本高出不少。對(duì)創(chuàng)業(yè)公司而言,能省每一筆可以節(jié)省的錢(qián),并將這些錢(qián)花在該花的地方,這是每個(gè)技術(shù)架構(gòu)師都應(yīng)該要具備的思維?!?/p>

基于性能和成本考量后,興盛優(yōu)選決定采用華為云數(shù)智融合解決方案,將原來(lái)基于開(kāi)源組件搭建的數(shù)據(jù)平臺(tái),遷移到華為云 GaussDB 集群,提升數(shù)據(jù)分析效能,從根本上解決了業(yè)務(wù)數(shù)據(jù)不一致,實(shí)時(shí)業(yè)務(wù)不穩(wěn)定的問(wèn)題。

在他看來(lái),相比 x86 而言,基于 ARM 系列硬件的華為云集群服務(wù)有非常突出的成本優(yōu)勢(shì)。他表示:“當(dāng)前,我們整個(gè)大數(shù)據(jù)集群都是運(yùn)行在華為云的 ARM 系列集群上,服務(wù)比較穩(wěn)定,基本沒(méi)什么太大問(wèn)題。即使上線后這段時(shí)間,也只出現(xiàn)過(guò)一次小規(guī)模故障,集群中有幾臺(tái)機(jī)器出現(xiàn)過(guò)斷電重啟的情況”。

通過(guò)華為云上云團(tuán)隊(duì)駐場(chǎng)支持協(xié)助,興盛優(yōu)選用時(shí) 1 個(gè)月即完成大部分任務(wù)從線下遷移到線上,大大降低了運(yùn)維成本。

如果說(shuō)興盛優(yōu)選是互聯(lián)網(wǎng)新零售中的“明星”,那么 T3 出行則是出行領(lǐng)域釋放數(shù)據(jù)價(jià)值的“佼佼者”。據(jù)悉,T3 出行是由中國(guó)一汽、東風(fēng)汽車(chē)、長(zhǎng)安汽車(chē)三大央企聯(lián)合多方知名企業(yè)簽訂合資協(xié)議正式運(yùn)營(yíng)的出行企業(yè),截止 2022 年 7 月,T3 出行登陸全國(guó) 91 個(gè)城市,累計(jì)注冊(cè)用戶(hù)超 1 億,單日訂單峰值破 300 萬(wàn)單,訂單規(guī)模及日活用戶(hù)躍居 B2C 出行領(lǐng)域第一。

于它而言,面臨三大痛點(diǎn):一是傳統(tǒng)數(shù)倉(cāng)技術(shù)難以解決“長(zhǎng)尾支付”帶來(lái)的問(wèn)題,二是平臺(tái)需要更靈活的架構(gòu)支持像 AI 自動(dòng)驗(yàn)證司機(jī)身份、識(shí)別司機(jī)不安全行為等新應(yīng)用,三是平臺(tái)需要更穩(wěn)定可靠的架構(gòu),支撐流量快速增長(zhǎng)。

為滿足業(yè)務(wù)發(fā)展,T3 出行選擇華為云數(shù)智融合產(chǎn)品,將多套集群架構(gòu)優(yōu)化至湖倉(cāng)一體的存算分離架構(gòu),同時(shí)支撐數(shù)據(jù)分析的 BI 和數(shù)據(jù)智能的 AI 場(chǎng)景,不僅使 TCO 降低 20%以上,更解決了出行場(chǎng)景下“長(zhǎng)尾支付”系統(tǒng)更新慢的難題,保證業(yè)務(wù) 7x24 小時(shí)穩(wěn)定運(yùn)行。

除了興盛優(yōu)選、T3 出行,夢(mèng)餉集團(tuán)通過(guò)采用華為云數(shù)智融合解決方案實(shí)現(xiàn) TCO 下降 30%,實(shí)時(shí)分析能力提升 50%。華為云一體化解決方案為夢(mèng)餉集團(tuán)帶來(lái)“資源高效”、“應(yīng)用敏捷”、“業(yè)務(wù)智能”、“安全可信”等多方面的智能升級(jí)。 基于此,在 5 月 26 日舉辦的數(shù)博會(huì)上,夢(mèng)餉集團(tuán)創(chuàng)新實(shí)踐入選“十佳大數(shù)據(jù)案例”,華為云數(shù)智融合平臺(tái)也榮獲“2022 數(shù)博會(huì)領(lǐng)先科技成果優(yōu)秀項(xiàng)目獎(jiǎng)”,充分證明了業(yè)界對(duì)華為云數(shù)據(jù)領(lǐng)域技術(shù)創(chuàng)新的認(rèn)可。

獨(dú)家創(chuàng)新架構(gòu) 華為云助力企業(yè)釋放數(shù)據(jù)價(jià)值

為什么不同行業(yè)的不同企業(yè)都青睞華為云數(shù)智融合平臺(tái)?

簡(jiǎn)言之,華為云為企業(yè)在云上打造了統(tǒng)一的數(shù)據(jù)底座,實(shí)現(xiàn)數(shù)據(jù)和智能的融合,為企業(yè)發(fā)展提供新引擎。

2.jpg

具體說(shuō)來(lái),三層分離。華為云數(shù)智融合平臺(tái)通過(guò)存儲(chǔ)-緩存-內(nèi)存三層分離,兼顧存儲(chǔ)成本和計(jì)算性能,讓性?xún)r(jià)比更高,計(jì)算更靈活。

其次,統(tǒng)一了元數(shù)據(jù)。打破原有大數(shù)據(jù)、數(shù)倉(cāng)、AI 的數(shù)據(jù)孤島,將數(shù)據(jù)目錄、數(shù)據(jù)權(quán)限、事務(wù)一致性等能力統(tǒng)一到一個(gè)中心點(diǎn),實(shí)現(xiàn)一數(shù)多用,讓一份數(shù)據(jù)在多個(gè)引擎間自由流動(dòng)共享,避免數(shù)據(jù)來(lái)回遷移。

第三,DataOps 和 MLOps 融合,讓企業(yè)不同部門(mén)、不同角色可以以擅長(zhǎng)的方式敏捷用數(shù)。讓數(shù)據(jù)工程師使用熟悉的工具來(lái)調(diào)用 AI 能力,使大數(shù)據(jù)開(kāi)發(fā)和 AI 開(kāi)發(fā)協(xié)同起來(lái)。例如,讓數(shù)據(jù)工程師用 SQL、Python 交互式 Notebook 做數(shù)據(jù)清洗、特征工程、模型訓(xùn)練,幾行代碼就能直接調(diào)用平臺(tái)內(nèi)預(yù)置的 AI 算法,使數(shù)據(jù)和模型開(kāi)發(fā)周期從天級(jí)降為分鐘級(jí)。

最后,全流程的自動(dòng)化和智能化,讓繁重的數(shù)據(jù)治理變得簡(jiǎn)單。華為云數(shù)智融合平臺(tái)將人工智能算法模型應(yīng)用到數(shù)據(jù)集成、數(shù)據(jù)質(zhì)量、數(shù)據(jù)建模、數(shù)據(jù)安全、數(shù)據(jù)訪問(wèn)控制、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)關(guān)系和數(shù)據(jù)洞察的數(shù)據(jù)全生命周期治理。

簡(jiǎn)言之,華為云數(shù)智融合 DataArts,用 AI 技術(shù)提升數(shù)據(jù)治理效率,即 AI for Data;用高質(zhì)量的數(shù)據(jù)提升模型精度,即 Data for AI,讓企業(yè)決策更精準(zhǔn)。

寫(xiě)在最后

大數(shù)據(jù)與人工智能的融合,正成為新的技術(shù)驅(qū)動(dòng)力。數(shù)智融合可以進(jìn)一步深入企業(yè)業(yè)務(wù),加速業(yè)務(wù)迭代和產(chǎn)品創(chuàng)新,推動(dòng)企業(yè)數(shù)字化發(fā)展提質(zhì)增效,步入高質(zhì)量發(fā)展階段。

多云時(shí)代下,“H(華為云)+X”已經(jīng)成為越來(lái)越多企業(yè)的主流選擇。據(jù)悉,在互聯(lián)網(wǎng)領(lǐng)域,80%的中國(guó) Top50 互聯(lián)網(wǎng)企業(yè)選擇華為云。之所以受更多企業(yè)青睞,是因?yàn)槿A為云提出“一切皆服務(wù)”,把基礎(chǔ)設(shè)施、技術(shù)以及經(jīng)驗(yàn)云化、服務(wù)化,幫助千行百業(yè)的客戶(hù)容易上云、方便上云、用好云。同時(shí),華為云深耕行業(yè),將華為與伙伴、客戶(hù)的合作創(chuàng)新以及數(shù)字化轉(zhuǎn)型經(jīng)驗(yàn)沉淀為云服務(wù),已陸續(xù)開(kāi)放了 50 多個(gè)應(yīng)用場(chǎng)景,提供超過(guò) 2 萬(wàn)個(gè) API 服務(wù),讓更多企業(yè)就不必重復(fù)“造輪子”,通過(guò)云服務(wù)即獲得全行業(yè)最優(yōu)秀的數(shù)字化經(jīng)驗(yàn)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )