為數(shù)據(jù)驅(qū)動(dòng)配上強(qiáng)大引擎,DELL EMC+Cloudera 樹立新標(biāo)桿

一個(gè)真實(shí)的現(xiàn)狀。

過去銀行的營(yíng)銷業(yè)務(wù),通常是銷售人員找關(guān)系、拉人頭,費(fèi)時(shí)費(fèi)力不說,營(yíng)銷效果往往差強(qiáng)人意;如今的銀行營(yíng)銷,精準(zhǔn)的人物畫像、不斷迭代優(yōu)化的營(yíng)銷模型、云柜員等基于數(shù)據(jù)驅(qū)動(dòng)型的新業(yè)務(wù)場(chǎng)景紛紛上陣,不僅讓營(yíng)銷變得更加自動(dòng)化和智能化,還讓用戶服務(wù)體驗(yàn)大幅提升。

這就是數(shù)字化浪潮下業(yè)務(wù)變革的一角。知微見著、以小見大,數(shù)據(jù)驅(qū)動(dòng)正是當(dāng)下企業(yè)數(shù)字化轉(zhuǎn)型的最強(qiáng)主旋律。IDC甚至預(yù)測(cè),未來90%的組織都將成為數(shù)據(jù)驅(qū)動(dòng)型組織,組織的運(yùn)營(yíng)、管理、決策乃至創(chuàng)新都將圍繞數(shù)據(jù)來開展。

隨著數(shù)據(jù)驅(qū)動(dòng)型業(yè)務(wù)場(chǎng)景不斷井噴,基礎(chǔ)設(shè)施和數(shù)據(jù)分析平臺(tái)已成核心引擎,其決定著企業(yè)是否能在數(shù)字化浪潮中獲得持續(xù)的動(dòng)能。如何打造強(qiáng)大的數(shù)據(jù)驅(qū)動(dòng)引擎就成為業(yè)界著力解決的挑戰(zhàn)。顯然,DELL EMC和Cloudera同時(shí)看到了這一巨大的市場(chǎng)需求。

近日,DELL EMC宣布其PowerScale成功獲得Cloudera CDP平臺(tái)最嚴(yán)苛的QATS認(rèn)證。一個(gè)是全球領(lǐng)先的基礎(chǔ)設(shè)施企業(yè),另一個(gè)是大數(shù)據(jù)分析平臺(tái)當(dāng)之無愧的頭牌,雙方攜手在產(chǎn)品與解決方案深層次的合作,不僅精準(zhǔn)把握住市場(chǎng)需求,更為數(shù)據(jù)驅(qū)動(dòng)基礎(chǔ)平臺(tái)建設(shè)樹立標(biāo)桿。

數(shù)據(jù)驅(qū)動(dòng)不言容易

數(shù)據(jù)驅(qū)動(dòng)近年來之火熱,關(guān)鍵原因在于數(shù)字經(jīng)濟(jì)蓬勃發(fā)展。

以中國(guó)市場(chǎng)為例,最新《中國(guó)數(shù)字經(jīng)濟(jì)發(fā)展白皮書(2021)》顯示,2020年中國(guó)數(shù)字經(jīng)濟(jì)規(guī)模達(dá)到39.2萬億元,GDP占比高達(dá)38.6%,同比增長(zhǎng)速度遠(yuǎn)超其他經(jīng)濟(jì)形式。產(chǎn)業(yè)數(shù)字化、數(shù)字化轉(zhuǎn)型這些趨勢(shì)帶來了豐富的數(shù)據(jù)驅(qū)動(dòng)型場(chǎng)景需求。

但數(shù)據(jù)驅(qū)動(dòng)不言容易?!皵?shù)據(jù)驅(qū)動(dòng)”,短短幾個(gè)字背后所傳遞的核心含義是:前端業(yè)務(wù)實(shí)現(xiàn)快速響應(yīng),海量數(shù)據(jù)實(shí)現(xiàn)價(jià)值落地,歸根結(jié)底是“讓企業(yè)與組織不僅要能把數(shù)據(jù)存好和管好,更需要把數(shù)據(jù)用起來和用好?!?/p>

與那些自誕生伊始就是數(shù)字原生的互聯(lián)網(wǎng)公司相比,傳統(tǒng)行業(yè)在數(shù)據(jù)驅(qū)動(dòng)上遇到的挑戰(zhàn)會(huì)更大。具體來看:

其一、大部分傳統(tǒng)企業(yè)對(duì)于數(shù)據(jù)驅(qū)動(dòng)有所嘗試,但依然處于探索階段,對(duì)于數(shù)據(jù)驅(qū)動(dòng)還缺乏深刻理解。去年,國(guó)資委也頒布了《關(guān)于加快推進(jìn)國(guó)有企業(yè)數(shù)字化轉(zhuǎn)型工作的通知》,就重點(diǎn)強(qiáng)調(diào)了加強(qiáng)數(shù)據(jù)驅(qū)動(dòng)等數(shù)字化轉(zhuǎn)型理念的重要性。

其二、與互聯(lián)網(wǎng)行業(yè)特點(diǎn)不同,大部分傳統(tǒng)企業(yè)更加關(guān)注數(shù)據(jù)安全、數(shù)據(jù)可靠為前提下的數(shù)據(jù)驅(qū)動(dòng)型場(chǎng)景的建設(shè),這使得簡(jiǎn)單的開源技術(shù)方案很難匹配企業(yè)的商業(yè)化需求。

其三、數(shù)據(jù)驅(qū)動(dòng)往往會(huì)涉及到分布式存儲(chǔ)、大數(shù)據(jù)、人工智能等一系列技術(shù),但傳統(tǒng)企業(yè)并沒有互聯(lián)網(wǎng)企業(yè)龐大的技術(shù)團(tuán)隊(duì)與人才,顯然不能相對(duì)輕松地駕馭這些先進(jìn)的數(shù)字化技術(shù)。

正如戴爾科技集團(tuán)大中華區(qū)非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)事業(yè)部高級(jí)經(jīng)理李海所言,“未來,擁有大數(shù)據(jù)分析能力的企業(yè)才會(huì)擁有市場(chǎng)領(lǐng)先的能力。企業(yè)在構(gòu)建數(shù)據(jù)分析平臺(tái)時(shí),不應(yīng)該為部署、調(diào)優(yōu)、實(shí)現(xiàn)等牽扯過多精力,也不應(yīng)該為數(shù)據(jù)安全、數(shù)據(jù)治理等底層問題而擔(dān)憂。”

事實(shí)上的確如此,面對(duì)分布式存儲(chǔ)、Hadoop、Spark、TensorFlow、Tytouch這些不斷變化的數(shù)字化技術(shù),傳統(tǒng)企業(yè)很難駕馭,更加需要進(jìn)行認(rèn)證、優(yōu)化的方案,減少精力放在底層問題,聚焦在業(yè)務(wù)創(chuàng)新層面,這也是DELL EMC PowerScale與Cloudera CDP多年緊密合作的核心目的。

PowerScale+CDP,樹立行業(yè)標(biāo)桿

自十余年前Hadoop誕生以來,基于Hadoop的數(shù)據(jù)分析平臺(tái)方案數(shù)不勝數(shù)。但為何是DELL EMC PowerScale與Cloudera CDP這對(duì)組合樹立了業(yè)界標(biāo)桿,在全球用戶中廣受青睞。截止當(dāng)前,CDP on Isilon(PowerScale前身)的容量已經(jīng)超過70PB,在國(guó)內(nèi)就有多個(gè)銀行、芯片制造等企業(yè)中廣泛采用,這對(duì)組合威力可見一斑。

先來看看PowerScale的情況。PowerScale前身是大名鼎鼎的Isilon,作為全球知名的集群NAS平臺(tái),PowerScale在非結(jié)構(gòu)化數(shù)據(jù)市場(chǎng)擁有大量用戶基礎(chǔ),其橫向擴(kuò)展能力、容量、性能、數(shù)據(jù)管理與數(shù)據(jù)保護(hù)功能等,在各種業(yè)務(wù)場(chǎng)景中得到了充分考驗(yàn)。“PowerScale在數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)據(jù)訪問上非常成熟。像PowerScale原生支持HDFS,能夠大幅提升大數(shù)據(jù)訪問效率;此外,PowerScale實(shí)現(xiàn)計(jì)算與存儲(chǔ)分離,大幅降低用戶采購(gòu)和管理成本。”李海表示道。

而Cloudera作為Hadoop開源生態(tài)的創(chuàng)建者,近年來一直推動(dòng)著Hadoop高速發(fā)展,在全球擁有廣泛的用戶群。Cloudera不僅開發(fā)了多個(gè)Hadoop功能組件,還在推動(dòng)大數(shù)據(jù)分析上不遺余力。Cloudera大中華區(qū)售前技術(shù)總監(jiān)劉隸放介紹,“Cloudera多年以來一直將業(yè)界最流行、最適合的新組件加入到Hadoop開源生態(tài)之中,以幫助用戶打造最強(qiáng)大的數(shù)據(jù)分析引擎。”

DELL EMC PowerScale與Cloudera CDP組合的最大意義,在于幫助用戶將數(shù)據(jù)從存好和管好,到用起來和用好這個(gè)階段實(shí)現(xiàn)無縫銜接,用戶不必花費(fèi)太多精力在部署、升級(jí)、優(yōu)化這些基礎(chǔ)事情上。這對(duì)于兩個(gè)公司用戶群而言,是喜聞樂見的好事。

但獲得認(rèn)證、打造聯(lián)合解決方案絕非易事。以本次DELL EMC PowerScale通過的Cloudera最嚴(yán)苛也是最高級(jí)的QATS認(rèn)證為例,當(dāng)前全球僅有兩家存儲(chǔ)廠商能夠通過,雙方投入大量人力、物力和精力才取得通過。李海直言:“QATS不是簡(jiǎn)單的兼容性認(rèn)證,而是在實(shí)際環(huán)境中模擬使用CDP所有模塊,按照用戶使用流程來驗(yàn)證所有軟件、硬件、功能等?!?/p>

劉隸放也介紹,Cloudera之前與EMC就有深入合作,如今這種合作得到延續(xù)并且升級(jí),而在于戴爾科技的溝通中,戴爾科技的專業(yè)性和投入印象深刻,“雙方合作需要大幅投入,因?yàn)槊總€(gè)版本迭代和研究需要3到6個(gè)月,需要雙方工程師共同完成調(diào)試和測(cè)試多項(xiàng)工作?!?/p>

不斷進(jìn)擊的PowerScale

在集群NAS流行的年代,Isilon是無可置疑的業(yè)界標(biāo)桿。進(jìn)入到大數(shù)據(jù)時(shí)代,很難再用集群NAS平臺(tái)來定義PowerScale。經(jīng)過不斷的進(jìn)化與成長(zhǎng),PowerScale更像是智能世界的一個(gè)數(shù)據(jù)湖堅(jiān)實(shí)底座。

事實(shí)上,除了與Cloudera等大數(shù)據(jù)分析平臺(tái)公司緊密合作之外,PowerScale近年來一系列舉措也愈發(fā)證明了,其將繼續(xù)引領(lǐng)著數(shù)據(jù)湖底座未來的發(fā)展趨勢(shì)。

首先,PowerScale在推動(dòng)全閃數(shù)據(jù)湖的普及。眾所周知,像自動(dòng)駕駛、芯片設(shè)計(jì)、基因分析、智能推薦等等AI應(yīng)用場(chǎng)景正在迅速增加,AI模型的巨量化和復(fù)雜化帶來的是數(shù)據(jù)海量化和數(shù)據(jù)處理性能的高要求。以O(shè)penAI的GPT模型為例,最新的GPT-3模型參數(shù)高達(dá)1750億個(gè)、預(yù)訓(xùn)練數(shù)據(jù)量高達(dá)45TB,模型規(guī)模、數(shù)據(jù)量和訓(xùn)練層數(shù)都比上一代有指數(shù)級(jí)的增加,這對(duì)于數(shù)據(jù)湖底座的性能和容量將是持續(xù)考驗(yàn)。

而DELL EMC適時(shí)推出的PowerScale全閃存產(chǎn)品線無疑極具市場(chǎng)價(jià)值,高性能處理器、全NVMe配置、兼容NVIDIA GPUDirect等特性,都有助于幫助用戶獲得更加強(qiáng)大的數(shù)據(jù)處理能力。

其次,混合云環(huán)境將會(huì)是企業(yè)未來很長(zhǎng)一段時(shí)間的標(biāo)配,數(shù)據(jù)湖亦需要適合混合云環(huán)境的發(fā)展趨勢(shì)。以PowerScale,其同時(shí)提供支持本地、公有云工作負(fù)載選型;例如,PowerScale將橫向擴(kuò)展文件功能引入到像Google Cloud等云服務(wù)商,企業(yè)用戶可以根據(jù)自身情況來靈活選擇不同的服務(wù)形式。

總體來看,下一個(gè)十年將會(huì)是數(shù)據(jù)驅(qū)動(dòng)型業(yè)務(wù)的黃金十年,數(shù)據(jù)分析能力將成為企業(yè)在數(shù)字化轉(zhuǎn)型中的重要核心競(jìng)爭(zhēng)力,而DELL EMC PowerScale不斷進(jìn)化的能力,以及與Cloudera等公司的緊密合作,對(duì)于企業(yè)用戶構(gòu)建自身的核心競(jìng)爭(zhēng)力將大有裨益。面向未來,DELL EMC PowerScale釋放的價(jià)值將遠(yuǎn)不止于此。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-07-18
為數(shù)據(jù)驅(qū)動(dòng)配上強(qiáng)大引擎,DELL EMC+Cloudera 樹立新標(biāo)桿
事實(shí)上的確如此,面對(duì)分布式存儲(chǔ)、Hadoop、Spark、TensorFlow、Tytouch這些不斷變化的數(shù)字化技術(shù),傳統(tǒng)企業(yè)很難駕馭,更加需要進(jìn)行認(rèn)證、優(yōu)化的方案,減少精力放在底層問題,聚焦在業(yè)

長(zhǎng)按掃碼 閱讀全文