星環(huán)科技創(chuàng)始人孫元浩:數(shù)據(jù)連接一切,開(kāi)啟融合數(shù)據(jù)云時(shí)代

  4月19日,星環(huán)科技2022春季新品發(fā)布周在線上盛大開(kāi)啟。開(kāi)幕式中,星環(huán)科技CEO孫元浩做主題演講,帶大家走入“融合數(shù)據(jù)云時(shí)代“。

數(shù)據(jù)分析模式的歷史變遷

  星環(huán)科技成立的2013年,數(shù)據(jù)分析模式是以Data Hub數(shù)據(jù)樞紐的形式來(lái)進(jìn)行;

  2017年星環(huán)科技提出大數(shù)據(jù)3.0概念,區(qū)分于運(yùn)用離散工具的數(shù)據(jù)平臺(tái),大數(shù)據(jù)3.0時(shí)代的最顯著特征為一站式數(shù)據(jù)平臺(tái),同時(shí)可以覆蓋數(shù)據(jù)全生命周期的處理。星環(huán)科技的一站式平臺(tái)把數(shù)據(jù)湖、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市一體化,提供一套數(shù)據(jù)工具集Transwap studio處理數(shù)據(jù)的各個(gè)階段;

  2018年星環(huán)科技提出數(shù)據(jù)云的概念,在這個(gè)階段大數(shù)據(jù)技術(shù)和云、AI技術(shù)融合,具備統(tǒng)一的資源管理技術(shù),利用容器化技術(shù),對(duì)外彈性提供數(shù)據(jù)庫(kù)作為服務(wù),應(yīng)用為數(shù)據(jù)而生,數(shù)據(jù)更重,應(yīng)用較輕,星環(huán)科技數(shù)據(jù)云產(chǎn)品領(lǐng)先業(yè)界一代;

  2020年,星環(huán)科技提出多模型數(shù)據(jù)平臺(tái),利用統(tǒng)一語(yǔ)言、計(jì)算、存儲(chǔ)、資源重構(gòu)大數(shù)據(jù)軟件棧,在一個(gè)平臺(tái)上支持十種數(shù)據(jù)模型,有效降低數(shù)據(jù)開(kāi)發(fā)和運(yùn)維的難度,極大提升用戶開(kāi)發(fā)效率。隨著多種數(shù)據(jù)模型融合在一起,訪問(wèn)語(yǔ)言產(chǎn)生了革命性的變化,SQL語(yǔ)言拓展、延伸到不同結(jié)構(gòu)數(shù)據(jù)上面,能夠用同樣的語(yǔ)言訪問(wèn)不同數(shù)據(jù)結(jié)構(gòu),統(tǒng)一的多模平臺(tái),可以支撐更多新應(yīng)用的產(chǎn)生。

  同年星環(huán)科技提出聯(lián)邦數(shù)據(jù)云概念,針對(duì)多數(shù)據(jù)中心、跨國(guó)數(shù)據(jù)中心而言,在資源層、數(shù)據(jù)層、計(jì)算層、機(jī)器學(xué)習(xí)層聯(lián)邦化。部署結(jié)構(gòu)也從早年間的星型結(jié)構(gòu),發(fā)展為雪花型。

  進(jìn)入2022年,我們來(lái)到了融合數(shù)據(jù)云的時(shí)代。融合數(shù)據(jù)云是指在按數(shù)據(jù)域組織的分布式數(shù)據(jù)云的技術(shù)架構(gòu)基礎(chǔ)上進(jìn)行統(tǒng)籌管理、協(xié)同運(yùn)營(yíng)、服務(wù)融合以形成可協(xié)同一致,自由組合,靈活部署的一種新型數(shù)據(jù)分析模式。數(shù)據(jù)可以如血液一般,以安全、可信的方式即時(shí)流動(dòng)到合適的地方,流給需要的人。

融合數(shù)據(jù)云時(shí)代的特征

  融合數(shù)據(jù)云是以網(wǎng)格結(jié)構(gòu)進(jìn)行部署,它主要具備流動(dòng)、開(kāi)放、輕量、統(tǒng)管四大特點(diǎn),即以數(shù)據(jù)的實(shí)時(shí)流動(dòng)取代以往準(zhǔn)實(shí)時(shí)和離線的批量處理;以數(shù)據(jù)的共享和開(kāi)放激發(fā)數(shù)據(jù)作為生產(chǎn)力的最大價(jià)值;以輕量化的數(shù)據(jù)分析應(yīng)用部署模式取代以往反復(fù)冗長(zhǎng)的開(kāi)發(fā)過(guò)程;以橫跨多種部署結(jié)構(gòu)、IaaS層及物理資源的統(tǒng)管方式打破各數(shù)據(jù)平臺(tái)及底層物理資源的管理壁壘。

  流動(dòng):數(shù)據(jù)只有流動(dòng)才能產(chǎn)生價(jià)值,數(shù)據(jù)流動(dòng)的速度越快,產(chǎn)生的價(jià)值越大。融合數(shù)據(jù)云以數(shù)據(jù)主動(dòng)流動(dòng)的方式取代了以往數(shù)據(jù)被動(dòng)被采集入湖的方式(只能做到準(zhǔn)實(shí)時(shí)或離線分析加工),將數(shù)據(jù)分析的效率大大提升。數(shù)據(jù)的流動(dòng)需要建立在安全可信的基礎(chǔ)之上,再即時(shí)地流動(dòng)到合適的地方,流給需要的人。

  開(kāi)放:作為生產(chǎn)要素的數(shù)據(jù),只有開(kāi)放和共享才能使得價(jià)值最大化。數(shù)據(jù)的交易和流通已成為推動(dòng)生產(chǎn)力的重要因素。

  輕量:分析變得越來(lái)越輕量化,對(duì)于按需生成和隨時(shí)部署的需求也在不斷擴(kuò)大。因此需要有統(tǒng)一的語(yǔ)言和應(yīng)用開(kāi)發(fā)方式,即時(shí)、按需地產(chǎn)生分析應(yīng)用。

  統(tǒng)管:融合數(shù)據(jù)云需要橫跨企業(yè)邊緣端、私有云、公有云、混合云,同時(shí)覆蓋傳統(tǒng)數(shù)據(jù)庫(kù)和現(xiàn)代數(shù)據(jù)平臺(tái)架構(gòu)。對(duì)于企業(yè)而言,融合數(shù)據(jù)云能夠橫跨和統(tǒng)管不同的部署結(jié)構(gòu)、IaaS層或物理資源,第一時(shí)間調(diào)動(dòng)底層資源承接上層的數(shù)據(jù)應(yīng)用。

  對(duì)于融合數(shù)據(jù)云而言,數(shù)據(jù)將被存儲(chǔ)于多模型的數(shù)據(jù)庫(kù)中,并且以網(wǎng)絡(luò)結(jié)構(gòu)的方式部署和流動(dòng)。數(shù)據(jù)域可獨(dú)立或兩兩組合成融合數(shù)據(jù)域,具備部署、模型、分析、智能等多維屬性,通過(guò)互聯(lián)管控實(shí)現(xiàn)協(xié)同工作,數(shù)據(jù)流動(dòng)。網(wǎng)格結(jié)構(gòu)是數(shù)據(jù)流動(dòng)的基礎(chǔ),代表了云邊端等多種部署維度以及數(shù)據(jù)業(yè)務(wù)化過(guò)程中的價(jià)值轉(zhuǎn)換維度所構(gòu)建網(wǎng)格結(jié)構(gòu),數(shù)據(jù)在各數(shù)據(jù)域間的流動(dòng)帶動(dòng)了數(shù)據(jù)價(jià)值的活躍度。企業(yè)可以根據(jù)云邊端等數(shù)據(jù)資源環(huán)境、時(shí)序/對(duì)象/圖片/文檔/圖數(shù)據(jù)等企業(yè)數(shù)據(jù)模型、湖倉(cāng)集等存儲(chǔ)結(jié)構(gòu)建立三維立體的數(shù)據(jù)域,并形成企業(yè)級(jí)的網(wǎng)格結(jié)構(gòu),為數(shù)據(jù)的流通創(chuàng)造合規(guī)的路徑和價(jià)值創(chuàng)造的前提基礎(chǔ)。在融合數(shù)據(jù)云下的數(shù)據(jù),能夠在不同的數(shù)據(jù)平臺(tái)間即時(shí)流動(dòng),數(shù)據(jù)流從低到高,為企業(yè)不斷涌現(xiàn)數(shù)據(jù)價(jià)值,而從高到低,又為企業(yè)的分析應(yīng)用部署,提供了應(yīng)需而生的響應(yīng)速度。

  數(shù)據(jù)連接一切,星環(huán)科技以引領(lǐng)行業(yè)技術(shù)發(fā)展和助力各行各業(yè)數(shù)字化轉(zhuǎn)型為使命,期望通過(guò)數(shù)據(jù)全生命周期的基礎(chǔ)軟件與服務(wù),為企業(yè)搭建數(shù)字化轉(zhuǎn)型的數(shù)字底座,保障數(shù)據(jù)的安全和順暢流通;以自研技術(shù)和產(chǎn)品積極落地IT基礎(chǔ)設(shè)施的國(guó)產(chǎn)化替代,滿足用戶多方面數(shù)據(jù)智能需求,助力各行各業(yè)企業(yè)數(shù)字化轉(zhuǎn)型。

對(duì)開(kāi)源或國(guó)外產(chǎn)品的替代

  星環(huán)科技的自主研發(fā)比例在大幅度提升,性能更優(yōu),速度更快,功能更強(qiáng)大,并且開(kāi)始更多的替代國(guó)外產(chǎn)品。

  大數(shù)據(jù)平臺(tái)方面,星環(huán)科技早就實(shí)現(xiàn)了諸多替代CDH的案例,包括cloudera和Hortoworks合并后的Cloudera Data Platform和Cloudera Data cloud,星環(huán)科技的產(chǎn)品能夠提供更多模型支持,提供統(tǒng)一接口和更好的SQL兼容性。

  分布式數(shù)據(jù)庫(kù)方面,星環(huán)科技產(chǎn)品可以兼容Oracle、Teratada、DB2,整合了Cypher語(yǔ)言,并用容器化技術(shù)實(shí)現(xiàn)更好的租戶隔離,保守來(lái)講性能提升2-10倍。星環(huán)科技KunDB在OLAP場(chǎng)景、MySQL的應(yīng)用場(chǎng)景中已經(jīng)能夠取代MySQL和Oracle,ArgoDB取代Oracle、DB2和Teradata建設(shè)數(shù)據(jù)倉(cāng)庫(kù),并在多個(gè)用戶中完整替代了Teradata。

  圖分析方面,星環(huán)科技圖數(shù)據(jù)庫(kù)庫(kù)StellarDB在中信證券等客戶中,取代開(kāi)源的或者商用版的Neo4j,StellarDB可以處理更大規(guī)模的圖數(shù)據(jù)。

  搜索引擎方面,完全自研的Scope搜索引擎可以替代Elasticsearch,經(jīng)過(guò)比較,Scope集群規(guī)??梢赃_(dá)到幾百個(gè)節(jié)點(diǎn),遠(yuǎn)遠(yuǎn)大于Elasticsearch的幾十個(gè)節(jié)點(diǎn)數(shù)量。

  數(shù)據(jù)科學(xué)方面,Sophon Base機(jī)器學(xué)習(xí)建模工具,可以取代SaaS、SPS等統(tǒng)計(jì)分析軟件,Sophon Base主要特點(diǎn)是在MLops把整個(gè)機(jī)器學(xué)習(xí)流程進(jìn)行優(yōu)化了,從特征工程到模擬訓(xùn)練、模型上線、模型評(píng)估到改進(jìn),有一套完整的工具集。星環(huán)科技提供了更多的分布式機(jī)器學(xué)習(xí)的算法和框架,也用更開(kāi)放的態(tài)度,鼓勵(lì)大家嘗試使用星環(huán)的一系列技術(shù)軟件。因此星環(huán)科技此次推出了輕量化的TDH社區(qū)版,免費(fèi)供高校和科研機(jī)構(gòu)方便地使用大數(shù)據(jù)技術(shù)。

  更多產(chǎn)品內(nèi)容,請(qǐng)登錄星環(huán)科技官網(wǎng)點(diǎn)擊查看

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )