釋放數(shù)據(jù)價(jià)值這道難題,數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)有解

去年底,《中共中央、國(guó)務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見(jiàn)》(以下簡(jiǎn)稱(chēng):" 數(shù)據(jù)二十條 ")正式頒布,標(biāo)志著數(shù)據(jù)基礎(chǔ)制度的建設(shè)步入快車(chē)道,數(shù)據(jù)要素化有望全面提速。

" 數(shù)據(jù)二十條 " 引來(lái)熱議的同時(shí),也讓數(shù)據(jù)科學(xué)再次成為各界關(guān)注的焦點(diǎn)。業(yè)界普遍認(rèn)為,我國(guó)具有海量數(shù)據(jù)規(guī)模和豐富應(yīng)用場(chǎng)景,全面激活數(shù)據(jù)要素潛能和做強(qiáng)數(shù)字經(jīng)濟(jì),離不開(kāi)數(shù)據(jù)科學(xué)的長(zhǎng)期支撐。

無(wú)獨(dú)有偶,在 2023 數(shù)據(jù)科學(xué)峰會(huì)上,IDC 等權(quán)威咨詢(xún)機(jī)構(gòu)也作出判斷:企業(yè)與組織需要把數(shù)據(jù)科學(xué)能力納入未來(lái)發(fā)展戰(zhàn)略之中,數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)將成為未來(lái)產(chǎn)業(yè)數(shù)字化的標(biāo)配。

作為一門(mén)發(fā)展了五十余載的學(xué)科,數(shù)據(jù)科學(xué)為何能做到歷久彌新?在人工智能浪潮中,數(shù)據(jù)科學(xué)的價(jià)值緣何得到持續(xù)凸顯?正如百分點(diǎn)科技董事長(zhǎng)兼 CEO 蘇萌所言:" 在經(jīng)歷小數(shù)據(jù)和大數(shù)據(jù)時(shí)代之后,數(shù)據(jù)科學(xué)正進(jìn)入全面擁抱 AI 浪潮的 3.0 時(shí)代,數(shù)據(jù)科學(xué)將加速組織數(shù)智化能力的進(jìn)階。"

全面擁抱數(shù)據(jù)科學(xué) 3.0 時(shí)代

"ChatGPT 之所以表現(xiàn)如此好,關(guān)鍵原因在于數(shù)據(jù)質(zhì)量非常高,可以訓(xùn)練出非常好的效果。今天,AI 的底層基礎(chǔ)就是數(shù)據(jù)科學(xué)。"IDC 中國(guó)副總裁兼首席分析師武連峰談到數(shù)據(jù)科學(xué)能力時(shí)舉例說(shuō)。

的確,數(shù)據(jù)科學(xué)作為使用科學(xué)方法從數(shù)據(jù)中提取意義和洞察的領(lǐng)域,綜合了數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)技術(shù)、人工智能以及領(lǐng)域知識(shí)等,核心目標(biāo)是做數(shù)據(jù)在業(yè)務(wù)側(cè)的價(jià)值實(shí)現(xiàn)。如今,隨著數(shù)字化轉(zhuǎn)型縱深發(fā)展和數(shù)據(jù)要素化全面提速,廣大用戶(hù)愈發(fā)重視建設(shè)數(shù)據(jù)科學(xué)能力。

" 當(dāng)前是數(shù)據(jù)科學(xué)的 3.0 時(shí)代,正在全面擁抱 AI 浪潮。" 蘇萌介紹道," 在這之前,數(shù)據(jù)科學(xué)經(jīng)歷了小數(shù)據(jù)時(shí)代和大數(shù)據(jù)時(shí)代。"

在小數(shù)據(jù)時(shí)代,數(shù)據(jù)科學(xué)主要運(yùn)用關(guān)系型數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、ETL 等技術(shù),主要面向結(jié)構(gòu)化數(shù)據(jù)、歷史數(shù)據(jù)和線下數(shù)據(jù),聚焦商業(yè)領(lǐng)域的數(shù)據(jù)整合、描述性分析和 BI 等應(yīng)用;在大數(shù)據(jù)時(shí)代,互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)帶來(lái)了海量非結(jié)構(gòu)化數(shù)據(jù)和數(shù)據(jù)處理分析技術(shù)的更迭,像 Storm、Spark 等計(jì)算框架極大提升了數(shù)據(jù)處理的深度、廣度和速度,而機(jī)器學(xué)習(xí)成為數(shù)據(jù)科學(xué)的重要技術(shù)手段,市場(chǎng)數(shù)據(jù)科學(xué)應(yīng)用以單點(diǎn)技術(shù)和場(chǎng)景為主。

" 大數(shù)據(jù)成為孕育 AI 的沃土,AI 則是大數(shù)據(jù)的重要使用者。在這一波人工智能浪潮中,AI 逐漸成為新一代基礎(chǔ)設(shè)施,多模態(tài)數(shù)據(jù)需要進(jìn)入到可分析、可解釋、可參與預(yù)測(cè)和決策輔助的場(chǎng)景中來(lái)。" 蘇萌表示道。

因此,進(jìn)入到數(shù)據(jù)科學(xué) 3.0 時(shí)代,無(wú)論是數(shù)據(jù)的復(fù)雜度,還是技術(shù)迭代發(fā)展的速度,亦或是各種場(chǎng)景與數(shù)據(jù)、技術(shù)的深化融合程度,均遠(yuǎn)勝過(guò)往,這意味著單一工具和單點(diǎn)技術(shù)已經(jīng)不能滿足用戶(hù)訴求。

" 端到端的數(shù)據(jù)科學(xué)解決方案成為大勢(shì)所趨。" 蘇萌介紹道。事實(shí)的確如此, Plantir、Alteryx、百分點(diǎn)科技等國(guó)內(nèi)外企業(yè)均致力于完善和迭代數(shù)據(jù)科學(xué)平臺(tái)產(chǎn)品體系,構(gòu)建端到端數(shù)據(jù)科學(xué)解決方案,降低數(shù)據(jù)集成、數(shù)據(jù)清洗等底層工作復(fù)雜度,加快數(shù)據(jù)科學(xué)在千行百業(yè)中的落地。

這其中,百分點(diǎn)科技的數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái) DeepMatrix 又尤為值得關(guān)注。

DeepMatrix,樹(shù)立數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)標(biāo)桿

正所謂工欲善其事必先利其器。

當(dāng)下,很多行業(yè)用戶(hù)一方面數(shù)據(jù)規(guī)模越來(lái)越大、數(shù)據(jù)類(lèi)型愈發(fā)廣泛和豐富、數(shù)據(jù)孤島現(xiàn)象愈發(fā)普遍;另一方面,實(shí)時(shí)數(shù)據(jù)分析需求愈發(fā)增長(zhǎng),數(shù)據(jù)安全可信合規(guī)保障難度又持續(xù)提高,使得數(shù)據(jù)要素的充分釋放依然面臨諸多挑戰(zhàn)。

例如,根據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì)顯示,當(dāng)前全球注入 AI 模型的數(shù)據(jù)連 1% 都達(dá)不到,數(shù)據(jù)要素的釋放在未來(lái)有著巨大空間。

無(wú)疑,數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)就是廣大行業(yè)用戶(hù)們釋放數(shù)據(jù)要素潛能的利器。Gartner 認(rèn)為,面向未來(lái),數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)必須實(shí)現(xiàn)全生命周期的數(shù)據(jù)科學(xué)活動(dòng),能夠自動(dòng)化或增強(qiáng)數(shù)據(jù)處理、模型構(gòu)建、在線服務(wù)的各項(xiàng)工作;同時(shí),還具備多人協(xié)作和廣泛的開(kāi)源與集成能力。

" 數(shù)據(jù)科學(xué)不能脫離真實(shí)場(chǎng)景。本質(zhì)上,數(shù)據(jù)科學(xué)是一項(xiàng)團(tuán)隊(duì)型任務(wù),必須具備三大核心能力:軟技能、一體化工具和領(lǐng)域知識(shí),而數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)則可以很好地支撐起這三大核心能力。" 百分點(diǎn)科技 CTO 劉譯璟表示道。

因此,百分點(diǎn)科技根據(jù)過(guò)去十三年里多個(gè)行業(yè)數(shù)據(jù)價(jià)值實(shí)現(xiàn)的豐富實(shí)踐,逐步打造出數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái) --DeepMatrix,沉淀出規(guī)劃設(shè)計(jì)、數(shù)據(jù)治理、建模分析和數(shù)據(jù)應(yīng)用四大階段,覆蓋數(shù)據(jù)價(jià)值實(shí)現(xiàn)的全生命周期,具備全面數(shù)據(jù)類(lèi)型支持、完善數(shù)據(jù)治理能力、強(qiáng)大數(shù)據(jù)建模能力、豐富數(shù)據(jù)洞察能力、高效知識(shí)生產(chǎn)能力和高度復(fù)用領(lǐng)域知識(shí)六大能力。

據(jù)悉,DeepMatrix 數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)具備兩大特征:一是知識(shí)化,不斷將程序性知識(shí)、事實(shí)性知識(shí)和概念性知識(shí)等數(shù)據(jù)科學(xué)知識(shí)沉淀到平臺(tái)之中,有效解決傳統(tǒng)企業(yè)數(shù)字化轉(zhuǎn)型面臨的數(shù)據(jù)科學(xué)冷啟動(dòng)問(wèn)題。例如,在數(shù)據(jù)建模方面,DeepMatrix 已經(jīng)沉淀了數(shù)百個(gè)機(jī)器學(xué)習(xí)算法、領(lǐng)域模型并支持多語(yǔ)種語(yǔ)義分析,大部分都是經(jīng)過(guò)行業(yè)真實(shí)場(chǎng)景驗(yàn)證過(guò)的。

二是智能化,DeepMatrix 內(nèi)置了智能輔助開(kāi)發(fā)系統(tǒng),自動(dòng)化輔助開(kāi)發(fā)者選擇方案和完成數(shù)據(jù)適配,并智能化進(jìn)行方案精調(diào)和改進(jìn),并在數(shù)據(jù)治理等多個(gè)環(huán)節(jié)依托知識(shí)庫(kù)和語(yǔ)義理解等智能技術(shù)幫助開(kāi)發(fā)者提升效率。例如,在數(shù)據(jù)治理方面,DeepMatrix 具有上萬(wàn)個(gè)領(lǐng)域數(shù)據(jù)標(biāo)準(zhǔn),可以智能構(gòu)建數(shù)據(jù)標(biāo)準(zhǔn)和血緣,并具備零代碼數(shù)據(jù)服務(wù)。

" 過(guò)去,在單點(diǎn)場(chǎng)景的數(shù)據(jù)價(jià)值實(shí)現(xiàn)中,大家往往是依托各種半工具化產(chǎn)品;如今,端到端的數(shù)據(jù)價(jià)值需求趨勢(shì)明顯,需要通過(guò)集成化、工程化、服務(wù)化的數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)來(lái)幫助用戶(hù)充分釋放數(shù)據(jù)要素的潛能。" 劉譯璟補(bǔ)充道。

無(wú)疑,對(duì)于數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)的構(gòu)建,百分點(diǎn)科技的 DeepMatrix 已經(jīng)樹(shù)立了標(biāo)桿。百分點(diǎn)科技不僅具有多年的行業(yè)實(shí)踐經(jīng)驗(yàn),其數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)在多種復(fù)雜場(chǎng)景中均得到很好淬煉;另外,百分點(diǎn)數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)還獲得各大機(jī)構(gòu)的廣泛認(rèn)可,多次入圍 Forrester AI/ML(人工智能 / 機(jī)器學(xué)習(xí))平臺(tái)報(bào)告,并且在信通院數(shù)據(jù)中臺(tái)解決方案專(zhuān)項(xiàng)評(píng)測(cè)中,以 283 個(gè)用例全部通過(guò)的方式獲得優(yōu)秀級(jí)(最高級(jí))認(rèn)證。

數(shù)據(jù)科學(xué)市場(chǎng)需要領(lǐng)頭羊

" 在數(shù)字中國(guó)建設(shè)中,釋放數(shù)據(jù)生產(chǎn)力是關(guān)鍵。除了東數(shù)西算等基礎(chǔ)設(shè)施硬件建設(shè)外,還需要構(gòu)建數(shù)據(jù)文化、推動(dòng)數(shù)據(jù)科學(xué)發(fā)展等‘軟實(shí)力’的建設(shè),這樣才能把數(shù)據(jù)生產(chǎn)力徹底釋放出來(lái)。" 北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院、光華管理學(xué)院教授,中國(guó)科學(xué)院院士陳松蹊在 2023 數(shù)據(jù)科學(xué)峰會(huì)上如是說(shuō)。

據(jù)市場(chǎng)研究機(jī)構(gòu) MarketsandMarkets 評(píng)估,2021 年全球數(shù)據(jù)科學(xué)平臺(tái)市場(chǎng)規(guī)模為 953 億美元,預(yù)計(jì) 2026 年數(shù)據(jù)科學(xué)平臺(tái)市場(chǎng)規(guī)模將達(dá)到 3229 億美元,復(fù)合年增長(zhǎng)率 ( CAGR ) 為 27.7%。毫無(wú)疑問(wèn),隨著中國(guó)數(shù)字經(jīng)濟(jì)的快速發(fā)展,中國(guó)數(shù)據(jù)科學(xué)的市場(chǎng)應(yīng)用前景、增長(zhǎng)速度和未來(lái)空間更值得期待。

大數(shù)據(jù)在線認(rèn)為,中國(guó)數(shù)據(jù)科學(xué)市場(chǎng)方興未艾,市場(chǎng)更加需要產(chǎn)業(yè)領(lǐng)頭羊來(lái)牽引產(chǎn)業(yè)良性發(fā)展、加速技術(shù)創(chuàng)新和行業(yè)實(shí)踐、普及數(shù)據(jù)科學(xué)文化和培養(yǎng)人才。相比于阿里、華為這些綜合型選手,百分點(diǎn)科技更像是一個(gè)數(shù)據(jù)科學(xué)領(lǐng)域的專(zhuān)業(yè)型選手,聚焦和專(zhuān)注數(shù)據(jù)科學(xué)領(lǐng)域多年,并且正在數(shù)據(jù)科學(xué)市場(chǎng)跑出領(lǐng)先身位。

首先,百分點(diǎn)科技多年以來(lái)致力于數(shù)據(jù)科學(xué)技術(shù)的應(yīng)用探索。從國(guó)內(nèi)規(guī)模最大的推薦引擎技術(shù)服務(wù)商,率先將數(shù)據(jù)科學(xué)技術(shù)服務(wù) 2000 多家互聯(lián)網(wǎng)電商和媒體客戶(hù),到敏銳覺(jué)察到大數(shù)據(jù)在 To B 領(lǐng)域數(shù)字化轉(zhuǎn)型的重要價(jià)值,將積累下來(lái)的數(shù)據(jù)科學(xué)技術(shù)、產(chǎn)品和應(yīng)用到下沉到金融、零售、媒體等多個(gè)行業(yè);再到將在互聯(lián)網(wǎng)和企業(yè)服務(wù)沉淀的數(shù)據(jù)科學(xué)產(chǎn)品與技術(shù)應(yīng)用于政務(wù)領(lǐng)域,面向數(shù)字城市、公安、應(yīng)急、統(tǒng)計(jì)等領(lǐng)域,利用數(shù)據(jù)科學(xué)助力政府治理能力提升和治理體系現(xiàn)代化。

其次,百分點(diǎn)科技非常注重?cái)?shù)據(jù)科學(xué)技術(shù)的生態(tài)良性建設(shè)。以標(biāo)準(zhǔn)為例,百分點(diǎn)科技參與信標(biāo)委大數(shù)據(jù)和人工智能標(biāo)準(zhǔn)工作組,參與制定大數(shù)據(jù)參考架構(gòu)、術(shù)語(yǔ)等多項(xiàng)國(guó)家標(biāo)準(zhǔn)和應(yīng)急管理、生態(tài)環(huán)境等行業(yè)標(biāo)準(zhǔn)的研制,持續(xù)將自身最佳實(shí)踐輸出給標(biāo)準(zhǔn)機(jī)構(gòu);此外,百分點(diǎn)科技還與華為、百度智能云、京東云等合作伙伴緊密合作,共同推動(dòng)數(shù)據(jù)科學(xué)技術(shù)生態(tài)的持續(xù)發(fā)展。

第三,百分點(diǎn)科技一直重視數(shù)據(jù)科學(xué)文化的建設(shè)。以人才培養(yǎng)為例,針對(duì)數(shù)據(jù)科學(xué)人才培養(yǎng)與實(shí)際需求脫鉤的情況,百分點(diǎn)科技近年來(lái)攜手國(guó)內(nèi)各大高校聯(lián)合推出了數(shù)據(jù)科學(xué)產(chǎn)教融合計(jì)劃,將多年的實(shí)踐經(jīng)驗(yàn)、軟件、工具與最新案例提供給高校,為高校學(xué)生提供實(shí)操培訓(xùn)。

而針對(duì)行業(yè)用戶(hù)的數(shù)據(jù)科學(xué)能力建設(shè),百分點(diǎn)科技還聯(lián)合 IDC 發(fā)布業(yè)界首份數(shù)據(jù)能力進(jìn)階白皮書(shū)《用數(shù)據(jù)創(chuàng)造價(jià)值 以智能激發(fā)增長(zhǎng) -- 數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)白皮書(shū)》,為廣大行業(yè)用戶(hù)的數(shù)據(jù)科學(xué)能力建設(shè)、數(shù)據(jù)思維形成和數(shù)據(jù)文化推廣提供了重要的參考價(jià)值。

" 未來(lái),大數(shù)據(jù)、AI、云計(jì)算、智能交互等技術(shù)將與物理世界深度融合,將迎來(lái)數(shù)據(jù)原生時(shí)代。數(shù)據(jù)模態(tài)會(huì)更加豐富、質(zhì)量更高、時(shí)效性更強(qiáng),算法會(huì)更先進(jìn)、算力要求會(huì)更強(qiáng)。百分點(diǎn)科技將繼續(xù)致力于以數(shù)據(jù)科學(xué)來(lái)加速數(shù)智化能力進(jìn)階,用數(shù)據(jù)科學(xué)構(gòu)建更智能的世界。" 蘇萌最后表示道。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-04-16
釋放數(shù)據(jù)價(jià)值這道難題,數(shù)據(jù)科學(xué)基礎(chǔ)平臺(tái)有解
去年底,《中共中央、國(guó)務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見(jiàn)》(以下簡(jiǎn)稱(chēng):" 數(shù)據(jù)二十條 ")正式頒布,標(biāo)志著數(shù)據(jù)基礎(chǔ)制...

長(zhǎng)按掃碼 閱讀全文