紅遍全球的云原生數(shù)據(jù)庫,未來將走向何方?

科技云報道原創(chuàng)。

如今,企業(yè)面臨著指數(shù)級遞增的海量存儲需求,業(yè)務(wù)也面臨更多的熱點和突發(fā)流量帶來的挑戰(zhàn)。由于企業(yè)需要降本增效,進行更智能的數(shù)據(jù)決策,傳統(tǒng)的商業(yè)數(shù)據(jù)庫已經(jīng)難以滿足和響應(yīng)快速增長的業(yè)務(wù)訴求。

在此背景下,云原生數(shù)據(jù)庫成為大勢所趨,不管是老牌的數(shù)據(jù)庫廠商,還是大型云計算企業(yè)都在向這一趨勢靠攏。

全球知名咨詢公司Gartner指出,云將主導(dǎo)數(shù)據(jù)庫市場的未來,到2022年,75%的數(shù)據(jù)庫將被部署或遷移至云平臺,只有25%的數(shù)據(jù)庫會在本地運行。云化無疑代表了未來,企業(yè)如何在云原生架構(gòu)下使用數(shù)據(jù)庫,就成為必須要思考的問題。

云原生數(shù)據(jù)庫正當時

云原生數(shù)據(jù)庫,是一種通過云平臺進行構(gòu)建、部署和分發(fā)的服務(wù)。這種云原生屬性是相比于其他類型數(shù)據(jù)庫最大的特點。作為一種云平臺,云原生數(shù)據(jù)庫以PaaS的形式進行分發(fā),用戶可以將該平臺用于多種目的,例如存儲、管理和提取數(shù)據(jù)。

云原生數(shù)據(jù)庫通常通過在云基礎(chǔ)設(shè)施之上安裝數(shù)據(jù)庫軟件來實現(xiàn),這種方式使得云原生數(shù)據(jù)庫具備了傳統(tǒng)數(shù)據(jù)庫所不具備的直接訪問性和運行時可伸縮性。

首先是普遍可訪問和高可用性。

因為云原生數(shù)據(jù)庫是完全存在于云上的,所以可以隨時隨地從多前端訪問,提供云服務(wù)的計算節(jié)點。因其集群部署在云上,所以單點失敗對服務(wù)的影響特別小。當需要升級或更換服務(wù)的時候,可以對節(jié)點進行不中斷服務(wù)的逐漸升級。

其次是高擴展性與可遷移性。

云原生數(shù)據(jù)庫會與底層的云計算基礎(chǔ)設(shè)施分離,所以能夠靈活及時的調(diào)動資源進行擴容和縮容,從容應(yīng)對流量激增可能帶來的壓力,以及流量低谷期因資源過剩造成的浪費。正是因為能夠靈活擴縮容,云原生數(shù)據(jù)庫也具備很強的可遷移性,我們甚至可以粗暴的理解為,在新的位置擴容100%,又在舊的位置縮容全部的50%。

此外,云原生數(shù)據(jù)庫還具備可監(jiān)控性和安全性的特征。

在傳統(tǒng)數(shù)據(jù)庫的黑箱狀態(tài)下,是無法保證及時處理擴容、節(jié)點故障等需求和問題的,但是云原生數(shù)據(jù)庫全盤部署在云上,且各服務(wù)之間相互獨立,因此可以對應(yīng)用或服務(wù)提供更多層的安全防護,并實現(xiàn)許多新的容錯服務(wù)。

最后是演進式設(shè)計與快速迭代。

云原生數(shù)據(jù)庫中的各項服務(wù)之間是相互獨立的,個別服務(wù)的更新并不會對其他部分產(chǎn)生不利影響,而不是一旦出了問題就只能全場熄火。此外,云原生的研發(fā)測試和運維工具是高度自動化的,這使得應(yīng)用的更新會更加快速頻繁。

下一代云原生數(shù)據(jù)庫架構(gòu)

近十年是數(shù)據(jù)庫市場發(fā)展最快的十年。根據(jù)Gartner的數(shù)據(jù),目前數(shù)據(jù)庫市場營收已經(jīng)達到整個軟件市場的18.4%,而云數(shù)據(jù)庫貢獻了其中的68%。

特別是近幾年,云原生數(shù)據(jù)庫的理念為市場和各大云廠商所認可,各大廠商紛紛在自研云原生數(shù)據(jù)庫領(lǐng)域持續(xù)發(fā)力,未來的云數(shù)據(jù)庫市場是自研云原生數(shù)據(jù)庫之間的競爭。

在云原生數(shù)據(jù)庫領(lǐng)域,AWS于2014年推出的Aurora是先行者。國內(nèi)廠商也不甘落后,阿里云在2017年推出了PolarDB,騰訊云在2018年推出了CynosDB,華為云在2020年推出了GaussDB for MySQL。各大廠商都希望基于成熟的基礎(chǔ)設(shè)施“云”化技術(shù),解決傳統(tǒng)數(shù)據(jù)庫架構(gòu)上的短板。

盡管云原生數(shù)據(jù)庫的出現(xiàn),很好地解決了傳統(tǒng)架構(gòu)數(shù)據(jù)庫的諸多缺陷,如:數(shù)據(jù)問題回檔慢、維護成本高、可用性低、故障恢復(fù)慢等,讓企業(yè)能夠更高性能且靈活地訪問數(shù)據(jù)。但不可否認的是,云原生數(shù)據(jù)庫才剛剛走出了第一步。

首先是實現(xiàn)了存儲和計算分離,打破了存儲的單機限制,使得存儲獨立彈性成為可能,并為后續(xù)的一寫多讀集群奠定了基礎(chǔ)。

其次是基于分布式共享存儲的一寫多讀架構(gòu),使得數(shù)據(jù)庫的讀能力可以快速Scale Out,同時由于多個讀節(jié)點和寫節(jié)點共享同一份存儲,降低了成本,提升了資源利用率。

雖然當前的云原生架構(gòu)解決了存儲的彈性問題和讀擴展問題,極大的提升了云原生數(shù)據(jù)庫的彈性和擴展能力,但是依然存在兩個比較大的瓶頸點,即內(nèi)存彈性和單點寫入問題。

因此,阿里云數(shù)據(jù)庫的總負責人、達摩院數(shù)據(jù)庫首席科學家李飛飛認為,下一代云原生數(shù)據(jù)庫架構(gòu)將在以下兩個方向?qū)崿F(xiàn)突破:

基于CPU和內(nèi)存分離的分布式共享內(nèi)存池

當前的云原生架構(gòu)雖然實現(xiàn)了存儲和計算分離,存儲獨立彈性,但是計算節(jié)點仍然包含了CPU和內(nèi)存,無法真正實現(xiàn)秒級彈性擴容和Serverless。因此在云原生數(shù)據(jù)庫中實現(xiàn)CPU和內(nèi)存分離,內(nèi)存獨立彈性非常有必要。同時CPU和內(nèi)存分離可以讓多個CPU共享同一份內(nèi)存,降低內(nèi)存資源開銷。

基于分布式共享內(nèi)存池的多點可寫技術(shù)

當前一寫多讀的云原生架構(gòu),雖然實現(xiàn)了讀能力的擴展,但是寫能力仍然受到單機的限制,無法擴展。而采用分庫分表的分布式數(shù)據(jù)庫擴展,又會犧牲兼容性,需要應(yīng)用感知和改造。

多寫架構(gòu)主要困難在于信息交互的低效,導(dǎo)致線性擴展性低下。在CPU和內(nèi)存分離以后,多個CPU可以共享同一個內(nèi)存池來交換頁面信息和事務(wù)信息,同時結(jié)合高性能RDMA網(wǎng)絡(luò)和NVM,使得高性能多寫架構(gòu)成為可能。

未來的云原生分布式數(shù)據(jù)庫

隨著企業(yè)業(yè)務(wù)更加數(shù)字化、智能化,企業(yè)面臨的數(shù)據(jù)存儲量將會更加巨大,面臨著更多突發(fā)狀況帶來的挑戰(zhàn)。據(jù)IDC預(yù)測,2025年,三分之二的企業(yè)將會每天都發(fā)布軟件版本,通過敏捷的開發(fā)能力來實現(xiàn)創(chuàng)新與交付,以形成差異化的市場競爭力。

在這樣的商業(yè)趨勢下,數(shù)據(jù)庫就需要全面進入云原生+分布式的時代,實現(xiàn)智能升級,充分釋放云計算紅利。

所謂的分布式,是面向業(yè)務(wù)擴展而出現(xiàn)的一個概念,而分布式數(shù)據(jù)庫,就是為了解決存儲可擴展性的一類數(shù)據(jù)庫。

它是由多個相互連接的數(shù)據(jù)庫組成,這些數(shù)據(jù)庫分布在各個數(shù)據(jù)中心,通過中央服務(wù)器進行通信,然后組合在一起形成一個面向用戶的單個數(shù)據(jù)庫。基于Shared Nothing的架構(gòu),分布式數(shù)據(jù)庫能夠?qū)崿F(xiàn)數(shù)據(jù)的水平分片、水平擴展。

而云原生數(shù)據(jù)庫是基于Shared Everything + Shared Storage 的存儲計算分離架構(gòu),能夠?qū)崿F(xiàn)資源池化高效管理。

因此,云原生數(shù)據(jù)庫的優(yōu)勢+分布式數(shù)據(jù)庫的效率,可以將兩者的特性完美結(jié)合,代表了一種未來的解決方案。

事實上,云原生和分布式如今已經(jīng)融為一體。如果底層基礎(chǔ)設(shè)施全部云化,人們思考技術(shù)問題的角度自然變成“云原生”角度。

正如華為輪值董事長徐直軍所說,隨著云原生應(yīng)用深入企業(yè)各個業(yè)務(wù)場景,云原生正在走向分布式,滿足跨云跨地域統(tǒng)一協(xié)同治理、保證一致應(yīng)用體驗等新需求。

未來,將云原生與分布式結(jié)合起來,全新的云原生分布式架構(gòu)的數(shù)據(jù)庫將具備高擴展性、易用性、迭代快速、成本降低等特點,具體而言:

高擴展性

云原生分布式數(shù)據(jù)庫與底層的云計算基礎(chǔ)設(shè)施分離,所以能夠靈活及時調(diào)動資源進行擴容縮容,以從容應(yīng)對流量激增帶來的壓力,以及流量低谷期因資源過剩造成的浪費。生態(tài)兼容的特點,也讓云原生數(shù)據(jù)庫具備很強的可遷移性。

易用性

云原生分布式數(shù)據(jù)庫非常易于使用,它的計算節(jié)點在云端部署,可以隨時隨地從多前端訪問。因其集群部署在云上,通過自動化的容災(zāi)與高可用能力,單點失敗對服務(wù)的影響非常小。當需要升級或更換服務(wù)時,還可以對節(jié)點進行不中斷服務(wù)的輪轉(zhuǎn)升級。

快速迭代

云原生分布式數(shù)據(jù)庫中的各項服務(wù)之間相互獨立,個別服務(wù)的更新不會對其他部分產(chǎn)生影響。此外,云原生的研發(fā)測試和運維工具高度自動化,也就可以實現(xiàn)更加敏捷的更新與迭代。

節(jié)約成本

建立數(shù)據(jù)中心是一項獨立而完備的工程,需要大量的硬件投資以及管理和維護數(shù)據(jù)中心的專業(yè)運維人員。此外,持續(xù)運維會造成很大的財務(wù)壓力。云原生分布式數(shù)據(jù)庫以較低的前期成本,獲得一個可擴展的數(shù)據(jù)庫,實現(xiàn)更優(yōu)化的資源分配。

結(jié)語

應(yīng)用程序和軟件開發(fā)正在經(jīng)歷一場云原生的變革,從編排、管理到分析,所有的東西都開始在云上從頭構(gòu)建。由于在功能和可靠性上優(yōu)于傳統(tǒng)數(shù)據(jù)庫,再加上增強的可伸縮性,云原生分布式數(shù)據(jù)庫無疑代表了數(shù)據(jù)庫的未來??梢灶A(yù)見,誰能夠把云原生和分布式技術(shù)結(jié)合得更加完美,誰就會在未來的市場競爭中占得先機。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2022-01-10
紅遍全球的云原生數(shù)據(jù)庫,未來將走向何方?
紅遍全球的云原生數(shù)據(jù)庫,未來將走向何方?

長按掃碼 閱讀全文