都說數(shù)據(jù)庫是三大基礎(chǔ)軟件中的一塊硬骨頭,技術(shù)門檻高、研發(fā)周期長、工程要求高,市場長期被幾大巨頭所把持。
因此,實現(xiàn)突破一直是中國數(shù)據(jù)庫產(chǎn)業(yè)的夙愿。自上個世紀(jì)80年代起,中國數(shù)據(jù)庫產(chǎn)業(yè)走過艱辛坎坷的四十余載,終于擁有一席之地。但當(dāng)中國逐漸成長為全球最大數(shù)據(jù)圈之際,中國數(shù)據(jù)庫產(chǎn)業(yè)又面臨著全新局面:
一方面,數(shù)字經(jīng)濟帶來持續(xù)且豐富的數(shù)據(jù)庫需求,中國數(shù)據(jù)庫市場的未來普遍被看好;另一方面,市場涌現(xiàn)出上百家數(shù)據(jù)庫公司,重復(fù)建設(shè)的現(xiàn)象突出,出現(xiàn)一定的亂象;更加重要的是,面對日趨復(fù)雜且多樣的數(shù)據(jù)處理需求,數(shù)據(jù)庫理論和核心技術(shù)亟待突破,以更好適應(yīng)未來市場需求。
洗盡鉛華始見金,中國數(shù)據(jù)庫產(chǎn)業(yè)之路該走向何方?近日深圳計算科學(xué)研究院(以下簡稱深算院)YashanDB團隊接受大數(shù)據(jù)在線的專訪,暢談中國數(shù)據(jù)庫產(chǎn)業(yè)發(fā)展等話題。YashanDB產(chǎn)品總監(jiān)王南認(rèn)為數(shù)據(jù)庫的發(fā)展必須突破關(guān)鍵核心技術(shù),唯有潛心實干才是出路。目前,YashanDB正積極探索一條產(chǎn)學(xué)研用的新路,即致力于數(shù)據(jù)庫理論與核心技術(shù)的突破,利用前沿研究成果,緊密貼合市場需求,打造出世界一流的數(shù)據(jù)庫產(chǎn)品。
野蠻生長不可取
IDC數(shù)據(jù)顯示,2022年中國關(guān)系型數(shù)據(jù)庫市場規(guī)模為34.3億美元,同比增長23.9%;到2027年,規(guī)模有望達到102.7億美元,年復(fù)合增長率為24.5%。中金研究報告也顯示,2023-2027年數(shù)據(jù)庫整體國產(chǎn)替換市場空間約400億元。
毋庸置疑,中國數(shù)據(jù)庫市場潛力巨大。與此同時,信通院《數(shù)據(jù)庫發(fā)展白皮書》中提到,中國數(shù)據(jù)庫公司數(shù)量已達到150家,數(shù)據(jù)庫產(chǎn)品更是高達238款。在外部環(huán)境不確定性持續(xù)增加的大背景下,百花齊放的確讓市場欣欣向榮,卻也讓野蠻生長和重復(fù)建設(shè)的現(xiàn)象逐漸突出。
作為基礎(chǔ)軟件,數(shù)據(jù)庫有其自身規(guī)律,短時間涌現(xiàn)出如此數(shù)量的公司可能會造成兩個挑戰(zhàn):
其一、短期資本涌入造成繁榮的假象,但市場總體規(guī)模體量并不足以養(yǎng)活如此多公司,多數(shù)公司未來前景存疑;其二、數(shù)據(jù)庫是一項需要持續(xù)投入的基礎(chǔ)軟件領(lǐng)域,重復(fù)建設(shè)會讓市場人才、資金走向割裂,整體競爭力受損。
再仔細(xì)研究中國數(shù)據(jù)庫公司,大部分跟MySQL、PostgreSQL兩大開源數(shù)據(jù)庫有著千絲萬縷的聯(lián)系。不可否認(rèn),開源在推動中國數(shù)據(jù)庫產(chǎn)業(yè)高速發(fā)展中發(fā)揮著關(guān)鍵性作用,也絕對是數(shù)據(jù)庫產(chǎn)業(yè)未來重要的發(fā)展趨勢之一。但開源≠免費,在云計算興起的當(dāng)下,甚至頻出各種利益糾葛,像MySQL的GPL協(xié)議在開源協(xié)議中要求最為嚴(yán)格,未來如何發(fā)展取決于Oracle的態(tài)度。如果通過利用開源快速包裝出“速成”產(chǎn)品,以達到搶奪市場的目的,這種做法未來存在巨大風(fēng)險。
當(dāng)下,這種“走捷徑”的做法已產(chǎn)生一定影響。例如,CSDN 《2022-2023 中國基礎(chǔ)軟硬件-數(shù)據(jù)庫開發(fā)者調(diào)查報告》顯示,只有31%的開發(fā)者對國產(chǎn)數(shù)據(jù)庫持正面看法,69%的開發(fā)者均對國產(chǎn)數(shù)據(jù)庫持負(fù)面看法。
“數(shù)據(jù)庫等基礎(chǔ)軟件沒有捷徑可走。數(shù)據(jù)庫要想持續(xù)發(fā)展,需要有足夠的戰(zhàn)略定力,圍繞理論創(chuàng)新與技術(shù)突破,才能真正解決數(shù)據(jù)庫的基本問題。”YashanDB產(chǎn)品總監(jiān)王南如是說。
數(shù)據(jù)庫核心技術(shù)突破沒有捷徑可走
本質(zhì)上,數(shù)據(jù)庫屬于軟件重工業(yè),工程化程度極高,投入大、見效慢,并且回報帶有極大不確定性。要想在數(shù)據(jù)庫領(lǐng)域有一番作為,需要直面資金、技術(shù)、人才和商業(yè)化四個最為關(guān)鍵的挑戰(zhàn)。
例如,數(shù)據(jù)庫的研發(fā)需要持續(xù)投入大量資金,投入少、依靠開源“走捷徑”,本質(zhì)上很難獲得核心競爭力,又如面臨核心內(nèi)核人才不足、商業(yè)化落地等難題。
但最為重要的挑戰(zhàn)無疑就是技術(shù)突破。當(dāng)前的數(shù)據(jù)庫市場類似新能源汽車市場早期,市場存在大量公司,但真正掌握核心技術(shù)的公司卻是不多。在數(shù)據(jù)庫關(guān)鍵技術(shù)挑戰(zhàn)中,又以數(shù)據(jù)庫理論創(chuàng)新最為關(guān)鍵,核心技術(shù)發(fā)展有賴于數(shù)據(jù)庫理論創(chuàng)新。
顯然,在用戶業(yè)務(wù)類型、場景規(guī)模、數(shù)據(jù)量等均發(fā)生翻天覆地變化的今天,數(shù)據(jù)庫的理論創(chuàng)新迫在眉睫,也正是當(dāng)下中國數(shù)據(jù)庫企業(yè)需要潛心實干的方向。只有在數(shù)據(jù)庫理論實現(xiàn)創(chuàng)新與突破,才能點到面帶來產(chǎn)品技術(shù)的全面變革,從而支撐起未來業(yè)務(wù)場景的需求。
在當(dāng)下的中國數(shù)據(jù)庫市場,深算院是為數(shù)不多致力于數(shù)據(jù)庫理論研究與創(chuàng)新的機構(gòu),深算院的理論研究團隊原創(chuàng)有界計算(bounded evaluation)、數(shù)據(jù)驅(qū)動的近似計算(data-driven approximation)、并發(fā)事務(wù)調(diào)度理論等系列創(chuàng)新理論,致力于持續(xù)探索數(shù)據(jù)庫核心技術(shù)的突破。
像有界計算理論是把大數(shù)據(jù)計算規(guī)約成小數(shù)據(jù)上的處理,近似計算則可在硬件規(guī)模投入有限的情況下,實現(xiàn)大數(shù)據(jù)精確高效查詢。深算院的理論研究成果對于很多身處大數(shù)據(jù)時代的行業(yè)用戶極具現(xiàn)實價值。
當(dāng)前,性能與成本依然是數(shù)據(jù)庫產(chǎn)品選型的核心要素。然而,計算資源的增長速度遠(yuǎn)遠(yuǎn)跟不上數(shù)據(jù)增長的速度,盡管堆疊機器增加算力也難以應(yīng)對海量數(shù)據(jù)的計算要求,還會導(dǎo)致成倍的運維問題和成本。而有界計算和近似計算則有望打破傳統(tǒng)數(shù)據(jù)庫理論的束縛,讓數(shù)據(jù)庫的性能與成本達到新高度。
例如,曾經(jīng)通過測試發(fā)現(xiàn),在某業(yè)務(wù)場景數(shù)十億條數(shù)據(jù)的實時查詢場景下,91% 的查詢可以用有界計算來解決,并且 70% 以上的查詢效率可以提升 25 倍到 14 萬倍,剩余 9% 不具備有界計算條件的查詢,可以通過數(shù)據(jù)驅(qū)動的近似計算理論來解決。
但從理論創(chuàng)新到落地產(chǎn)品的過程絕非易事,需要持續(xù)的驗證、迭代和優(yōu)化。YashanDB研發(fā)團隊從原型開始驗證,歷經(jīng)各種困難與挑戰(zhàn),逐步在YashanDB中融入這兩大理論研究成果。在最新的YashanDB 版本中,YashanDB 實現(xiàn)在大數(shù)據(jù)分析時不需要訪問全部數(shù)據(jù),只需取其中的小數(shù)據(jù)集就能得到想要的結(jié)果。經(jīng)過實測,數(shù)據(jù)量從 10GB 增長到 1TB,YashanDB 響應(yīng)時延維持亞秒級,性能提升千倍以上且未衰減,性能與成本表現(xiàn)出色。
據(jù)悉,YashanDB從核心理論到關(guān)鍵技術(shù)均為原創(chuàng),且高度兼容主流數(shù)據(jù)庫。YashanDB自身產(chǎn)品能力較為全面,基于YashanDB內(nèi)核,打造出單機/主備、共享集群、分布式等多種產(chǎn)品形態(tài),覆蓋OLTP/HTAP/OLAP負(fù)載場景,并提供完整的工具體系。王南透露,YashanDB會根據(jù)用戶場景來推薦不同的產(chǎn)品形態(tài)。
“我們以提高單位資源成本下的計算效能為目標(biāo)設(shè)計產(chǎn)品,不是堆疊機器追求‘規(guī)模上限’。”王南說道。在OLTP場景中,YashanDB通過細(xì)粒度并發(fā)控制、免鎖事務(wù)優(yōu)化和自適應(yīng)并發(fā)調(diào)度算法等技術(shù),最大程度提升單機的事務(wù)處理性能,提供可用于生產(chǎn)的Benchmark性能測試配置和測試數(shù)據(jù),性能超出主流商業(yè)數(shù)據(jù)庫30%以上。
“幾年前,大家可能還認(rèn)為中國數(shù)據(jù)庫內(nèi)核需要好多年才能成熟起來?!蓖跄媳硎镜?,“但現(xiàn)在從咱們一些數(shù)據(jù)庫產(chǎn)品在核心業(yè)務(wù)場景中的表現(xiàn)來看,數(shù)據(jù)庫核心技術(shù)只要沉下心去攻克,是一定能解決的?!?/p>
就如國產(chǎn)新能源汽車逐漸率先攻克自動駕駛、智能車機、底盤等核心技術(shù),在市場中脫穎而出一樣,扎根關(guān)鍵技術(shù)研發(fā)與突破的數(shù)據(jù)庫公司,從一開始就把地基打牢固,也有望在未來的市場中逐步實現(xiàn)引領(lǐng)?!皵?shù)據(jù)庫不存在彎道超車,掌握核心技術(shù)才是關(guān)鍵所在。如果核心技術(shù)不足,哪怕一開始‘走捷徑’,未來也走不遠(yuǎn)。”王南如是說。
商業(yè)化不能“紙上談兵”
總體來看,我國數(shù)據(jù)庫產(chǎn)業(yè)發(fā)展正處于欣欣向榮的階段,加速由“數(shù)量型”向“質(zhì)量型”關(guān)鍵轉(zhuǎn)變。這其中,商業(yè)化就是擺在很多中國數(shù)據(jù)庫公司面前的一道必答題。
在數(shù)據(jù)庫市場,光有突破性的數(shù)據(jù)庫核心技術(shù)、能力強大的數(shù)據(jù)庫產(chǎn)品還遠(yuǎn)遠(yuǎn)不夠,商業(yè)化則是將產(chǎn)品技術(shù)實現(xiàn)價值化的關(guān)鍵所在。眾所周知,我國數(shù)據(jù)庫公司相對還較為年輕,過去由于Oracle等數(shù)據(jù)庫巨頭長期占領(lǐng)市場,使得很多中國數(shù)據(jù)庫公司哪怕有諸多技術(shù)與產(chǎn)品的創(chuàng)新,卻很難有較多機會在金融等核心業(yè)務(wù)場景中得到驗證,從而陷入“技術(shù)、產(chǎn)品、場景”不能良性循環(huán)的怪圈,商業(yè)化之路極為曲折。
如今,隨著自主可控技術(shù)體系成為中國數(shù)字經(jīng)濟發(fā)展的重要支撐,中國數(shù)據(jù)庫也迎來了打破怪圈的契機。在王南看來,中國數(shù)據(jù)庫公司需要從場景驗證、應(yīng)用改造、選型成本、服務(wù)能力四個方面發(fā)力,從而加速推動商業(yè)化。
首先是場景驗證,比如金融核心業(yè)務(wù)場景,對于數(shù)據(jù)庫的性能、可靠性、穩(wěn)定性要求極高,隨著硬件層面的自主可控技術(shù)逐步進入到核心業(yè)務(wù)場景中,會帶來數(shù)據(jù)庫適配、性能波動等一系列挑戰(zhàn)。王南直言:“數(shù)據(jù)庫要想實現(xiàn)規(guī)模化復(fù)制,必須在關(guān)鍵行業(yè)和關(guān)鍵場景中去驗證,一步一步往前走,才能在行業(yè)廣度、業(yè)務(wù)場景中做到規(guī)模復(fù)制。”
以YashanDB為例,圍繞金融、央國企等重點行業(yè)的等他客戶和重點場景已經(jīng)做了相當(dāng)范圍的覆蓋和驗證。
其次是應(yīng)用改造的挑戰(zhàn)。像銀行等金融機構(gòu),由于歷史積累豐富、業(yè)務(wù)系統(tǒng)龐雜,比如分布式架構(gòu)的改造,需要解決規(guī)?;瘞淼某杀締栴},“這是一個關(guān)鍵矛盾,對于數(shù)據(jù)庫公司、用戶等都是巨大挑戰(zhàn)?!蓖跄涎a充道。
第三是降低客戶選型的成本。由于產(chǎn)品質(zhì)量參差不齊,客戶選型判斷成本過高。提供誠實可信的高性價比產(chǎn)品、公正透明的價格、完善的生態(tài)體系以及放心省心的服務(wù)方是破局之道。
最后則是需要解決好服務(wù)能力,目前國內(nèi)數(shù)據(jù)庫公司普遍面臨的困境就是面對場景的復(fù)雜性,需要有很重的服務(wù)投入,對于DBA團隊極為倚重。
相比于其他商業(yè)數(shù)據(jù)庫公司,依托深算院,YashanDB作為產(chǎn)學(xué)研“一體化”數(shù)據(jù)庫的代表,其商業(yè)化之路更加為業(yè)界所關(guān)注。王南介紹,YashanDB擁有深算院背后強大的科研資源,未來同樣希望加速商業(yè)化,將數(shù)據(jù)庫領(lǐng)域好的創(chuàng)新實現(xiàn)市場化,為中國企業(yè)的數(shù)字化轉(zhuǎn)型帶來更多價值。據(jù)悉,YashanDB接下來會進一步加速市場化和商業(yè)化進程,產(chǎn)品化、重點行業(yè)和生態(tài)合作伙伴布局也在緊鑼密鼓和有條不紊地推進中。
“我們有足夠的信心和戰(zhàn)略定力把YashanDB做好!”王南最后表示道。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 100億美元史上最大融資的背后,國內(nèi)外巨頭齊瞄準(zhǔn)Data+AI
- 有一種羨慕叫“別人家的年終獎”:京東采銷平均23薪,全網(wǎng)熱議“人的價值”
- 行業(yè)首個“人機大戰(zhàn)”對壘!AI翻譯已媲美人工
- 蘋果開啟年終大促,降價1200元,被國產(chǎn)手機嚇怕了?
- 1999 元起,OPPO A5 Pro 超防水、超抗摔、超耐用
- 長三角,如何把數(shù)據(jù)要素變成新長江?
- 大模型,在內(nèi)卷中尋找出口
- 比亞迪“天神之眼”重磅升級:無圖城市領(lǐng)航功能全國開通
- 不愿成為微信的支付寶,注定失敗
- 大廠年終獎全靠猜?京東帶頭透明化
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。