YashanDB:潛心實干,數(shù)據(jù)庫核心技術(shù)突破沒有捷徑可走

都說數(shù)據(jù)庫是三大基礎軟件中的一塊硬骨頭,技術(shù)門檻高、研發(fā)周期長、工程要求高,市場長期被幾大巨頭所把持。

因此,實現(xiàn)突破一直是中國數(shù)據(jù)庫產(chǎn)業(yè)的夙愿。自上個世紀80年代起,中國數(shù)據(jù)庫產(chǎn)業(yè)走過艱辛坎坷的四十余載,終于擁有一席之地。但當中國逐漸成長為全球最大數(shù)據(jù)圈之際,中國數(shù)據(jù)庫產(chǎn)業(yè)又面臨著全新局面:

一方面,數(shù)字經(jīng)濟帶來持續(xù)且豐富的數(shù)據(jù)庫需求,中國數(shù)據(jù)庫市場的未來普遍被看好;另一方面,市場涌現(xiàn)出上百家數(shù)據(jù)庫公司,重復建設的現(xiàn)象突出,出現(xiàn)一定的亂象;更加重要的是,面對日趨復雜且多樣的數(shù)據(jù)處理需求,數(shù)據(jù)庫理論和核心技術(shù)亟待突破,以更好適應未來市場需求。

洗盡鉛華始見金,中國數(shù)據(jù)庫產(chǎn)業(yè)之路該走向何方?近日深圳計算科學研究院(以下簡稱深算院)YashanDB團隊接受大數(shù)據(jù)在線的專訪,暢談中國數(shù)據(jù)庫產(chǎn)業(yè)發(fā)展等話題。YashanDB產(chǎn)品總監(jiān)王南認為數(shù)據(jù)庫的發(fā)展必須突破關鍵核心技術(shù),唯有潛心實干才是出路。目前,YashanDB正積極探索一條產(chǎn)學研用的新路,即致力于數(shù)據(jù)庫理論與核心技術(shù)的突破,利用前沿研究成果,緊密貼合市場需求,打造出世界一流的數(shù)據(jù)庫產(chǎn)品。

野蠻生長不可取

IDC數(shù)據(jù)顯示,2022年中國關系型數(shù)據(jù)庫市場規(guī)模為34.3億美元,同比增長23.9%;到2027年,規(guī)模有望達到102.7億美元,年復合增長率為24.5%。中金研究報告也顯示,2023-2027年數(shù)據(jù)庫整體國產(chǎn)替換市場空間約400億元。

毋庸置疑,中國數(shù)據(jù)庫市場潛力巨大。與此同時,信通院《數(shù)據(jù)庫發(fā)展白皮書》中提到,中國數(shù)據(jù)庫公司數(shù)量已達到150家,數(shù)據(jù)庫產(chǎn)品更是高達238款。在外部環(huán)境不確定性持續(xù)增加的大背景下,百花齊放的確讓市場欣欣向榮,卻也讓野蠻生長和重復建設的現(xiàn)象逐漸突出。

作為基礎軟件,數(shù)據(jù)庫有其自身規(guī)律,短時間涌現(xiàn)出如此數(shù)量的公司可能會造成兩個挑戰(zhàn):

其一、短期資本涌入造成繁榮的假象,但市場總體規(guī)模體量并不足以養(yǎng)活如此多公司,多數(shù)公司未來前景存疑;其二、數(shù)據(jù)庫是一項需要持續(xù)投入的基礎軟件領域,重復建設會讓市場人才、資金走向割裂,整體競爭力受損。

再仔細研究中國數(shù)據(jù)庫公司,大部分跟MySQL、PostgreSQL兩大開源數(shù)據(jù)庫有著千絲萬縷的聯(lián)系。不可否認,開源在推動中國數(shù)據(jù)庫產(chǎn)業(yè)高速發(fā)展中發(fā)揮著關鍵性作用,也絕對是數(shù)據(jù)庫產(chǎn)業(yè)未來重要的發(fā)展趨勢之一。但開源≠免費,在云計算興起的當下,甚至頻出各種利益糾葛,像MySQL的GPL協(xié)議在開源協(xié)議中要求最為嚴格,未來如何發(fā)展取決于Oracle的態(tài)度。如果通過利用開源快速包裝出“速成”產(chǎn)品,以達到搶奪市場的目的,這種做法未來存在巨大風險。

當下,這種“走捷徑”的做法已產(chǎn)生一定影響。例如,CSDN 《2022-2023 中國基礎軟硬件-數(shù)據(jù)庫開發(fā)者調(diào)查報告》顯示,只有31%的開發(fā)者對國產(chǎn)數(shù)據(jù)庫持正面看法,69%的開發(fā)者均對國產(chǎn)數(shù)據(jù)庫持負面看法。

“數(shù)據(jù)庫等基礎軟件沒有捷徑可走。數(shù)據(jù)庫要想持續(xù)發(fā)展,需要有足夠的戰(zhàn)略定力,圍繞理論創(chuàng)新與技術(shù)突破,才能真正解決數(shù)據(jù)庫的基本問題?!盰ashanDB產(chǎn)品總監(jiān)王南如是說。

數(shù)據(jù)庫核心技術(shù)突破沒有捷徑可走

本質(zhì)上,數(shù)據(jù)庫屬于軟件重工業(yè),工程化程度極高,投入大、見效慢,并且回報帶有極大不確定性。要想在數(shù)據(jù)庫領域有一番作為,需要直面資金、技術(shù)、人才和商業(yè)化四個最為關鍵的挑戰(zhàn)。

例如,數(shù)據(jù)庫的研發(fā)需要持續(xù)投入大量資金,投入少、依靠開源“走捷徑”,本質(zhì)上很難獲得核心競爭力,又如面臨核心內(nèi)核人才不足、商業(yè)化落地等難題。

但最為重要的挑戰(zhàn)無疑就是技術(shù)突破。當前的數(shù)據(jù)庫市場類似新能源汽車市場早期,市場存在大量公司,但真正掌握核心技術(shù)的公司卻是不多。在數(shù)據(jù)庫關鍵技術(shù)挑戰(zhàn)中,又以數(shù)據(jù)庫理論創(chuàng)新最為關鍵,核心技術(shù)發(fā)展有賴于數(shù)據(jù)庫理論創(chuàng)新。

顯然,在用戶業(yè)務類型、場景規(guī)模、數(shù)據(jù)量等均發(fā)生翻天覆地變化的今天,數(shù)據(jù)庫的理論創(chuàng)新迫在眉睫,也正是當下中國數(shù)據(jù)庫企業(yè)需要潛心實干的方向。只有在數(shù)據(jù)庫理論實現(xiàn)創(chuàng)新與突破,才能點到面帶來產(chǎn)品技術(shù)的全面變革,從而支撐起未來業(yè)務場景的需求。

在當下的中國數(shù)據(jù)庫市場,深算院是為數(shù)不多致力于數(shù)據(jù)庫理論研究與創(chuàng)新的機構(gòu),深算院的理論研究團隊原創(chuàng)有界計算(bounded evaluation)、數(shù)據(jù)驅(qū)動的近似計算(data-driven approximation)、并發(fā)事務調(diào)度理論等系列創(chuàng)新理論,致力于持續(xù)探索數(shù)據(jù)庫核心技術(shù)的突破。

像有界計算理論是把大數(shù)據(jù)計算規(guī)約成小數(shù)據(jù)上的處理,近似計算則可在硬件規(guī)模投入有限的情況下,實現(xiàn)大數(shù)據(jù)精確高效查詢。深算院的理論研究成果對于很多身處大數(shù)據(jù)時代的行業(yè)用戶極具現(xiàn)實價值。

當前,性能與成本依然是數(shù)據(jù)庫產(chǎn)品選型的核心要素。然而,計算資源的增長速度遠遠跟不上數(shù)據(jù)增長的速度,盡管堆疊機器增加算力也難以應對海量數(shù)據(jù)的計算要求,還會導致成倍的運維問題和成本。而有界計算和近似計算則有望打破傳統(tǒng)數(shù)據(jù)庫理論的束縛,讓數(shù)據(jù)庫的性能與成本達到新高度。

例如,曾經(jīng)通過測試發(fā)現(xiàn),在某業(yè)務場景數(shù)十億條數(shù)據(jù)的實時查詢場景下,91% 的查詢可以用有界計算來解決,并且 70% 以上的查詢效率可以提升 25 倍到 14 萬倍,剩余 9% 不具備有界計算條件的查詢,可以通過數(shù)據(jù)驅(qū)動的近似計算理論來解決。

但從理論創(chuàng)新到落地產(chǎn)品的過程絕非易事,需要持續(xù)的驗證、迭代和優(yōu)化。YashanDB研發(fā)團隊從原型開始驗證,歷經(jīng)各種困難與挑戰(zhàn),逐步在YashanDB中融入這兩大理論研究成果。在最新的YashanDB 版本中,YashanDB 實現(xiàn)在大數(shù)據(jù)分析時不需要訪問全部數(shù)據(jù),只需取其中的小數(shù)據(jù)集就能得到想要的結(jié)果。經(jīng)過實測,數(shù)據(jù)量從 10GB 增長到 1TB,YashanDB 響應時延維持亞秒級,性能提升千倍以上且未衰減,性能與成本表現(xiàn)出色。

據(jù)悉,YashanDB從核心理論到關鍵技術(shù)均為原創(chuàng),且高度兼容主流數(shù)據(jù)庫。YashanDB自身產(chǎn)品能力較為全面,基于YashanDB內(nèi)核,打造出單機/主備、共享集群、分布式等多種產(chǎn)品形態(tài),覆蓋OLTP/HTAP/OLAP負載場景,并提供完整的工具體系。王南透露,YashanDB會根據(jù)用戶場景來推薦不同的產(chǎn)品形態(tài)。

“我們以提高單位資源成本下的計算效能為目標設計產(chǎn)品,不是堆疊機器追求‘規(guī)模上限’?!蓖跄险f道。在OLTP場景中,YashanDB通過細粒度并發(fā)控制、免鎖事務優(yōu)化和自適應并發(fā)調(diào)度算法等技術(shù),最大程度提升單機的事務處理性能,提供可用于生產(chǎn)的Benchmark性能測試配置和測試數(shù)據(jù),性能超出主流商業(yè)數(shù)據(jù)庫30%以上。

“幾年前,大家可能還認為中國數(shù)據(jù)庫內(nèi)核需要好多年才能成熟起來。”王南表示道,“但現(xiàn)在從咱們一些數(shù)據(jù)庫產(chǎn)品在核心業(yè)務場景中的表現(xiàn)來看,數(shù)據(jù)庫核心技術(shù)只要沉下心去攻克,是一定能解決的?!?/p>

就如國產(chǎn)新能源汽車逐漸率先攻克自動駕駛、智能車機、底盤等核心技術(shù),在市場中脫穎而出一樣,扎根關鍵技術(shù)研發(fā)與突破的數(shù)據(jù)庫公司,從一開始就把地基打牢固,也有望在未來的市場中逐步實現(xiàn)引領?!皵?shù)據(jù)庫不存在彎道超車,掌握核心技術(shù)才是關鍵所在。如果核心技術(shù)不足,哪怕一開始‘走捷徑’,未來也走不遠。”王南如是說。

商業(yè)化不能“紙上談兵”

總體來看,我國數(shù)據(jù)庫產(chǎn)業(yè)發(fā)展正處于欣欣向榮的階段,加速由“數(shù)量型”向“質(zhì)量型”關鍵轉(zhuǎn)變。這其中,商業(yè)化就是擺在很多中國數(shù)據(jù)庫公司面前的一道必答題。

在數(shù)據(jù)庫市場,光有突破性的數(shù)據(jù)庫核心技術(shù)、能力強大的數(shù)據(jù)庫產(chǎn)品還遠遠不夠,商業(yè)化則是將產(chǎn)品技術(shù)實現(xiàn)價值化的關鍵所在。眾所周知,我國數(shù)據(jù)庫公司相對還較為年輕,過去由于Oracle等數(shù)據(jù)庫巨頭長期占領市場,使得很多中國數(shù)據(jù)庫公司哪怕有諸多技術(shù)與產(chǎn)品的創(chuàng)新,卻很難有較多機會在金融等核心業(yè)務場景中得到驗證,從而陷入“技術(shù)、產(chǎn)品、場景”不能良性循環(huán)的怪圈,商業(yè)化之路極為曲折。

如今,隨著自主可控技術(shù)體系成為中國數(shù)字經(jīng)濟發(fā)展的重要支撐,中國數(shù)據(jù)庫也迎來了打破怪圈的契機。在王南看來,中國數(shù)據(jù)庫公司需要從場景驗證、應用改造、選型成本、服務能力四個方面發(fā)力,從而加速推動商業(yè)化。

首先是場景驗證,比如金融核心業(yè)務場景,對于數(shù)據(jù)庫的性能、可靠性、穩(wěn)定性要求極高,隨著硬件層面的自主可控技術(shù)逐步進入到核心業(yè)務場景中,會帶來數(shù)據(jù)庫適配、性能波動等一系列挑戰(zhàn)。王南直言:“數(shù)據(jù)庫要想實現(xiàn)規(guī)模化復制,必須在關鍵行業(yè)和關鍵場景中去驗證,一步一步往前走,才能在行業(yè)廣度、業(yè)務場景中做到規(guī)模復制?!?/p>

以YashanDB為例,圍繞金融、央國企等重點行業(yè)的等他客戶和重點場景已經(jīng)做了相當范圍的覆蓋和驗證。

其次是應用改造的挑戰(zhàn)。像銀行等金融機構(gòu),由于歷史積累豐富、業(yè)務系統(tǒng)龐雜,比如分布式架構(gòu)的改造,需要解決規(guī)?;瘞淼某杀締栴},“這是一個關鍵矛盾,對于數(shù)據(jù)庫公司、用戶等都是巨大挑戰(zhàn)。”王南補充道。

第三是降低客戶選型的成本。由于產(chǎn)品質(zhì)量參差不齊,客戶選型判斷成本過高。提供誠實可信的高性價比產(chǎn)品、公正透明的價格、完善的生態(tài)體系以及放心省心的服務方是破局之道。

最后則是需要解決好服務能力,目前國內(nèi)數(shù)據(jù)庫公司普遍面臨的困境就是面對場景的復雜性,需要有很重的服務投入,對于DBA團隊極為倚重。

相比于其他商業(yè)數(shù)據(jù)庫公司,依托深算院,YashanDB作為產(chǎn)學研“一體化”數(shù)據(jù)庫的代表,其商業(yè)化之路更加為業(yè)界所關注。王南介紹,YashanDB擁有深算院背后強大的科研資源,未來同樣希望加速商業(yè)化,將數(shù)據(jù)庫領域好的創(chuàng)新實現(xiàn)市場化,為中國企業(yè)的數(shù)字化轉(zhuǎn)型帶來更多價值。據(jù)悉,YashanDB接下來會進一步加速市場化和商業(yè)化進程,產(chǎn)品化、重點行業(yè)和生態(tài)合作伙伴布局也在緊鑼密鼓和有條不紊地推進中。

“我們有足夠的信心和戰(zhàn)略定力把YashanDB做好!”王南最后表示道。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關。文章僅供讀者參考,并請自行核實相關內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2023-09-07
YashanDB:潛心實干,數(shù)據(jù)庫核心技術(shù)突破沒有捷徑可走
YashanDB:潛心實干,數(shù)據(jù)庫核心技術(shù)突破沒有捷徑可走

長按掃碼 閱讀全文