在科技業(yè),數(shù)據(jù)庫是一個整體規(guī)模不大但專業(yè)度極高的領(lǐng)域,傳統(tǒng)數(shù)據(jù)庫時代還誕生了像Oracle這樣的行業(yè)巨頭;但在新一波數(shù)字技術(shù)革命下,大數(shù)據(jù)、人工智能應(yīng)用的興起,人們對于數(shù)據(jù)庫的期待已經(jīng)不再是數(shù)據(jù)的分類、存儲和查詢等,而是如何洞察數(shù)據(jù)內(nèi)在的聯(lián)系。
傳統(tǒng)的數(shù)據(jù)庫雖然在名稱上被稱為“關(guān)系型數(shù)據(jù)庫”,但在處理數(shù)據(jù)關(guān)系上并不擅長。在大數(shù)據(jù)、人工智能大行其道的今天,一種新型的數(shù)據(jù)庫開始崛起——圖數(shù)據(jù)庫。據(jù)了解,圖數(shù)據(jù)庫源起歐拉圖理論,也可稱為面向/基于圖的數(shù)據(jù)庫,它是以“圖”這種數(shù)據(jù)結(jié)構(gòu)存儲和查詢數(shù)據(jù),而不是存儲圖片的數(shù)據(jù)庫。相比較傳統(tǒng)的數(shù)據(jù)庫,圖數(shù)據(jù)庫的數(shù)據(jù)模型主要是以節(jié)點(diǎn)和關(guān)系(邊)來體現(xiàn),可以快速解決復(fù)雜的關(guān)系問題。
創(chuàng)立于2012年的TigerGraph是一家專注于圖數(shù)據(jù)庫研發(fā)和服務(wù)的企業(yè),在創(chuàng)始人許昱博士的帶領(lǐng)下,TigerGraph初創(chuàng)的五年里一直專注于產(chǎn)品的打磨,而不是急于推向市場。直到去年年底,TigerGraph正式完成A輪融資,正式向業(yè)界推出實(shí)時圖分析平臺。
TigerGraph創(chuàng)始人兼CEO許昱博士
許昱博士表示,經(jīng)過過去六年的精心打磨,TigerGraph的產(chǎn)品無論從技術(shù)指標(biāo)上,還是在客戶反饋上都是業(yè)界領(lǐng)先的;隨著越來越多的企業(yè)和用戶進(jìn)入到圖數(shù)據(jù)庫市場,市場的教育將會日趨成熟,這對我們來說也是一大利好。
從傳統(tǒng)數(shù)據(jù)庫到圖數(shù)據(jù)庫 技術(shù)進(jìn)化從未停止
回顧科技的發(fā)展路徑,我們可以清晰看出,任何技術(shù)的發(fā)展和演進(jìn)都遵循一定的軌跡。比如,在數(shù)據(jù)庫市場,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫只是那個特定時代的產(chǎn)物,當(dāng)時用戶對于數(shù)據(jù)庫的應(yīng)用更多集中在數(shù)據(jù)的存儲、備份和管理等方面,對于紛繁復(fù)雜的數(shù)據(jù)背后的關(guān)系了解并不清晰。
但到了大數(shù)據(jù)、人工智能時代,一切都不一樣了。一方面,數(shù)據(jù)的積累正在呈現(xiàn)出爆炸式增長的態(tài)勢,數(shù)據(jù)的分析和管理變得原來越復(fù)雜;另一方面,用戶對于數(shù)據(jù)挖掘和分析的要求也越來越高,他們希望洞察數(shù)據(jù)背后的內(nèi)涵,真正釋放出數(shù)據(jù)的價值。
在許昱博士看來,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫和圖數(shù)據(jù)庫有以下三大區(qū)別:
第一,存儲模型不一樣。關(guān)系型數(shù)據(jù)庫的數(shù)學(xué)模型是表格,但這并不是表示關(guān)系的最好方法。比如,一個人擁有很多的個人信息,身份證號、學(xué)校、住址等等,但這些信息往往又被存到不同的表格中,真正想全面得到一個人的信息就必須將不同表中的信息拼湊起來;但圖數(shù)據(jù)庫并非如此,身份證號和學(xué)校等都是一個個節(jié)點(diǎn),這些節(jié)點(diǎn)是天然連接在一起的。
第二,計算模型不一樣。關(guān)系型數(shù)據(jù)庫的計算模型是掃描、拼湊,這就導(dǎo)致數(shù)據(jù)的計算量很大,但效率很低;而圖數(shù)據(jù)庫不同,它從節(jié)點(diǎn)出發(fā),只尋找與節(jié)點(diǎn)相關(guān)的數(shù)據(jù),這樣的效率更好。
第三,數(shù)據(jù)的查詢方式不同。在關(guān)系型數(shù)據(jù)庫中,數(shù)據(jù)的查詢指標(biāo)往往比較單一,但在人工智能、機(jī)器學(xué)習(xí)時代,人們要挖掘數(shù)據(jù)更深層次的關(guān)系,并實(shí)現(xiàn)動態(tài)、實(shí)時的查詢,圖數(shù)據(jù)庫所表達(dá)出的數(shù)據(jù)之間的關(guān)系則更為全面。
事實(shí)上,數(shù)據(jù)庫技術(shù)的進(jìn)化很大程度上也源于算法、算力的提升。過去,大數(shù)據(jù)算法并不成熟,計算機(jī)的性能也不夠強(qiáng)大,沒有多核、沒有并行能力,這些限制在很大程度上制約了圖數(shù)據(jù)庫的發(fā)展,但今天,這樣的基礎(chǔ)已經(jīng)具備。
潛心研發(fā) TigerGraph圖數(shù)據(jù)庫強(qiáng)調(diào)“原生”和“并行”
盡管算力和算法技術(shù)在進(jìn)步,但圖數(shù)據(jù)庫畢竟是一個新領(lǐng)域,任何一個新進(jìn)入者都面臨著許多未知的困難。TigerGraph也不例外,這也正是公司產(chǎn)品在去年正式發(fā)布前整整研發(fā)了5年時間的關(guān)鍵。
為了實(shí)現(xiàn)最優(yōu)化的體系結(jié)構(gòu),TigerGraph在研發(fā)圖數(shù)據(jù)庫之初就選擇了從零開始。當(dāng)時已經(jīng)有了Hadoop、分布式存儲系統(tǒng)等,因此很多的圖數(shù)據(jù)庫都是在原有平臺的基礎(chǔ)上開發(fā)的,這樣一來開發(fā)的量雖然小了很多,但是圖數(shù)據(jù)庫自身的性能、分析能力等都比較差。
為此,TigerGraph用C++從頭到尾做了一套基于對圖的存儲引擎,并在上面構(gòu)建了一個大規(guī)模并行的圖計算引擎;同時,TigerGraph還做了針對圖的高級開發(fā)語言GSQL,以及可視化界面和可視化開發(fā)環(huán)境GraphStudio,可以實(shí)現(xiàn)對圖數(shù)據(jù)庫的可視化探索、挖掘。
“可以說,我們專門做了一套針對圖數(shù)據(jù)庫的系統(tǒng)。”許昱博士表示,為此,TigerGraph稱之為基于“原生”“并行”圖(Native Parallel Graph,NPG)技術(shù)的全球首個實(shí)時圖分析平臺,相比較而言,該平臺的技術(shù)優(yōu)勢體現(xiàn)在以下幾個方面:
首先,實(shí)時計算,不超過1億個節(jié)點(diǎn)和邊關(guān)聯(lián)的查詢一般不到1秒鐘一個服務(wù)器就可以完成;其次,支持?jǐn)?shù)據(jù)庫的實(shí)時增刪改查,是可以上線的數(shù)據(jù)庫;第三,深度關(guān)聯(lián),用戶可以使用TigerGraph針對圖的高級開發(fā)語言,自己做圖模型、做數(shù)據(jù)錄入、做二次開發(fā)等。
圖數(shù)據(jù)庫市場方興未艾 TigerGraph要做新領(lǐng)域的引領(lǐng)者
數(shù)據(jù)庫技術(shù)發(fā)展到今天,已經(jīng)到了變革的前夜,眾多業(yè)界分析師表示,2018年將是圖數(shù)據(jù)的元年。包括IBM、亞馬遜等都在推出相應(yīng)的產(chǎn)品,這對整個圖數(shù)據(jù)庫市場的教育非常重要,此外,用戶端對數(shù)據(jù)分析的需求也在不斷增強(qiáng),他們希望從更深層次了解數(shù)據(jù)與數(shù)據(jù)之間的深度關(guān)聯(lián),以及這種關(guān)聯(lián)能夠帶來哪些商業(yè)價值。
TigerGraph中國區(qū)總經(jīng)理烏明捷表示,圖數(shù)據(jù)庫從數(shù)據(jù)模型角度是包含傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的,只是軟硬件的發(fā)展限制了圖數(shù)據(jù)庫的發(fā)展,未來圖數(shù)據(jù)庫的市場會不斷擴(kuò)大。目前,TigerGraph 的已經(jīng)與金融、銀行、運(yùn)營商和電力等等眾多大型公司達(dá)成合作,未來也將在中國市場繼續(xù)進(jìn)行市場拓展,擴(kuò)大圖數(shù)據(jù)庫的應(yīng)用。
比如,在金融行業(yè),金融企業(yè)可以借助TigerGraph系統(tǒng)在企業(yè)數(shù)據(jù)全景圖上快速部署復(fù)雜有效的反欺詐和反洗錢業(yè)務(wù),利用實(shí)時數(shù)據(jù)和實(shí)時深度鏈接分析應(yīng)對金融犯罪;在零售行業(yè),零售商能夠通過實(shí)時功能允許快速合成和理解消費(fèi)者的行為和活動,高效地聚類產(chǎn)品,并提出個性化的推薦。
烏明捷透露,接下來,TigerGraph首先將在中國進(jìn)一步推廣圖數(shù)據(jù)庫技術(shù),讓更多的用戶接觸到這一新技術(shù);其次,TigerGraph將致力推動整個生態(tài)的發(fā)展,通過開放合作的方式與行業(yè)合作伙伴進(jìn)行合作,落地圖數(shù)據(jù)庫的應(yīng)用;第三,TigerGraph也將在中國挖掘更多的技術(shù)研發(fā)人才,參與到公司的圖數(shù)據(jù)庫產(chǎn)品和技術(shù)的研發(fā)中來,對產(chǎn)品進(jìn)行優(yōu)化,并快速響應(yīng)用戶需求。
如今,圖數(shù)據(jù)庫市場的發(fā)展才剛剛開始,但對于TigerGraph來說,公司早已經(jīng)在這一領(lǐng)域深耕多年。接下來,對于擁有先發(fā)優(yōu)勢的TigerGraph來說,如何在圖數(shù)據(jù)庫市場全面爆發(fā)之時做好引領(lǐng)者,將十分關(guān)鍵。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )