數(shù)據(jù)造假、數(shù)據(jù)不可信等問題的存在,給金融監(jiān)管及風(fēng)控等眾多應(yīng)用場(chǎng)景帶來了嚴(yán)峻的挑戰(zhàn),也正成為阻礙數(shù)據(jù)大規(guī)?;ヂ?lián)互通、共享共用的一大障礙。數(shù)據(jù)的真實(shí)可信問題長(zhǎng)期影響著社會(huì)的各個(gè)領(lǐng)域,在更依賴數(shù)據(jù)的人工智能時(shí)代,這一影響將更為凸顯。
數(shù)據(jù)造假可能發(fā)生在任一環(huán)節(jié)。其中,在數(shù)據(jù)存儲(chǔ)期間造假往往更加簡(jiǎn)單:因?yàn)樵诂F(xiàn)有數(shù)據(jù)存儲(chǔ)技術(shù)下,數(shù)據(jù)的所有者、管理人員或受托存儲(chǔ)方均有能力單方對(duì)數(shù)據(jù)進(jìn)行任意的篡改或刪除。
既然數(shù)據(jù)不可信的一個(gè)重要原因歸咎于單方可以擅自篡改和刪除數(shù)據(jù),那么如何避免這一問題自然也得到了業(yè)界大量的關(guān)注。區(qū)塊鏈和去中心化存儲(chǔ)技術(shù)的誕生,對(duì)數(shù)據(jù)篡改起到了一定的遏制作用,也在市場(chǎng)上取得了初步驗(yàn)證。
許多企業(yè)開始嘗試采用區(qū)塊鏈存儲(chǔ)數(shù)據(jù),例如在貨物追溯等場(chǎng)景。其做法往往是將重要數(shù)據(jù)直接寫入?yún)^(qū)塊中。這一簡(jiǎn)單粗暴的做法確實(shí)解決了數(shù)據(jù)防刪改需求、繼而滿足了部分?jǐn)?shù)據(jù)的可信分享,但卻存在較多問題:
首先是無法存儲(chǔ)海量數(shù)據(jù):區(qū)塊內(nèi)不適合存儲(chǔ)包括多媒體數(shù)據(jù)等在內(nèi)的大數(shù)據(jù),否則區(qū)塊大小難以控制,使區(qū)塊鏈的可擴(kuò)展性變差。這就導(dǎo)致業(yè)務(wù)中必須對(duì)原生數(shù)據(jù)進(jìn)行篩選取舍,僅選取少量必要數(shù)據(jù)存入?yún)^(qū)塊,但這將降低可信數(shù)據(jù)的豐富程度。
其次是數(shù)據(jù)存取效率低:首先,由于打包過程的存在,區(qū)塊鏈數(shù)據(jù)存儲(chǔ)一般不用于高速的數(shù)據(jù)寫入。其次,由于遍歷式的數(shù)據(jù)讀取方法,區(qū)塊鏈無法支持快速索引、更無法支持SQL。
再次是數(shù)據(jù)維護(hù)效率低:區(qū)塊鏈因其順序引用的特點(diǎn),不支持對(duì)個(gè)別歷史數(shù)據(jù)的刪除和修改(除非對(duì)全鏈重新生成,但這是區(qū)塊鏈不應(yīng)鼓勵(lì)的行為)。這里需注意:“杜絕單方的私自篡改”和“完全不能刪改”是完全不同的兩件事。前者是一種確?;バ诺募夹g(shù)手段,但后者可能屬于一種必要功能點(diǎn)的喪失。
最后是有數(shù)據(jù)丟失風(fēng)險(xiǎn):這一風(fēng)險(xiǎn)單指采用中本聰共識(shí)最長(zhǎng)鏈原則的PoW區(qū)塊鏈系統(tǒng)。在這類區(qū)塊鏈中,當(dāng)出現(xiàn)鏈分叉時(shí),最長(zhǎng)(或最重)的鏈分支會(huì)被保留,其他分支會(huì)被拋棄,這就使區(qū)塊內(nèi)的數(shù)據(jù)實(shí)際上永遠(yuǎn)存在被“顛覆”、被丟棄的風(fēng)險(xiǎn)。而自私挖礦等攻擊行為的存在,會(huì)加劇這一風(fēng)險(xiǎn)。這在數(shù)據(jù)存儲(chǔ)應(yīng)用中是無法接受的。
正是由于上述原因,直接采用傳統(tǒng)區(qū)塊鏈進(jìn)行數(shù)據(jù)存儲(chǔ)顯然無法滿足大量實(shí)踐性場(chǎng)景中對(duì)可信數(shù)據(jù)存儲(chǔ)的需求。這一問題也因而引發(fā)了大量的探討,例如“什么數(shù)據(jù)應(yīng)該在鏈上存儲(chǔ)、什么數(shù)據(jù)應(yīng)該在鏈下存儲(chǔ)”。這些問題的出現(xiàn),究其根本,還是因?yàn)閰^(qū)塊鏈自身存儲(chǔ)效率及能力受限所致的。畢竟在數(shù)據(jù)庫(kù)時(shí)代,我們從來不會(huì)談?wù)?ldquo;什么數(shù)據(jù)應(yīng)該存放在數(shù)據(jù)庫(kù)之外”這樣的問題。
近年來也出現(xiàn)了一些產(chǎn)品,為解決上述的區(qū)塊鏈數(shù)據(jù)存儲(chǔ)效率低下問題提供了有益的實(shí)踐,例如:
星際文件系統(tǒng)IPFS, R3的Corda,騰訊TrustSQL等。然而這些產(chǎn)品在數(shù)據(jù)可信存儲(chǔ)方面仍存在或多或少的問題,具體而言:
IPFS對(duì)數(shù)據(jù)內(nèi)容生成哈希摘要,并在多個(gè)節(jié)點(diǎn)間進(jìn)行分布式存儲(chǔ),單個(gè)保有者不掌握完整數(shù)據(jù),一定程度保護(hù)了數(shù)據(jù)隱私。但I(xiàn)PFS只能做到修改可知(因哈希值會(huì)因內(nèi)容改變而變化),并且沒有訪問控制等數(shù)據(jù)安全措施,整體而言仍難以滿足企業(yè)級(jí)服務(wù)需求。
Corda是面向金融交易隱私需求量身定做的存儲(chǔ)產(chǎn)品,重點(diǎn)關(guān)注數(shù)據(jù)存儲(chǔ)的隱私性。為此,Corda沒有全局賬本,并需要見證人的存在,是一種隱私但并不足夠安全可信的數(shù)據(jù)存儲(chǔ)方案。
TrustSQL與國(guó)內(nèi)其它同類產(chǎn)品采用了一種簡(jiǎn)單直觀的設(shè)計(jì)思路,也是目前國(guó)內(nèi)最為常見的做法,即:先將數(shù)據(jù)存入數(shù)據(jù)庫(kù)(或IPFS),再將操作記錄、數(shù)據(jù)哈希等存于鏈上。相對(duì)于TrustSQL而言,一些類似產(chǎn)品如眾享比特的ChainSQL等進(jìn)一步提升了對(duì)SQL的支持度。該類產(chǎn)品滿足了數(shù)據(jù)“可審計(jì)”、“監(jiān)管透明”的需求,但缺點(diǎn)是依然無法杜絕對(duì)數(shù)據(jù)本身的刪改行為,只是能做到“刪改可知”;此外,對(duì)關(guān)鍵數(shù)據(jù)的保全需要依賴參與節(jié)點(diǎn)的全副本存儲(chǔ),存儲(chǔ)成本略高。并且在數(shù)據(jù)隱私性方面的設(shè)計(jì)仍顯不足。
針對(duì)上述產(chǎn)品中存在的不足,物緣科技通過原創(chuàng)技術(shù)創(chuàng)新,探索出一條不同的道路,并推出自主知識(shí)產(chǎn)權(quán)產(chǎn)品“ImSQL”,旨在提供一種可真正確保數(shù)據(jù)不被私自篡改或刪除的可信存儲(chǔ)產(chǎn)品。
ImSQL(Immutable SQL Database)是基于區(qū)塊鏈和分布式存儲(chǔ)技術(shù)上的一種新型可信數(shù)據(jù)存儲(chǔ)解決方案,并完美解決了“防止私自刪改”、“保護(hù)數(shù)據(jù)隱私”、“降低存儲(chǔ)成本”等核心問題,為大數(shù)據(jù)時(shí)代的可信存儲(chǔ)與數(shù)據(jù)分享提供了可靠的技術(shù)路徑。
相比現(xiàn)有產(chǎn)品,ImSQL具有以下幾點(diǎn)突出優(yōu)勢(shì):
1.徹底杜絕單方對(duì)數(shù)據(jù)的私自篡改和刪除。通過在存和取兩個(gè)環(huán)節(jié)進(jìn)行多方校驗(yàn)并在存儲(chǔ)過程中杜絕篡改刪除,全方位保障數(shù)據(jù)的真實(shí)可信性,使應(yīng)用中的參與方能夠互信、放心地采納它方數(shù)據(jù),使數(shù)據(jù)能夠支撐精準(zhǔn)追溯、追責(zé)。
2.杜絕單點(diǎn)失敗。多方共用數(shù)據(jù)的同時(shí)也共同維護(hù)數(shù)據(jù),數(shù)據(jù)不只存于一方,從根本上實(shí)現(xiàn)分布式數(shù)據(jù)的可信共享池,既避免了單點(diǎn)失敗風(fēng)險(xiǎn),也提升了數(shù)據(jù)分享效率。
3.碎片化存儲(chǔ),滿足數(shù)據(jù)隱私需求,使任何一方無法掌握完整數(shù)據(jù),從而解決了傳統(tǒng)云計(jì)算的中心化存儲(chǔ)、或區(qū)塊鏈全副本存儲(chǔ)均存在的數(shù)據(jù)隱私問題。除了數(shù)據(jù)所有方,其他任何存儲(chǔ)托管者都無法獲得完整數(shù)據(jù)。
4.優(yōu)異的數(shù)據(jù)存取性能:ImSQL單節(jié)點(diǎn)可達(dá)3000TPS的寫入速度和10000QPS的讀取速度。此外,ImSQL還具有:支持SQL語言,可水平擴(kuò)展等優(yōu)點(diǎn),存取性能和使用體驗(yàn)優(yōu)異,并可充分利用集群擴(kuò)展使上述指標(biāo)進(jìn)一步達(dá)到數(shù)倍增長(zhǎng)。
5.滿足多媒體等大數(shù)據(jù)的高效存取需求,支持高效存取、高效索引、高效擴(kuò)展,真正勝任大數(shù)據(jù)業(yè)務(wù)場(chǎng)景,可以對(duì)視頻等數(shù)據(jù)實(shí)現(xiàn)既可信又高效的存儲(chǔ),從而給視頻監(jiān)控等場(chǎng)景提供前所未有的可信保全體驗(yàn)。
6.采用分片式設(shè)計(jì),極大降低了每個(gè)存儲(chǔ)參與方的存儲(chǔ)壓力和成本,使更多參與方有機(jī)會(huì)加入和參與到數(shù)據(jù)可信共享的生態(tài)中。
7.分布式架構(gòu),兼容輕節(jié)點(diǎn),鼓勵(lì)更多節(jié)點(diǎn)參與。不存在超能節(jié)點(diǎn),參與存儲(chǔ)的節(jié)點(diǎn)地位相同,更好保證系統(tǒng)的可靠性和抗毀性。此外,如果節(jié)點(diǎn)選擇運(yùn)行在輕副本模式,可只存儲(chǔ)部分?jǐn)?shù)據(jù),使自身存儲(chǔ)壓力極大降低,義務(wù)雖然減輕但權(quán)力可不受任何影響。
ImSQL兼顧了海量存儲(chǔ)、快速索引、水平擴(kuò)展等數(shù)據(jù)庫(kù)屬性,也兼顧了數(shù)據(jù)即存即固化的區(qū)塊鏈特征,在眾多關(guān)注數(shù)據(jù)可信存儲(chǔ)與分享的領(lǐng)域中,有望帶來前所未有的使用體驗(yàn)和便利,例如:實(shí)現(xiàn)供應(yīng)鏈中各方數(shù)據(jù)的互通與互信、實(shí)現(xiàn)政府或大企業(yè)各部門間數(shù)據(jù)的互聯(lián)互通、支撐可信追溯相關(guān)海量數(shù)據(jù)的存儲(chǔ)等。
以政府大數(shù)據(jù)建設(shè)為例。在政府眾多不同部門和實(shí)體間實(shí)現(xiàn)高效的數(shù)據(jù)互聯(lián)互通一直是個(gè)難題?,F(xiàn)行做法往往需要建立獨(dú)立的大數(shù)據(jù)部門,構(gòu)建獨(dú)立數(shù)據(jù)存儲(chǔ)體系,從不同實(shí)體拉取相關(guān)數(shù)據(jù)后解析、重構(gòu),再實(shí)現(xiàn)可視化。這往往會(huì)帶來較大的前期開銷,既包含人、財(cái)、物等多種顯性開銷,也暗含人員編制、權(quán)責(zé)利益、時(shí)間成本、部門墻等隱性開銷。同時(shí),獨(dú)立大數(shù)據(jù)部門的存在也隱含了需要一個(gè)可信第三方背書乃至承擔(dān)責(zé)任的考慮。如果在這一場(chǎng)景下采用ImSQL作為數(shù)據(jù)互通的底層基礎(chǔ)平臺(tái),就可以更為高效的完成這一任務(wù),具體體現(xiàn)在:
1.無須依賴第三方實(shí)體背書:不同實(shí)體間數(shù)據(jù)可直接寫入ImSQL,寫入即保全,數(shù)據(jù)無法再被任一單方私自篡改和刪除,保證其他實(shí)體在任何時(shí)間取用數(shù)據(jù)時(shí)的可用性、一致性和可信性;
2.無須建立和維護(hù)額外的數(shù)據(jù)存儲(chǔ)系統(tǒng):數(shù)據(jù)由所有參與實(shí)體共同存儲(chǔ)和維護(hù),天然共享、打通,不降低使用效率的同時(shí)減少了系統(tǒng)實(shí)施和維護(hù)成本。同時(shí),ImSQL的數(shù)據(jù)碎片化存儲(chǔ)技術(shù),在實(shí)現(xiàn)數(shù)據(jù)共享的同時(shí)也能兼顧隱私保護(hù),即,所有實(shí)體存儲(chǔ)的數(shù)據(jù)可以是不完整的片段,只有那些具備訪問權(quán)的實(shí)體才掌握對(duì)片段數(shù)據(jù)進(jìn)行查找、組合并解釋的鑰匙。
綜上,作為一種可信的、防數(shù)據(jù)篡改的數(shù)據(jù)存儲(chǔ)技術(shù),ImSQL完全繼承了區(qū)塊鏈數(shù)據(jù)保全的優(yōu)勢(shì),又突破了區(qū)塊鏈在效率方面的弱點(diǎn),為用戶提供了和數(shù)據(jù)庫(kù)同樣高效的數(shù)據(jù)存取體驗(yàn)。ImSQL是區(qū)塊鏈和數(shù)據(jù)庫(kù)技術(shù)相結(jié)合而產(chǎn)生的新品類,更是實(shí)現(xiàn)可信數(shù)據(jù)存儲(chǔ)的不二選擇。
作者信息:焦臻楨博士,物緣科技創(chuàng)始人,副教授/碩導(dǎo)(中科院)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場(chǎng)定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。