深度解析丨一文讀懂隱私計算多種技術(shù)路線

數(shù)據(jù)安全共享和價值轉(zhuǎn)化既是政策導(dǎo)向,也是大數(shù)據(jù)和數(shù)字經(jīng)濟發(fā)展的關(guān)鍵。隱私計算技術(shù),已成為數(shù)據(jù)流通安全的“最優(yōu)技術(shù)解”。

政策法規(guī)加速落地,市場關(guān)注度快速提升。我國多部與數(shù)據(jù)安全相關(guān)的法律法規(guī)落地實施,形成了較為完備的安全法律體系,多部法規(guī)與政策明確鼓勵運用隱私計算技術(shù)破局數(shù)據(jù)流通中的安全問題,使得隱私計算成為當(dāng)下火熱的新興技術(shù)。

本文以隱私計算多種技術(shù)與未來發(fā)展為核心,帶你一文快速讀懂隱私計算多種技術(shù)路線,并對技術(shù)流變發(fā)展趨勢做出預(yù)測。

崛起70年:主流技術(shù)路線速覽

隱私計算是在保護數(shù)據(jù)本身不對外泄露的前提下,實現(xiàn)數(shù)據(jù)分析計算的一系列技術(shù)路線的統(tǒng)稱,可達到“數(shù)據(jù)可用不可見”的目的,在充分保護數(shù)據(jù)和隱私安全的前提下,實現(xiàn)數(shù)據(jù)價值的轉(zhuǎn)化和釋放。

隱私計算并非單一的技術(shù),而是包含多種隱私保護技術(shù)、隱私增強技術(shù),是一系列技術(shù)的統(tǒng)稱,涉及密碼學(xué)、安全硬件、信息論、分布式計算等多個學(xué)科。“隱私計算”這個概念雖然誕生時間不長,但從其現(xiàn)代密碼學(xué)的本質(zhì)來看,其相關(guān)技術(shù)理論的研究有著相當(dāng)?shù)囊欢螝v史。

從1949年香農(nóng)開創(chuàng)現(xiàn)代密碼學(xué)時代起,安全多方計算、零知識證明被陸續(xù)提出,多種新的技術(shù)路線和隱私計算方案(例如混淆電路、基于秘密分享的MPC、半同態(tài)加密等協(xié)議和算法等)也陸續(xù)出現(xiàn)。七十余年間,隱私計算經(jīng)歷多個里程碑,技術(shù)體系逐步發(fā)展和壯大,并開始有大規(guī)模的項目落地。

2019年后,隱私計算進入應(yīng)用期,走出學(xué)院派與實驗室,廣泛與行業(yè)應(yīng)用場景相結(jié)合。各類隱私計算廠商也如雨后春筍一般涌現(xiàn)出來,激發(fā)了隱私計算技術(shù)可用性的快速提升。

當(dāng)前,隱私計算在應(yīng)用中快速發(fā)展,領(lǐng)域內(nèi)仍在持續(xù)涌現(xiàn)出更多新的技術(shù)特點和解決方案。

從技術(shù)層面來說,隱私計算主要有三類主流技術(shù)路線:一類是采用密碼學(xué)和分布式系統(tǒng),以多方安全計算(Secure Multiparty Compute,MPC)為代表;另一類是采用基于硬件的可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE);最后一類是近年來發(fā)展相當(dāng)火熱的聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)。此外,還有零知識證明、同態(tài)加密、差分隱私等技術(shù)。各類技術(shù)路線融合應(yīng)用趨勢凸顯。

多方安全計算

多方安全計算(Secure Multiparty Compute,MPC)是一種將計算分布在多個參與方之間的密碼學(xué)分支,參與者在不泄露各自隱私數(shù)據(jù)情況下,利用隱私數(shù)據(jù)參與保密計算,共同完成某項計算任務(wù)。

這項技術(shù)最早可追溯至1981年,Rabin首次提出通過Oblivious Transfer(OT) 協(xié)議實現(xiàn)機密信息交互。1982年,姚期智教授在論文《Protocols for Secure Computations》中提出“百萬富翁問題“,即兩個百萬富翁在沒有可信第三方、不透露自己財產(chǎn)狀況的情況下,如何比較誰更富有,這標(biāo)志著多方安全計算技術(shù)的產(chǎn)生。1986年,姚期智教授提出混淆電路技術(shù),實現(xiàn)了第一個多方(兩方)安全計算方案。1987年,Goldreich等人提出了基于電路的秘密共享方案GMW,并將其應(yīng)用于多方安全計算。

同態(tài)加密

同態(tài)加密(Homomorphic Encryption,HE)是一種通過對相關(guān)密文進行有效操作(不需獲知解密秘鑰),從而允許在加密內(nèi)容上進行特定代數(shù)運算的加密方法。其特點是允許在加密之后的密文上直接進行計算,且計算結(jié)果解密后和明文的計算結(jié)果一致。

1978年,Ron Rivest、Leonard Adleman和Michael L. Dertouzos提出同態(tài)加密問題,并在同年提出滿足乘法同態(tài)的RSA算法。同態(tài)加密問題的提出將加密技術(shù)的研究從靜態(tài)引向動態(tài),是理論上的巨大革新,也開創(chuàng)了隱私計算的先河。2009年,Gentry提出了首個實用的全同態(tài)加密算法,標(biāo)志著全同態(tài)計算時代的開始。2017年,國際同態(tài)加密標(biāo)準(zhǔn)委員會成立,標(biāo)志著同態(tài)加密在全球進入高速發(fā)展階段。

聯(lián)邦學(xué)習(xí)

聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)是一種具有隱私保護屬性的分布式機器學(xué)習(xí)技術(shù)。在機器學(xué)習(xí)中,通常會從多個數(shù)據(jù)源聚合訓(xùn)練數(shù)據(jù),并將其傳送到中央服務(wù)器進行訓(xùn)練。然而這一過程容易產(chǎn)生數(shù)據(jù)泄露風(fēng)險。在聯(lián)邦學(xué)習(xí)模型中,運算在本地進行,只在各個參與方之間交換不包含隱私信息的中間運算結(jié)果,用于優(yōu)化各個參與方相關(guān)的模型參數(shù),最終產(chǎn)生聯(lián)邦模型,并將應(yīng)用于推理,從而實現(xiàn)了“原始數(shù)據(jù)不出本地”、“數(shù)據(jù)可用不可見”的數(shù)據(jù)應(yīng)用模式。按照數(shù)據(jù)集合維度相似性構(gòu)成的特點,業(yè)界普遍將聯(lián)邦學(xué)習(xí)分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)與聯(lián)邦遷移學(xué)習(xí)。

2012年,王爽等在期刊Journal of Biomedical Informatics發(fā)表論文,首次解決醫(yī)療在線安全聯(lián)邦學(xué)習(xí)問題,該框架服務(wù)于多個國家級醫(yī)療健康網(wǎng)絡(luò),也是聯(lián)邦學(xué)習(xí)系統(tǒng)構(gòu)架層面的突破。

零知識證明

零知識證明(Zero-Knowledge Proof,ZKP),是指證明者能夠在不向監(jiān)控者提供任何有用信息的情況下,使驗證者相信某個論斷是正確的。零知識證明實際上是一種涉及雙方或更多方的協(xié)議,即雙方或更多方完成一項任務(wù)需要采取的一系列步驟,證明者需要向驗證者證明并使其相信自己知道或擁有某一消息,但證明過程不向驗證者泄露任何關(guān)于被證明消息的信息。

1985年,S. Goldwasser、S. Micali和C. Rackoff首次提出零知識證明(Zero-Knowledge Proof, ZKP)概念。目前在實際應(yīng)用中,某些加密貨幣就采用了這一技術(shù)路線。

可信執(zhí)行環(huán)境

可信執(zhí)行環(huán)境(TEE)是一種基于硬件的隱私保護方法,是指計算平臺上由軟硬件方法構(gòu)建的一個安全區(qū)域,可保證在安全區(qū)域內(nèi)部加載的代碼和數(shù)據(jù)在機密性和完整性方面得到保護。2009年,OMTP工作組率先提出一種雙系統(tǒng)解決方案:在同一個智能終端下,除多媒體操作系統(tǒng)外再提供一個隔離的安全操作系統(tǒng),這一運行在隔離硬件之上的隔離安全操作系統(tǒng)用來專門處理敏感信息以保證信息安全,該方案是可信執(zhí)行環(huán)境的前身。

在實踐層面,目前以Intel SGX和ARM TrustZone為基礎(chǔ)的TEE技術(shù)起步較早,社區(qū)和生態(tài)已比較成熟。同時,國產(chǎn)化的芯片廠商在TEE方向上已經(jīng)開始發(fā)力,國內(nèi)芯片廠商如海光、鯤鵬、飛騰、兆芯等都推出了支持可信執(zhí)行環(huán)境的技術(shù),信創(chuàng)國產(chǎn)化趨勢明顯,相關(guān)生態(tài)也正在加速建立、完善。

差分隱私

2006年,C. Dwork提出差分隱私(Differential Privacy, DP),這一技術(shù)路線的主要原理是通過引入噪聲對數(shù)據(jù)進行擾動,并要求輸出結(jié)果對數(shù)據(jù)集中的任意一條記錄的修改不敏感,使攻擊者難以從建模過程中交換的統(tǒng)計信息或者建模的結(jié)果反推出敏感的樣本信息。

隱私計算的未來:融合應(yīng)用

除上述技術(shù)之外,還有圖聯(lián)邦、混淆電路、不經(jīng)意傳輸?shù)榷喾N技術(shù)路線被先后提出,并不斷在科研和產(chǎn)業(yè)的推動下得到發(fā)展和應(yīng)用。

縱觀隱私計算不同技術(shù)路線,可以發(fā)現(xiàn)各有其優(yōu)勢與不足,在可支持計算、隱私保護維度、隱私保護強度、安全性、性能等方面有較大差異,分別適合不同的應(yīng)用和場景;同時,不同的技術(shù)路線目前正在持續(xù)融合、取長補短,實現(xiàn)1+1>2的應(yīng)用效果。例如通過硬件加速的全同態(tài)加密算法構(gòu)建強隱私、高性能的縱向聯(lián)邦學(xué)習(xí)系統(tǒng),就是一個不同技術(shù)路線深度融合的典型案例。

相信在未來,不同技術(shù)路線的融合以及與人工智能、區(qū)塊鏈等新興技術(shù)的結(jié)合,能夠推動隱私計算大規(guī)模落地,實現(xiàn)海量數(shù)據(jù)要素的價值釋放。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )