深度解析丨一文讀懂隱私計(jì)算多種技術(shù)路線

數(shù)據(jù)安全共享和價(jià)值轉(zhuǎn)化既是政策導(dǎo)向,也是大數(shù)據(jù)和數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵。隱私計(jì)算技術(shù),已成為數(shù)據(jù)流通安全的“最優(yōu)技術(shù)解”。

政策法規(guī)加速落地,市場(chǎng)關(guān)注度快速提升。我國多部與數(shù)據(jù)安全相關(guān)的法律法規(guī)落地實(shí)施,形成了較為完備的安全法律體系,多部法規(guī)與政策明確鼓勵(lì)運(yùn)用隱私計(jì)算技術(shù)破局?jǐn)?shù)據(jù)流通中的安全問題,使得隱私計(jì)算成為當(dāng)下火熱的新興技術(shù)。

本文以隱私計(jì)算多種技術(shù)與未來發(fā)展為核心,帶你一文快速讀懂隱私計(jì)算多種技術(shù)路線,并對(duì)技術(shù)流變發(fā)展趨勢(shì)做出預(yù)測(cè)。

崛起70年:主流技術(shù)路線速覽

隱私計(jì)算是在保護(hù)數(shù)據(jù)本身不對(duì)外泄露的前提下,實(shí)現(xiàn)數(shù)據(jù)分析計(jì)算的一系列技術(shù)路線的統(tǒng)稱,可達(dá)到“數(shù)據(jù)可用不可見”的目的,在充分保護(hù)數(shù)據(jù)和隱私安全的前提下,實(shí)現(xiàn)數(shù)據(jù)價(jià)值的轉(zhuǎn)化和釋放。

隱私計(jì)算并非單一的技術(shù),而是包含多種隱私保護(hù)技術(shù)、隱私增強(qiáng)技術(shù),是一系列技術(shù)的統(tǒng)稱,涉及密碼學(xué)、安全硬件、信息論、分布式計(jì)算等多個(gè)學(xué)科。“隱私計(jì)算”這個(gè)概念雖然誕生時(shí)間不長(zhǎng),但從其現(xiàn)代密碼學(xué)的本質(zhì)來看,其相關(guān)技術(shù)理論的研究有著相當(dāng)?shù)囊欢螝v史。

從1949年香農(nóng)開創(chuàng)現(xiàn)代密碼學(xué)時(shí)代起,安全多方計(jì)算、零知識(shí)證明被陸續(xù)提出,多種新的技術(shù)路線和隱私計(jì)算方案(例如混淆電路、基于秘密分享的MPC、半同態(tài)加密等協(xié)議和算法等)也陸續(xù)出現(xiàn)。七十余年間,隱私計(jì)算經(jīng)歷多個(gè)里程碑,技術(shù)體系逐步發(fā)展和壯大,并開始有大規(guī)模的項(xiàng)目落地。

2019年后,隱私計(jì)算進(jìn)入應(yīng)用期,走出學(xué)院派與實(shí)驗(yàn)室,廣泛與行業(yè)應(yīng)用場(chǎng)景相結(jié)合。各類隱私計(jì)算廠商也如雨后春筍一般涌現(xiàn)出來,激發(fā)了隱私計(jì)算技術(shù)可用性的快速提升。

當(dāng)前,隱私計(jì)算在應(yīng)用中快速發(fā)展,領(lǐng)域內(nèi)仍在持續(xù)涌現(xiàn)出更多新的技術(shù)特點(diǎn)和解決方案。

從技術(shù)層面來說,隱私計(jì)算主要有三類主流技術(shù)路線:一類是采用密碼學(xué)和分布式系統(tǒng),以多方安全計(jì)算(Secure Multiparty Compute,MPC)為代表;另一類是采用基于硬件的可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE);最后一類是近年來發(fā)展相當(dāng)火熱的聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)。此外,還有零知識(shí)證明、同態(tài)加密、差分隱私等技術(shù)。各類技術(shù)路線融合應(yīng)用趨勢(shì)凸顯。

多方安全計(jì)算

多方安全計(jì)算(Secure Multiparty Compute,MPC)是一種將計(jì)算分布在多個(gè)參與方之間的密碼學(xué)分支,參與者在不泄露各自隱私數(shù)據(jù)情況下,利用隱私數(shù)據(jù)參與保密計(jì)算,共同完成某項(xiàng)計(jì)算任務(wù)。

這項(xiàng)技術(shù)最早可追溯至1981年,Rabin首次提出通過Oblivious Transfer(OT) 協(xié)議實(shí)現(xiàn)機(jī)密信息交互。1982年,姚期智教授在論文《Protocols for Secure Computations》中提出“百萬富翁問題“,即兩個(gè)百萬富翁在沒有可信第三方、不透露自己財(cái)產(chǎn)狀況的情況下,如何比較誰更富有,這標(biāo)志著多方安全計(jì)算技術(shù)的產(chǎn)生。1986年,姚期智教授提出混淆電路技術(shù),實(shí)現(xiàn)了第一個(gè)多方(兩方)安全計(jì)算方案。1987年,Goldreich等人提出了基于電路的秘密共享方案GMW,并將其應(yīng)用于多方安全計(jì)算。

同態(tài)加密

同態(tài)加密(Homomorphic Encryption,HE)是一種通過對(duì)相關(guān)密文進(jìn)行有效操作(不需獲知解密秘鑰),從而允許在加密內(nèi)容上進(jìn)行特定代數(shù)運(yùn)算的加密方法。其特點(diǎn)是允許在加密之后的密文上直接進(jìn)行計(jì)算,且計(jì)算結(jié)果解密后和明文的計(jì)算結(jié)果一致。

1978年,Ron Rivest、Leonard Adleman和Michael L. Dertouzos提出同態(tài)加密問題,并在同年提出滿足乘法同態(tài)的RSA算法。同態(tài)加密問題的提出將加密技術(shù)的研究從靜態(tài)引向動(dòng)態(tài),是理論上的巨大革新,也開創(chuàng)了隱私計(jì)算的先河。2009年,Gentry提出了首個(gè)實(shí)用的全同態(tài)加密算法,標(biāo)志著全同態(tài)計(jì)算時(shí)代的開始。2017年,國際同態(tài)加密標(biāo)準(zhǔn)委員會(huì)成立,標(biāo)志著同態(tài)加密在全球進(jìn)入高速發(fā)展階段。

聯(lián)邦學(xué)習(xí)

聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)是一種具有隱私保護(hù)屬性的分布式機(jī)器學(xué)習(xí)技術(shù)。在機(jī)器學(xué)習(xí)中,通常會(huì)從多個(gè)數(shù)據(jù)源聚合訓(xùn)練數(shù)據(jù),并將其傳送到中央服務(wù)器進(jìn)行訓(xùn)練。然而這一過程容易產(chǎn)生數(shù)據(jù)泄露風(fēng)險(xiǎn)。在聯(lián)邦學(xué)習(xí)模型中,運(yùn)算在本地進(jìn)行,只在各個(gè)參與方之間交換不包含隱私信息的中間運(yùn)算結(jié)果,用于優(yōu)化各個(gè)參與方相關(guān)的模型參數(shù),最終產(chǎn)生聯(lián)邦模型,并將應(yīng)用于推理,從而實(shí)現(xiàn)了“原始數(shù)據(jù)不出本地”、“數(shù)據(jù)可用不可見”的數(shù)據(jù)應(yīng)用模式。按照數(shù)據(jù)集合維度相似性構(gòu)成的特點(diǎn),業(yè)界普遍將聯(lián)邦學(xué)習(xí)分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)與聯(lián)邦遷移學(xué)習(xí)。

2012年,王爽等在期刊Journal of Biomedical Informatics發(fā)表論文,首次解決醫(yī)療在線安全聯(lián)邦學(xué)習(xí)問題,該框架服務(wù)于多個(gè)國家級(jí)醫(yī)療健康網(wǎng)絡(luò),也是聯(lián)邦學(xué)習(xí)系統(tǒng)構(gòu)架層面的突破。

零知識(shí)證明

零知識(shí)證明(Zero-Knowledge Proof,ZKP),是指證明者能夠在不向監(jiān)控者提供任何有用信息的情況下,使驗(yàn)證者相信某個(gè)論斷是正確的。零知識(shí)證明實(shí)際上是一種涉及雙方或更多方的協(xié)議,即雙方或更多方完成一項(xiàng)任務(wù)需要采取的一系列步驟,證明者需要向驗(yàn)證者證明并使其相信自己知道或擁有某一消息,但證明過程不向驗(yàn)證者泄露任何關(guān)于被證明消息的信息。

1985年,S. Goldwasser、S. Micali和C. Rackoff首次提出零知識(shí)證明(Zero-Knowledge Proof, ZKP)概念。目前在實(shí)際應(yīng)用中,某些加密貨幣就采用了這一技術(shù)路線。

可信執(zhí)行環(huán)境

可信執(zhí)行環(huán)境(TEE)是一種基于硬件的隱私保護(hù)方法,是指計(jì)算平臺(tái)上由軟硬件方法構(gòu)建的一個(gè)安全區(qū)域,可保證在安全區(qū)域內(nèi)部加載的代碼和數(shù)據(jù)在機(jī)密性和完整性方面得到保護(hù)。2009年,OMTP工作組率先提出一種雙系統(tǒng)解決方案:在同一個(gè)智能終端下,除多媒體操作系統(tǒng)外再提供一個(gè)隔離的安全操作系統(tǒng),這一運(yùn)行在隔離硬件之上的隔離安全操作系統(tǒng)用來專門處理敏感信息以保證信息安全,該方案是可信執(zhí)行環(huán)境的前身。

在實(shí)踐層面,目前以Intel SGX和ARM TrustZone為基礎(chǔ)的TEE技術(shù)起步較早,社區(qū)和生態(tài)已比較成熟。同時(shí),國產(chǎn)化的芯片廠商在TEE方向上已經(jīng)開始發(fā)力,國內(nèi)芯片廠商如海光、鯤鵬、飛騰、兆芯等都推出了支持可信執(zhí)行環(huán)境的技術(shù),信創(chuàng)國產(chǎn)化趨勢(shì)明顯,相關(guān)生態(tài)也正在加速建立、完善。

差分隱私

2006年,C. Dwork提出差分隱私(Differential Privacy, DP),這一技術(shù)路線的主要原理是通過引入噪聲對(duì)數(shù)據(jù)進(jìn)行擾動(dòng),并要求輸出結(jié)果對(duì)數(shù)據(jù)集中的任意一條記錄的修改不敏感,使攻擊者難以從建模過程中交換的統(tǒng)計(jì)信息或者建模的結(jié)果反推出敏感的樣本信息。

隱私計(jì)算的未來:融合應(yīng)用

除上述技術(shù)之外,還有圖聯(lián)邦、混淆電路、不經(jīng)意傳輸?shù)榷喾N技術(shù)路線被先后提出,并不斷在科研和產(chǎn)業(yè)的推動(dòng)下得到發(fā)展和應(yīng)用。

縱觀隱私計(jì)算不同技術(shù)路線,可以發(fā)現(xiàn)各有其優(yōu)勢(shì)與不足,在可支持計(jì)算、隱私保護(hù)維度、隱私保護(hù)強(qiáng)度、安全性、性能等方面有較大差異,分別適合不同的應(yīng)用和場(chǎng)景;同時(shí),不同的技術(shù)路線目前正在持續(xù)融合、取長(zhǎng)補(bǔ)短,實(shí)現(xiàn)1+1>2的應(yīng)用效果。例如通過硬件加速的全同態(tài)加密算法構(gòu)建強(qiáng)隱私、高性能的縱向聯(lián)邦學(xué)習(xí)系統(tǒng),就是一個(gè)不同技術(shù)路線深度融合的典型案例。

相信在未來,不同技術(shù)路線的融合以及與人工智能、區(qū)塊鏈等新興技術(shù)的結(jié)合,能夠推動(dòng)隱私計(jì)算大規(guī)模落地,實(shí)現(xiàn)海量數(shù)據(jù)要素的價(jià)值釋放。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )