數據使用的負外部性及數據要素監(jiān)管

本文原載于《金融時報》2021年3月29日-11版

黨的十九屆四中全會正式把數據作為國家新興基礎性戰(zhàn)略資源列為生產要素。如何培育一個符合我國國情的數據要素市場引發(fā)各界高度關注,隱私計算行業(yè)也因此迎來飛速發(fā)展機遇。目前社會各界對數據要素化的認識,大多聚焦于實現數據安全融合與數據交易流通帶來的巨大價值,往往忽略了數據大規(guī)模使用可能帶來的潛在風險,尤其是其負外部性。本文擬從數據使用的負外部性說起,探討數據要素監(jiān)管的必要性,以及合理選擇隱私計算技術方案對數據要素監(jiān)管的重要性。

一、有必要對數據使用的負外部性進行監(jiān)管

負外部性(Negative Externalities,也稱負面外部性)是指在無管制的狀態(tài)下,個人或企業(yè)不必完全承擔其行為帶來的社會成本。例如化工企業(yè)把污水排放到河流中、煙民在公共場所抽煙、廉價雇傭童工等等。這些行為在給己方帶來利益或滿足的同時,都對他人或社會帶來不同程度的負面影響,但行為方卻不必完全承擔這種負面影響的后果或成本,因而構成了負外部性。

社會化的數據使用,存在著巨大的負外部性。我們可以看到,擁有數據的組織能夠獲得大量的經濟收益,但是收益帶來了多大的負外部性,目前并沒有精確的度量和舉證方式。數據的負外部性主要表現在:

1.數據在使用中可能會泄露個體的信息隱私或集體機密,侵犯他人的權利或集體(國家)利益;

2.使用數據的群體相對減少了其他群體的選擇權。比如, 基于個人數據畫像產生的個性化推薦相對削弱了非應用群體和產品的選擇權和被選擇權

3.大規(guī)模使用大數據/人工智能技術的潛在社會和經濟風險尚未完全清晰,即使這種風險事件已經發(fā)生,受害者也很難舉證是大數據/人工智能造成的傷害,政府也較難強制相關行為人來彌補這種傷害。大規(guī)模的數據使用如果不被監(jiān)管,則無法對其負外部性進行管控。

數據監(jiān)管的目的就是防范和管控數據使用的負外部性。由于數據使用方一般只關注自身的利益和成本,如果沒有合理的制度來約束數據使用對他方或社會造成的負面影響,很可能會因此給他人或社會帶來傷害或損失。這里的他方可以是自然人(比如個人敏感信息被濫用),可能是社會(比如大數據殺熟)、也可能是國家利益(比如危及國家安全的數據被泄露)。因此,在數據要素化的制度設計過程中,必須要高度重視數據使用的負外部性風險。如同缺乏對環(huán)境污染的監(jiān)控與懲治就不可能有“綠水青山”一樣,國家必須對數據使用的負外部性進行有效管控,保障數據要素市場的健康發(fā)展和社會福祉不因此受損。

我們可以借鑒人類社會對于其他要素的負外部性進行治理的豐富經驗,通過相關的約束把外部性的問題內部化。主要包括:

1.通過立法劃定行為邊界,由政府對非法和違規(guī)的行為嚴加懲治,但又不干預正常的社會或經濟行為;例如通過《勞動法》對勞動力市場進行約束和規(guī)范,但具體的雇傭行為由各勞動者和用人單位自行約定。這種情況多存在于政府有直接的手段來監(jiān)督當事人的行為,使違規(guī)和違法行為較難隱匿。

2.通過稅收、產權分配等經濟手段,將有關經濟行為造成的社會成本直接納入到相關主體的行為成本范疇,實現個體成本與社會成本的匹配;例如為補償自然資源開采而征收的自然資源開采稅、為 “綠水青山”而成立的全國碳排放權交易等。

3.在法律劃定的行為紅線之內,通過在一定程度上集中監(jiān)管交易行為的方式,對可能出現的違規(guī)和違法行為進行集中的監(jiān)測和管控,例如規(guī)定公開發(fā)行的股權交易必須在證券交易所進行等等。然而,對于數據這種具有特殊屬性的生產要素,監(jiān)管也需要全新的技術思路。

二、數據要素監(jiān)管需要對監(jiān)管友好的技術架構

隨著大數據和人工智能技術的成熟,數據的主要使用對象已經由人變?yōu)橛嬎銠C,對數據要素的管理也必然需要采用新的技術手段。

當前,社會各方對數據使用風險的認識已較為清晰,主要是信息泄露和數據濫用。隱私計算(包括基于密碼學的多方計算、基于明文的數據脫敏、差分隱私和聯邦學習等)由于它的“數據可用不可見”技術特性,在旺盛的數據融合計算需求的推動下近年來開始蓬勃發(fā)展,并被寄予賦能數據要素交易流通的厚望。隱私計算技術的基本功能,是在充分實現數據價值挖掘的同時,保護數據提供方的數據安全,做到“可用不可見”,然而對于數據要素外部性的考量,我們認為可監(jiān)管性,也是隱私計算技術的必要組成部分。

堅持把“科技向善”的價值觀根植于隱私計算技術架構設計和應用。技術是中性的,以人民大眾的利益為出發(fā)點和落腳點,才能實現隱私計算技術為全社會服務的目標。實踐表明,新技術是否具備可被監(jiān)管的創(chuàng)新初宗和設計架構,是檢驗其是否能夠服務于廣大人民群眾的根本利益、是否符合社會主義核心價值觀的“試金石”。如同區(qū)塊鏈技術,不可監(jiān)管的代幣發(fā)行被視為非法金融活動,而監(jiān)管友好的區(qū)塊鏈則能推動構建現代可信體系。充分考慮監(jiān)管需求而設計的隱私計算架構,才能在發(fā)揮數據“可用不可見”技術優(yōu)勢的基礎上,有效防范和管控數據融合使用的負外部性風險。

以 “管理中心化、信任去中心化”作為數據融合使用體系的頂層設計。數據要素市場將是一個龐大的、復雜的、多元化的市場。在這個市場的培育過程中,應該使用一種便于管理的分布式代理計算架構,實現物理上的分布和邏輯上的集中相統(tǒng)一,有機地把數據安全和管理效率融為一體。“信任去中心化”是指分布式的隱私計算平臺和多方數據物理匯聚相比,具有打破單點信任和分布式高安全性等基礎優(yōu)勢,減少了數據集中帶來的信息安全和經濟風險;“管理中心化”是指所有計算任務由計算平臺統(tǒng)一進行調配管理,最優(yōu)化運行和管理效率。但更重要的是,通過中心化的管理,在數據使用中可以引入監(jiān)管的機制,采用完全可記錄、可驗證、可追溯、可審計、可解釋的技術架構,做到數據使用可監(jiān)管,不僅保護數據提供方的數據安全,同時提供了分析和監(jiān)管數據要素外部性的基礎設施。

三、直連模式的隱私計算讓數據監(jiān)管成為難題

當前,產業(yè)界熱衷于討論比較各種隱私計算技術的特點和優(yōu)劣,例如多方計算、聯邦學習、可信計算等。技術自身的屬性是客觀的,技術架構是人為設計的;不同的底層邏輯和設計意圖必然帶來應用上的巨大差異。認真討論和仔細鑒別不同的技術架構背后數據使用的模式差異,對它們相應的負外部性風險作出前瞻性判斷,才能有效防范和管控數據使用的負外部性風險。

隱私計算技術在設計過程中,主要有兩種技術架構:一種是各數據提供方相互直接連接的直連模式,另一種是使用代理計算的平臺模式。它們的底層邏輯差異決定了這兩種數據融合使用模式的可監(jiān)管性差異。

在直連模式中,各數據提供方自行扮演計算方角色,數據使用在各數據方之間形成一對一直接連接的閉環(huán),無法為外界提供集中審計和監(jiān)管的功能。這個問題是由直連模式的技術架構造成的,因此即使具備存證功能也無法解決可監(jiān)管性問題。

在代理計算的平臺模式中,各參與方不直接參與計算,而是由一組“實現去中心化,管理中心化”的服務器代理執(zhí)行計算協(xié)議,不僅保障數據“可用不可見”,而且做到了“可控可監(jiān)管”,多臺代理服務器交予多個不同控制方,由此形成一個去中心化的信任機制。在代理計算服務器權限之上,往往設置一個具備公信力的管理方,擔任“中心化管理”的角色。代理計算平臺上發(fā)生所有的操作都由區(qū)塊鏈或公信的數據庫進行記錄存證,以便追溯審計。

在直連模式下,第三方很難發(fā)現和監(jiān)督數據融合使用中的負外部性風險,特別是萬一這種隱私計算模式被不法分子非法利用,將放大以下兩方面的負外部性:一是數據交易方打著隱私計算的幌子,暗地里進行明文數據交易,直接侵害個人信息隱私或企業(yè)商業(yè)秘密;二是兩方或多方數據雖然以“可用不可見”的方式進行融合使用,但任何其他方無法有效得知有關數據的具體用法用途。因為無法有效對直連模式進行監(jiān)管,這種模式很難符合對數據融合使用的負外部性進行有效防范和管控的要求。

直連模式的隱私計算,在技術架構方面的特性使政府和社會無法對數據融合使用帶來的個人隱私保護、國家數據安全和有意規(guī)避監(jiān)管等負外部性實施有效的監(jiān)督和管控,廣泛地使用可能會導致數據要素市場建設初期的“虛假繁榮”和過后“一地雞毛”的尷尬局面,值得社會各方高度關注。

作者:徐葳、楊祖艷

(徐葳,清華大學交叉信息研究院長聘副教授,清華大學金融科技研究院副院長兼區(qū)塊鏈研究中心主任;楊祖艷,華控清交信息科技(北京)有限公司高級戰(zhàn)略總監(jiān))

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )