隱私計算“軟硬兼施”護航醫(yī)療數(shù)據(jù)共享

從算法到芯片的平臺級保障

隱私計算“軟硬兼施”護航醫(yī)療數(shù)據(jù)共享

今年全國兩會上,醫(yī)療作為重點民生領域再度受到關切。一是政府總支出更多向民生領域傾斜,特別是義務教育和基本醫(yī)療,二是各級政府要把義務教育和基本醫(yī)療任務扛在肩上。

簡言之,醫(yī)療是政府要重點花錢和出力的領域。而作為重要抓手,智慧醫(yī)療是平衡醫(yī)療資源的有效手段。但美中不足的是,智慧醫(yī)療距離真正落地實現(xiàn)普惠仍有距離,問題的癥結就在于醫(yī)療數(shù)據(jù)的特殊性。

根據(jù)統(tǒng)計,發(fā)生數(shù)據(jù)泄露事件最多的十大行業(yè)中,醫(yī)療行業(yè)居首,未經(jīng)授權的泄密已經(jīng)成為醫(yī)療行業(yè)數(shù)據(jù)安全的首要風險。多位兩會委員都提到,目前智慧醫(yī)療面對的最大問題之一就是數(shù)據(jù)標準不統(tǒng)一,不兼容,數(shù)據(jù)無法互通共享,數(shù)據(jù)安全保護不足。

全國政協(xié)委員、浙江省政協(xié)副主席、民進浙江省委會主委、浙江大學醫(yī)學院附屬邵逸夫醫(yī)院院長蔡秀軍指出,我國擁有龐大的患者群體和豐富的臨床病例,但是目前臨床數(shù)據(jù)的整合、利用尚存在諸多不足和障礙,不利于智慧醫(yī)療的建設與發(fā)展。造成這一尷尬局面的原因在于:首先,醫(yī)療數(shù)據(jù)缺乏統(tǒng)一標準。其次,醫(yī)療數(shù)據(jù)系統(tǒng)不兼容。最后,醫(yī)療數(shù)據(jù)安全保障與隱私保護不足。

全國人大代表、江蘇省人民醫(yī)院黨委書唐金海在談到建立智慧醫(yī)療聯(lián)合體時認為,針對不同類型、級別醫(yī)療機構的實際情況,形成一個既有統(tǒng)一規(guī)范,又能分層指導的行業(yè)標準。實現(xiàn)不同醫(yī)療機構之間的信息互通、數(shù)據(jù)共享,形成區(qū)域協(xié)同、機構協(xié)同、上下聯(lián)動,構建一個集合人才培養(yǎng)、數(shù)據(jù)共享、遠程會診、雙向轉診、醫(yī)保支付結算等為一體的智慧醫(yī)療聯(lián)合體。

問題明確后,解決之道便豁然開朗——有委員直接指出了隱私計算的重要作用和應用前景。全國政協(xié)委員、啟明星辰集團首席執(zhí)行官嚴望佳建議,加強人工智能應用相關的數(shù)據(jù)安全及隱私保護技術研究,在推進數(shù)據(jù)安全相關法律完善的同時,還應加強隱私計算、安全多方計算等前沿技術研究,在不泄露隱私與敏感信息的前提下,保留數(shù)據(jù)價值并支持人工智能應用構建所需的高效計算。

簡言之,隱私計算就是借助科技讓數(shù)據(jù)可用不可見。隱私計算并非單一技術,而是多種技術路徑的綜合使用,不僅包含軟件算法,也包括硬件環(huán)境。其中軟件方面主要指多方安全計算(MPC)、同態(tài)加密(HE)、差分隱私(DP)等算法,而硬件環(huán)境則主要指基于芯片的可信執(zhí)行環(huán)境(TEE)。

TEE支撐數(shù)據(jù)共享“三位一體”:安全、開放、高效

盡管初看隱私計算給人感覺十分前沿和復雜,但隱私計算的一些技術路徑已經(jīng)相當成熟而接地氣了。以TEE為例,其實早就廣泛應用于幾乎每個人的生活中——手機可以指紋識別和面部識別,這些個人生物信息之所以能被安全使用,正是由于手機芯片中有一個TEE區(qū)域。

TEE從硬件層面保護數(shù)據(jù)安全,涉及敏感數(shù)據(jù)的計算都在TEE中進行,僅輸出計算結果。拿手機來說,要解鎖手機或支付時,TEE輸出的結果只是此人是否為機主本人,而不會泄露具體的生物信息。

由于TEE與芯片的原生關系,TEE的技術標準和市場現(xiàn)狀與芯片一脈相承,如X86架構芯片的TEE方案以英特爾的SGX為主要代表。早在2017年,阿里云就與英特爾聯(lián)合發(fā)布了基于芯片級的SGX 加密計算技術,為云上客戶提供了系統(tǒng)運行時的可信能力,云上開發(fā)者可以利用SGX技術提供的可信執(zhí)行環(huán)境,將內存中的關鍵代碼和數(shù)據(jù)保護起來,通過云上的可信執(zhí)行環(huán)境,防止數(shù)據(jù)被竊取或被篡改。

具體來看,英特爾SGX 是一組能夠提高應用程序的代碼和數(shù)據(jù)安全性的指令,可以提供針對信息泄露和篡改的更多保護。編程人員可以把敏感信息放置到稱為“飛地”(Enclave) 的一塊內存區(qū)域里,以獲得更高級別的安全防護。

作為一項成熟技術,TEE無疑為生物信息的更大范圍安全共享與利用提供了絕佳思路,也讓隱私計算行業(yè)持續(xù)挖掘其潛能。近日,國內隱私計算“四小龍”之一的翼方健數(shù)聯(lián)手英特爾,基于英特爾SGX推出的面向生物醫(yī)學研究的多方多模態(tài)隱私保護平臺XDP,有力地加速了數(shù)據(jù)在生物醫(yī)學科研領域的價值釋放,推動了精準醫(yī)療的加速到來。

隱私計算“軟硬兼施”護航醫(yī)療數(shù)據(jù)共享

基于英特爾SGX的可信執(zhí)行環(huán)境(TEE),翼方健數(shù)XDP平臺以提供面向具體商業(yè)場景的跨節(jié)點數(shù)據(jù)協(xié)作能力為目標,賦能終端用戶TEE技術能力,解決數(shù)據(jù)協(xié)作下的數(shù)據(jù)安全問題,為多種業(yè)務場景提供通用能力,并致力于服務于數(shù)據(jù)聯(lián)盟,動態(tài)撮合不同節(jié)點間的數(shù)據(jù)協(xié)同。

XDP 平臺通過三個自主研發(fā)的核心模塊:XFS (XDP File System)、XEE (XDP Execution Engine) 以及DaaS (Data as a Service),兼顧“安全”與“開放”,實現(xiàn)了數(shù)據(jù)的隱私保護與安全共享。

對此,翼方健數(shù)聯(lián)合創(chuàng)始人兼首席技術官趙璽表示,安全是XDP的首要特點,數(shù)據(jù)必須在授權之后才可以在平臺內使用,原始數(shù)據(jù)不離開平臺。開放則是平臺對第三方開放,包括建立數(shù)據(jù)追溯機制,提供全面的數(shù)據(jù)安全和授權保障機制。另外還要高效,即平臺能夠快速適配多樣化業(yè)務場景。

此外,作為一個通用的隱私計算數(shù)據(jù)平臺,XDP通過平臺內的不同應用,可以同時實現(xiàn)包括多方安全計算(MPC)、可信計算環(huán)境(TEE)、聯(lián)邦學習(Federated Learning, FL)和差分隱私 (DP) 等在內的隱私安全計算技術,以滿足平臺用戶在不同場景下的安全計算需求。

隱私計算“軟硬兼施”護航醫(yī)療數(shù)據(jù)共享

通用隱私計算數(shù)據(jù)平臺釋放醫(yī)療數(shù)據(jù)價值

趙璽指出,隨著臨床診療模式的變化、生信科技發(fā)展的突破以及計算機科學的進步,多方參與的醫(yī)學科研協(xié)作在數(shù)據(jù)、安全、倫理、隱私及科研成果保護等方面面臨著新挑戰(zhàn)。翼方健數(shù)XDP平臺的開發(fā)落地恰逢其時,實現(xiàn)了在一個獨立的平臺內解決多用戶之間在數(shù)據(jù)授權使用下安全數(shù)據(jù)協(xié)作的問題。

事實上,不少醫(yī)療科研平臺已經(jīng)深刻認識到了數(shù)據(jù)保護的重要性和迫切性,并積極采用專業(yè)隱私計算平臺作為解決方案。以翼方健數(shù)XDP平臺為例,其已在國內多地被多家機構使用,包括政府機構、醫(yī)療機構、產(chǎn)業(yè)園區(qū)等。

比如,南京江北新區(qū)生物醫(yī)藥公共服務平臺旗下質譜檢測與分析中心是亞洲規(guī)模最大的質譜產(chǎn)業(yè)服務平臺,生物樣本中心更是國內領先的千萬級生物樣本庫。南京江北新區(qū)生物醫(yī)藥公共服務平臺還匯聚江蘇省8,000萬人的健康檔案及電子病歷,涉及全省三級醫(yī)院、二級醫(yī)院和基層醫(yī)療機構全量數(shù)據(jù)。

隱私計算“軟硬兼施”護航醫(yī)療數(shù)據(jù)共享

這些高維度、多模態(tài)的數(shù)據(jù)的解讀和依據(jù)這些數(shù)據(jù)的決策是臨床科學研究的前沿和熱點。臨床科研轉化和藥物研發(fā)的工作往往需要臨床醫(yī)學專家、生物統(tǒng)計專家、生物信息專家、計算機科學家在內的多學科專家參與,多部門跨地域的科研協(xié)作成為了常態(tài)。醫(yī)學科研協(xié)作過程中的挑戰(zhàn)除了科研工作本身,數(shù)據(jù)安全、倫理、隱私以及科研成果保護也是決定科研成敗的關鍵。

今年初,南京江北新區(qū)生物醫(yī)藥公共服務平臺與翼方健數(shù)達成戰(zhàn)略合作,聯(lián)合打造多模態(tài)多組學數(shù)據(jù)的一站式分析協(xié)作平臺。為此,翼方健數(shù)XDP平臺建立了遵循隱私計算理念的數(shù)據(jù)存儲、計算、協(xié)作環(huán)境,在數(shù)據(jù)安全、授權使用和隱私保護下提供了數(shù)據(jù)采集、清洗、分析、應用的數(shù)據(jù)全生命周期管理。翼方健數(shù)XDP平臺通過豐富的功能和優(yōu)良的生態(tài)設計,為多模態(tài)多組學數(shù)據(jù)分析協(xié)作提供了一站式服務,大大地提高了科研和臨床轉化的效率。

在商業(yè)領域,翼方健數(shù)也于今年初助力某科技園區(qū)推出了該地區(qū)首個供商業(yè)及學術機構進行生物科技研發(fā)的生物樣本庫和生物醫(yī)學信息平臺。

該生物醫(yī)學信息平臺旨在共享生物醫(yī)藥數(shù)據(jù),促成企業(yè)和學術界交流協(xié)作。該平臺提供數(shù)據(jù)目錄供研究人員搜索資料及開展機構內部或機構之間的合作項目。他們無需從平臺下載數(shù)據(jù)集,即可視化開發(fā)和分析平臺上的數(shù)據(jù)。

數(shù)據(jù)安全方面,該平臺具備嚴謹?shù)氖跈嗪蜕矸蒡炞C機制,數(shù)據(jù)擁有者可完全掌控其數(shù)據(jù)集的存取權限,還設有數(shù)據(jù)血緣追溯功能。在翼方健數(shù)的技術支持下,該平臺已順利承載了幾十個研究項目。

值得一提的是,隱私計算不僅能助推醫(yī)療“大數(shù)據(jù)”服務于更多“大眾”,還能讓一部分“小數(shù)據(jù)”更有效服務于“小眾”——典型場景就是罕見病診療。

罕見病數(shù)據(jù)具有顯著特殊性:一是數(shù)據(jù)量遠小于常規(guī)醫(yī)療數(shù)據(jù)——80%以上為非結構化數(shù)據(jù),且多個機構之間沒有統(tǒng)一的數(shù)據(jù)標準,造成現(xiàn)有臨床數(shù)據(jù)難以直接用于罕見病研究。二是罕見病數(shù)據(jù)屬于高度隱私敏感數(shù)據(jù),涉及的臨床和基因數(shù)據(jù)一旦泄露將造成廣泛而嚴重的影響。

這樣的特殊性恰為隱私計算提供了絕佳發(fā)揮空間,可以在確保安全的前提下把這類小數(shù)據(jù)聚沙成塔,放大數(shù)據(jù)價值為科研與臨床所用,最終造福病患。以翼方健數(shù)的相關解決方案為例,可以進行臨床及生物信息數(shù)據(jù)的采集、存儲、治理、計算與分析。不僅實現(xiàn)罕見病數(shù)據(jù)的一次采集多次利用,還支持國際常見罕見病相關數(shù)據(jù)庫的整合與支持。

隱私計算“軟硬兼施”護航醫(yī)療數(shù)據(jù)共享

知易行難,篤定前行

至此,隱私計算的靚麗“首秀”似乎已為許多場景下的數(shù)據(jù)難題開辟了新思路。然而隱私計算的發(fā)展畢竟尚處早期,要在各行業(yè)真正大規(guī)模落地依然知易行難,尤其對于醫(yī)療這類數(shù)據(jù)敏感度極高的行業(yè)更是如此。

這里的難點主要有兩大方面。一方面是技術融合不易,即傳統(tǒng)行業(yè)對隱私計算技術的認識較為初步,隱私計算技術企業(yè)對傳統(tǒng)行業(yè)的認識也不夠深刻,而隱私計算的真正落地卻需要雙方的深入理解與配合。另一方面是合規(guī)不易,即對于不同類型、不同敏感度的數(shù)據(jù),不同國家都有不同的保護規(guī)范,加之不同行業(yè)數(shù)據(jù)基礎設施水平不盡相同,都給隱私計算的大規(guī)模落地帶來了難度。

目前來看,以隱私計算通用平臺為技術底座,再基于這樣的隱私計算基礎設施為不同行業(yè)開發(fā)應用,是一條務實高效的路徑。從上述翼方健數(shù)XDP平臺可以得到的啟迪是,隱私計算不僅是技術,更應是解決方案。

無論是TEE的硬件路徑,還是算法的軟件路徑,亦或是“軟硬兼施”的綜合路徑,隱私計算企業(yè)最終輸出給終端行業(yè)的并非技術或產(chǎn)品,而是要幫助客戶找到實現(xiàn)數(shù)據(jù)協(xié)同,以更安全可靠的方式挖掘更大數(shù)據(jù)價值的場景。

翼方健數(shù)董事長陳恂就曾在采訪中提到:“不是翼方健數(shù)選擇了醫(yī)療,而是翼方健數(shù)的隱私計算被迫切需要數(shù)據(jù)協(xié)同的醫(yī)療行業(yè)選中。”相信隨著立法的完善與公眾意識的增強,未來各行各業(yè)對數(shù)據(jù)安全協(xié)同的需求將持續(xù)增長,也必然大有隱私計算用武之地。

(免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )