楊強(qiáng)院士:希望2022年實(shí)現(xiàn)從聯(lián)邦學(xué)習(xí)到可信聯(lián)邦學(xué)習(xí)的跨越

2022年,隱私計(jì)算商業(yè)化和技術(shù)迭代雙提速。近日,在“機(jī)器之心”舉辦的「AI科技年會(huì)」上,聯(lián)邦學(xué)習(xí)FATE開源社區(qū)技術(shù)指導(dǎo)委員會(huì)主席、加拿大工程院及加拿大皇家科學(xué)院兩院院士楊強(qiáng)教授提出,聯(lián)邦學(xué)習(xí)研究進(jìn)入新階段,下一個(gè)重點(diǎn)目標(biāo)是如何實(shí)現(xiàn)“可信聯(lián)邦學(xué)習(xí)”。

  可信聯(lián)邦學(xué)習(xí)的三大要素

2022年將成為一個(gè)新的技術(shù)分水嶺——從聯(lián)邦學(xué)習(xí)到可信聯(lián)邦學(xué)習(xí)。

針對(duì)近兩年來隱私計(jì)算和聯(lián)邦學(xué)習(xí)發(fā)展和應(yīng)用中面臨的安全、效率等挑戰(zhàn),楊強(qiáng)教授及團(tuán)隊(duì)對(duì)聯(lián)邦學(xué)習(xí)的理論進(jìn)行了持續(xù)豐富和拓展,形成了“可信聯(lián)邦學(xué)習(xí)”。據(jù)楊強(qiáng)教授介紹,可信聯(lián)邦學(xué)習(xí)是安全可信的聯(lián)邦學(xué)習(xí),是能夠滿足用戶和監(jiān)管等各方面需求的分布式機(jī)器學(xué)習(xí)范式。

在此范式中,隱私保護(hù)、模型性能、算法效率是核心的三角基石,并且與模型的決策可解釋性和模型的可監(jiān)管性兩大支柱,共同構(gòu)成了更加安全可信的聯(lián)邦學(xué)習(xí)。數(shù)據(jù)安全可證明、模型性能可使用、機(jī)器學(xué)習(xí)效率可控、決策可解釋、模型可監(jiān)管和普惠是可信聯(lián)邦學(xué)習(xí)的核心特征。

楊強(qiáng)院士:希望2022年實(shí)現(xiàn)從聯(lián)邦學(xué)習(xí)到可信聯(lián)邦學(xué)習(xí)的跨越

隱私安全方面,需要可證的隱私安全,并且具有抗攻擊能力;模型性能方面,參與聯(lián)邦學(xué)習(xí)的模型性能效用最優(yōu),不能因?yàn)楸Wo(hù)隱私而導(dǎo)致模型性能的大幅下降;算法效率方面,聯(lián)邦學(xué)習(xí)應(yīng)該是一個(gè)高效的過程,要盡可能地提升通訊和計(jì)算的效率;可解釋和可監(jiān)管方面,則需要機(jī)制透明,結(jié)果可說明、可溯源、可審計(jì)、可追責(zé);普惠方面,利用開源等方式,降低隱私保護(hù)AI應(yīng)用的門檻。

可信聯(lián)邦學(xué)習(xí)是技術(shù)融合的必然走向

隱私計(jì)算有多個(gè)技術(shù)分支,近年來,研究者在每個(gè)細(xì)分領(lǐng)域都付出了大量努力,實(shí)現(xiàn)隱私計(jì)算從0到1的開拓。在技術(shù)不斷發(fā)展成熟過程中,“可信聯(lián)邦學(xué)習(xí)”的提出,是首次將安全、性能,效率等要素統(tǒng)一在共同的理論框架下。

過往有部分觀點(diǎn)錯(cuò)誤地認(rèn)為,安全多方計(jì)算(MPC)、同態(tài)加密(HE)、可信執(zhí)行環(huán)境(TEE)、差分隱私(DP)、聯(lián)邦學(xué)習(xí)等,各技術(shù)分支之間是“非此即彼”的關(guān)系。一種更極端片面的觀點(diǎn)甚至認(rèn)為,聯(lián)邦學(xué)習(xí)技術(shù)是通過犧牲安全性來追求效率,并以此作為反對(duì)聯(lián)邦學(xué)習(xí)的理由。

對(duì)此,楊強(qiáng)教授及團(tuán)隊(duì)提出了隱私與模型性能的"No-free-lunch安全-收益恒定"定律(論文鏈接:https://arxiv.org/abs/2203.05816),從信息論的角度為隱私泄露和效用損失的權(quán)衡提供了一個(gè)通用的理論框架。

楊強(qiáng)院士:希望2022年實(shí)現(xiàn)從聯(lián)邦學(xué)習(xí)到可信聯(lián)邦學(xué)習(xí)的跨越

針對(duì)多方機(jī)器學(xué)習(xí)中不同的潛在攻擊行為和對(duì)安全可能的威脅,這一理論框架揭示了對(duì)于滿足“貝葉斯隱私”的多方計(jì)算系統(tǒng)而言,都滿足“|安全|+|效能|≤常數(shù)” 這一“安全-效益恒定定律”,表明天下沒有免費(fèi)的午餐,想同時(shí)不泄露隱私和不降低模型性能是不可能的,但可以找到均衡點(diǎn)。基于這一理論框架的可信聯(lián)邦學(xué)習(xí),既不會(huì)犧牲對(duì)數(shù)據(jù)的安全保護(hù),也不會(huì)放任模型性能和學(xué)習(xí)效率的大幅下降,而是利用安全-效益恒定定律所揭示的內(nèi)在關(guān)系,將安全-性能-效率三者形成有機(jī)整體,以實(shí)現(xiàn)更高質(zhì)量的隱私保護(hù)。

楊強(qiáng)教授表示,任何多方參與進(jìn)行人工智能建模的過程,都繞不開可信聯(lián)邦學(xué)習(xí)這一通用的機(jī)器學(xué)習(xí)范式?;诖死碚摽蚣?,能夠量化分析隱私計(jì)算各種技術(shù)保護(hù)方案的優(yōu)劣,進(jìn)而指導(dǎo)隱私保護(hù)算法設(shè)計(jì)。合理運(yùn)用包括安全多方計(jì)算(MPC)、同態(tài)加密(HE)、可信執(zhí)行環(huán)境(TEE)、差分隱私(DP)等技術(shù)手段來進(jìn)行合理配置,結(jié)合分布式機(jī)器學(xué)習(xí)和人工智能算法,找到聯(lián)合建??尚?、可行及可控的解決方案,這就是“可信聯(lián)邦學(xué)習(xí)”的核心命題。此外,通過可信聯(lián)邦學(xué)習(xí)中模型的“版權(quán)保護(hù)”(FedIPR),實(shí)現(xiàn)數(shù)據(jù)版權(quán)的保護(hù)和結(jié)果可溯源、可審計(jì)、可解釋;通過開源、開放和共享,實(shí)現(xiàn)普惠。這些方面將共同構(gòu)建起可信聯(lián)邦學(xué)習(xí)的內(nèi)涵和外延??尚怕?lián)邦學(xué)習(xí)將在各種場(chǎng)景下使隱私計(jì)算應(yīng)用成為現(xiàn)實(shí),極大降低隱私計(jì)算的成本,提升隱私計(jì)算應(yīng)用質(zhì)量,推動(dòng)隱私計(jì)算的加速發(fā)展。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )