編織聯(lián)邦學(xué)習(xí)的產(chǎn)業(yè)路徑,騰訊向金融智能化的更遠(yuǎn)處進(jìn)發(fā)

原標(biāo)題:編織聯(lián)邦學(xué)習(xí)的產(chǎn)業(yè)路徑,騰訊向金融智能化的更遠(yuǎn)處進(jìn)發(fā)

這屆人工智能能夠化身“新基建”的中流砥柱,避免了重蹈“AI寒冬”的覆轍,一個很大的原因就是,機(jī)器學(xué)習(xí)從產(chǎn)業(yè)層面提質(zhì)增效,真正讓技術(shù)變成了社會經(jīng)濟(jì)的價值推動力。

技術(shù)高速迭代的時代,也讓無數(shù)從業(yè)者和普通人痛并快樂著。因為需要不斷打開認(rèn)知通道,敢于去觸摸那些剛剛被釋放出來的產(chǎn)業(yè)能量。

近日,江蘇銀行與騰訊安全共同舉行聯(lián)邦學(xué)習(xí)應(yīng)用服務(wù)簽約儀式,開啟了聯(lián)邦學(xué)習(xí)的“從云端到產(chǎn)業(yè)地平線”的落地之旅,也激發(fā)了不少人對這項技術(shù)的好奇。

聯(lián)邦學(xué)習(xí)、金融業(yè),與騰訊之間,如何搭建起一個屬于未來的智能產(chǎn)業(yè)生態(tài),是一個值得思考的議題。

聯(lián)邦學(xué)習(xí):聯(lián)合與分治的技與藝

對于關(guān)注AI的讀者來說,聯(lián)邦學(xué)習(xí)并不陌生。

自從2016年谷歌最先提出并應(yīng)用之后,聯(lián)邦學(xué)習(xí)就被看做是下一代人工智能協(xié)同算法和協(xié)作網(wǎng)絡(luò)的基礎(chǔ),國外如亞馬遜、IBM,國內(nèi)如BAT、華為、平安等科技公司在積極部署和推動聯(lián)邦學(xué)習(xí)產(chǎn)業(yè)化的進(jìn)程。

簡單來說,聯(lián)邦學(xué)習(xí)就是隨著人工智能,以及分布式計算、區(qū)塊鏈等技術(shù)的協(xié)同發(fā)展,自然迭代出的系統(tǒng)化方案——在保護(hù)隱私的前提下,對多方的大數(shù)據(jù)價值進(jìn)行挖掘,實(shí)現(xiàn)AI模型的訓(xùn)練與性能提升。

為什么需要聯(lián)合與分治共存,要從當(dāng)下以機(jī)器學(xué)習(xí)為代表的人工智能應(yīng)用中的很多現(xiàn)實(shí)問題說起。

一方面,人工智能逐漸普及,對隱私安全的監(jiān)管越來越嚴(yán)格,面對GDPR等一系列法律法規(guī)的出臺,以數(shù)據(jù)為訓(xùn)練基礎(chǔ)的深度神經(jīng)網(wǎng)絡(luò)必須做出改變,適應(yīng)新的社會規(guī)范;

但是,合法合規(guī)的管控,又會加劇數(shù)據(jù)孤島問題。不同機(jī)構(gòu)和企業(yè)各自為營,捍衛(wèi)自家的用戶數(shù)據(jù),讓許多優(yōu)秀算法模型無法得到充分的數(shù)據(jù)養(yǎng)料和有效訓(xùn)練,自然會給AI性能和準(zhǔn)確率帶來枷鎖。

聯(lián)邦學(xué)習(xí),就在高質(zhì)量數(shù)據(jù)的分與合之間,找到了辯證統(tǒng)一的平衡點(diǎn)——在不共享原始數(shù)據(jù)的前提下,利用雙方的數(shù)據(jù)實(shí)現(xiàn)模型增長。

舉個例子,假如A是銀行,B是社交平臺,C是出行打車平臺,分別擁有各自的用戶相關(guān)數(shù)據(jù)?,F(xiàn)在ABC想要聯(lián)合訓(xùn)練一個機(jī)器學(xué)習(xí)模型,來預(yù)測經(jīng)常出沒在哪些地區(qū)、關(guān)注哪些興趣話題的人,擁有更高的償債能力。

如果各個平臺之間直接進(jìn)行數(shù)據(jù)交換,作用用戶肯定會擔(dān)心暴露自己的隱私和信息安全。但不交換又該怎么訓(xùn)練呢?

答案就是,都使用聯(lián)邦學(xué)習(xí)技術(shù)。在加密狀態(tài)下,找到共有的用戶,這樣彼此都不知道數(shù)據(jù)對應(yīng)的關(guān)鍵用戶信息。用這部分?jǐn)?shù)據(jù)來提取特征,并在自己的服務(wù)器上進(jìn)行訓(xùn)練和調(diào)參,既遵守了隱私保護(hù)法規(guī),又能夠補(bǔ)充自己不具備的數(shù)據(jù)信息、提升雙方模型的能力。

如此皆大歡喜的方案,大家怎么不快快都用起來呢?

某種程度上來說,聯(lián)邦學(xué)習(xí)也是一張集合了心理題與技術(shù)題的綜合考卷,只有都答對的企業(yè)才有可能推開這扇大門。

總的來說,聯(lián)邦學(xué)習(xí)雖好,卻也伴隨著許多亟待解決的新問題:

1.各個AI企業(yè)之間的協(xié)作信任關(guān)系很難建立。

以前企業(yè)想上馬AI,都是單打獨(dú)斗式地運(yùn)用自身數(shù)據(jù)自主訓(xùn)練,聯(lián)邦學(xué)習(xí)要將各個不同行業(yè)、領(lǐng)域的企業(yè)并入一套標(biāo)準(zhǔn)化的系統(tǒng),在一起進(jìn)行多方聯(lián)合建模。

這種合作就像南方人初入澡堂,要卸下重重防備一起享受實(shí)屬挑戰(zhàn)。如何從技術(shù)端保障企業(yè)之間的數(shù)據(jù)安全,讓大多數(shù)公司愿意將數(shù)據(jù)拿出來和其他伙伴交換,有先鋒公司和標(biāo)桿案例的出現(xiàn),用實(shí)打?qū)嵉膽?yīng)用效果,來解決信任問題。

2.數(shù)據(jù)樣本的復(fù)雜化,訓(xùn)練環(huán)境的不一致。

即使有公司愿意加入聯(lián)邦共同成長建模,也必須面對現(xiàn)實(shí)中,不同企業(yè)和機(jī)構(gòu)所處的計算環(huán)境、網(wǎng)絡(luò)環(huán)境、數(shù)據(jù)環(huán)境各不相同的境況。

比如有的公司數(shù)據(jù)質(zhì)量差,沒有進(jìn)行標(biāo)注無法被訓(xùn)練;有的數(shù)據(jù)分散,不同部門之間沒有數(shù)據(jù)合作;還有的數(shù)據(jù)實(shí)時變化,需要花費(fèi)人力去維護(hù),缺乏聯(lián)邦學(xué)習(xí)的動力。

3.“要想富先投入”,聯(lián)邦學(xué)習(xí)的額外成本。

通過聯(lián)邦學(xué)習(xí)降低數(shù)據(jù)、建模的綜合成本,提質(zhì)增效,是產(chǎn)業(yè)的初衷。但圍繞聯(lián)邦學(xué)習(xí)搭建團(tuán)隊、溝通對接、進(jìn)行訓(xùn)練,也需要投入一定量資源來完成,又進(jìn)一步提升了聯(lián)邦學(xué)習(xí)產(chǎn)業(yè)化的門檻。企業(yè)不僅應(yīng)該著力想辦法降低成本門檻,同時也要讓新參與者接收初期成本。

通過這些問題可以看出,聯(lián)邦學(xué)習(xí)想要邁出真實(shí)的步伐,必須精準(zhǔn)吸引那些“準(zhǔn)用戶”,來主動解答這張前沿試卷。

開啟智慧金融新篇章,騰訊扮演了三重角色

聯(lián)邦學(xué)習(xí)借由金融場景落地到普通人身邊,自然不是無緣無故的。騰訊安全在此時向銀行和金融機(jī)構(gòu)交付聯(lián)邦學(xué)習(xí)應(yīng)用服務(wù),在我看來,是在鍛造新的產(chǎn)業(yè)“內(nèi)燃機(jī)”。

一方面,金融場景下數(shù)據(jù)保密等級高,安全要求更為嚴(yán)格;同時場景變化快,又對智能技術(shù)的升級迭代有著嚴(yán)苛的要求。在安全與升級之間,聯(lián)邦學(xué)習(xí)技術(shù)與金融領(lǐng)域就達(dá)成了一次情投意合的碰撞。

從中長期來看,金融領(lǐng)域的數(shù)據(jù)挖掘必然會持續(xù)受到法律法規(guī)的捆綁,這就要求其必須注重共建模型的搭建,學(xué)會“戴著鐐銬跳舞”。

此外,伴隨著傳統(tǒng)深度神經(jīng)網(wǎng)絡(luò)算法的普及,金融機(jī)構(gòu)和銀行也都到了進(jìn)一步發(fā)展和提升自身技術(shù)水位,與同業(yè)拉開差異化優(yōu)勢的階段,以爭奪增量客群。

而伴隨著客群的規(guī)模擴(kuò)大,必然會帶來用戶信用資質(zhì)數(shù)據(jù)不足、質(zhì)量參差不齊、風(fēng)控風(fēng)險高等潛在風(fēng)險,此時聯(lián)邦學(xué)習(xí)提供的共同建模,就能從根源上來幫助企業(yè)利用AI提質(zhì)增效。

金融領(lǐng)域毫無爭議地成為了聯(lián)邦學(xué)習(xí)落地的第一站。作為國內(nèi)最早倡導(dǎo)“聯(lián)邦學(xué)習(xí)”技術(shù)的團(tuán)隊之一,騰訊安全也交付了一整套聯(lián)邦學(xué)習(xí)應(yīng)用服務(wù)(FLAS)產(chǎn)品。

對于盼望著技術(shù)甘霖從云端降落到地面的金融領(lǐng)域來說,騰訊至少扮演了三個角色:

1.平臺輸血者——打破信任僵局。

前面我們提到,聯(lián)邦學(xué)習(xí)想要發(fā)揮效用,既要打破各個企業(yè)之間的信任障礙,也要保障用戶信息的隱私安全。

但大家的數(shù)據(jù)彼此之間不能“碰面”,模型訓(xùn)練必不可少的特征變量都變得不可見了,還怎么聯(lián)合建模?面對這一難題,騰訊安全作為平臺方,就起到了重要的“輸血”作用。

借助騰訊在20年的安全攻防過程中沉淀出的大數(shù)據(jù)分析能力,以及騰訊安全服務(wù)中國99%以上網(wǎng)民所沉淀下來的黑灰產(chǎn)庫,積累出了三千多個風(fēng)險種類的特征變量。然后,騰訊安全對聯(lián)邦學(xué)習(xí)的框架進(jìn)行了重新優(yōu)化,在與金融機(jī)構(gòu)的合作中進(jìn)行融合,就能達(dá)到保護(hù)數(shù)據(jù)的同時,保障模型性能的效果。

比如在江蘇銀行的合作中,就基于對方資金流相關(guān)維度的數(shù)據(jù)沉淀下來的特征變量和特征工程,在可用不可見的情況下進(jìn)行融合,只交換了機(jī)器學(xué)習(xí)的中間值(即梯度),在效果不衰減的情況下,達(dá)到了數(shù)據(jù)融合建模。

2.技術(shù)前哨站,探索應(yīng)用業(yè)務(wù)創(chuàng)新。

任何前沿技術(shù)的產(chǎn)業(yè)下沉,最終都要落實(shí)到務(wù)實(shí)的商業(yè)價值上去,聯(lián)邦學(xué)習(xí)也不例外。

如何讓技術(shù)與自身業(yè)務(wù)相匹配?騰訊生態(tài)內(nèi)的實(shí)戰(zhàn)訓(xùn)練,就扮演了“前哨”的角色,以自身經(jīng)驗+場景定制的方式,來為垂直行業(yè)進(jìn)行鋪陳。

舉個例子,在辦理個人信貸業(yè)務(wù)時,除了用戶所在地,包括戶籍地、移動運(yùn)營歸屬地、行為軌跡等數(shù)據(jù)之外,金融機(jī)構(gòu)還可以通過申請,引入諸如興趣偏好、社交網(wǎng)絡(luò)、收入情況等互聯(lián)網(wǎng)產(chǎn)品的其他數(shù)據(jù),通過縱向聯(lián)邦學(xué)習(xí),來訓(xùn)練自己的風(fēng)控模型,實(shí)現(xiàn)更準(zhǔn)確的綜合評估。

騰訊安全團(tuán)隊在明確了聯(lián)邦學(xué)習(xí)與金融業(yè)務(wù)的最佳契合點(diǎn)之后,充分發(fā)揮技術(shù)效能,推進(jìn)行業(yè)端敏捷的業(yè)務(wù)創(chuàng)新。對200余個業(yè)務(wù)指標(biāo)進(jìn)行篩選與聯(lián)邦建模,聯(lián)邦學(xué)習(xí)聯(lián)合建模新模型的AUC值提升10%-15%,最大KS值提升50%左右,為江蘇銀行的信用卡智能化管理打下了基礎(chǔ)。

3.成本精算師。

騰訊安全聯(lián)邦學(xué)習(xí)的附加值,還體現(xiàn)在以高度可應(yīng)用化的技術(shù)輸出形式,幫助企業(yè)控制技術(shù)升級成本。

首先,騰訊微眾銀行(WeBank)提出了工業(yè)級別聯(lián)邦學(xué)習(xí)框架——聯(lián)邦學(xué)習(xí)開源項目Federated AI Technology Enabler(簡稱 FATE);騰訊TEG數(shù)據(jù)平臺部基于自研分布式機(jī)器學(xué)習(xí)平臺Angel,設(shè)計了一種“去中心化”的聯(lián)邦學(xué)習(xí)框架PowerFL,并研發(fā)了FM、神經(jīng)網(wǎng)絡(luò)等聯(lián)邦學(xué)習(xí)算法。騰訊安全則進(jìn)一步對這兩種計算框架進(jìn)行了云化部署,形成了PaaS級聯(lián)邦學(xué)習(xí)服務(wù)。

另外,基于騰訊的海量安全大數(shù)據(jù),騰訊安全聯(lián)邦學(xué)習(xí)應(yīng)用服務(wù)可以通過云端的SaaS服務(wù)進(jìn)行輸出,讓技術(shù)成果被快速下沉到產(chǎn)業(yè)場景中;用云交付的方式,落地到業(yè)務(wù)場景中去,不需要企業(yè)再不需要再投入人力去現(xiàn)場訓(xùn)練模型,就能達(dá)到彼此所需要的數(shù)據(jù)融合,進(jìn)一步降低了訓(xùn)練成本。

同時,支持海量互聯(lián)網(wǎng)用戶參與對用戶有價值的聯(lián)合建模,在個人隱私數(shù)據(jù)均不出個人終端設(shè)備的情況下,利用聯(lián)邦學(xué)習(xí),金融業(yè)務(wù)可以更快速的迭代模型,更敏捷地適應(yīng)市場變化,實(shí)現(xiàn)有價值的數(shù)據(jù)應(yīng)用,提升業(yè)務(wù)的競爭力。集成化的軟件和工具,以及服務(wù)的高復(fù)用性,讓各種類型的金融機(jī)構(gòu)不用 “重新發(fā)明輪子”,以低學(xué)習(xí)成本、高價效比的方式,就能實(shí)現(xiàn)AI聯(lián)合建模。

可以說,伴隨著產(chǎn)業(yè)智能化的繼續(xù)深化,以及聯(lián)邦學(xué)習(xí)的下沉,所產(chǎn)生的差異化優(yōu)勢也將真正顯露出來,開啟金融業(yè)的新一輪技術(shù)競技。

編織AI新生態(tài),向產(chǎn)業(yè)智能化的更遠(yuǎn)處進(jìn)發(fā)

金融領(lǐng)域是技術(shù)敏感度最高、數(shù)據(jù)監(jiān)管最嚴(yán)苛的行業(yè)之一。

由此帶來了一個新的問題:當(dāng)騰訊安全聯(lián)邦學(xué)習(xí)應(yīng)用服務(wù)開始在金融領(lǐng)域落地,未來會發(fā)生什么?

可以肯定的是,金融領(lǐng)域的AI規(guī)則必然會被改變。最直接的就是數(shù)據(jù)方將改變傳統(tǒng)上單打獨(dú)斗的思路,開始以協(xié)作、融合的姿態(tài)聯(lián)合起來推動產(chǎn)業(yè)智能化效率的提升,未來也將改變行業(yè)獲取數(shù)據(jù)、搭建AI的方式和門檻,打破行業(yè)“巨無霸”的“數(shù)據(jù)霸權(quán)”,釋放出更多的數(shù)據(jù)生產(chǎn)力。

在此基礎(chǔ)上,金融領(lǐng)域的應(yīng)用只是聯(lián)邦學(xué)習(xí)產(chǎn)業(yè)潛力的冰山一角。數(shù)據(jù)規(guī)制的嚴(yán)格化將是智能社會發(fā)展的整體趨勢,未來在零售、醫(yī)療、工業(yè)、政務(wù)等各個智慧場景中,聯(lián)邦學(xué)習(xí)都將擔(dān)負(fù)起捍衛(wèi)安全、降本增效的責(zé)任。

從這個角度講,聯(lián)邦學(xué)習(xí)如同一個操作系統(tǒng)一樣,亟待建立一個標(biāo)準(zhǔn)化、生態(tài)化的繁榮技術(shù)圈。而與大數(shù)據(jù)打交道最為頻密的騰訊生態(tài)土壤,有著舉足輕重的價值。

陳壽在《三國志》中寫過,和羹之美,在于合異。把各種不同的數(shù)據(jù)味道合在一起,騰訊安全烹制出的這道名為“聯(lián)邦學(xué)習(xí)”的菜肴,也將是技術(shù)落地節(jié)點(diǎn)中,從智能社會的地平線上生長出的饋贈。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-04-21
編織聯(lián)邦學(xué)習(xí)的產(chǎn)業(yè)路徑,騰訊向金融智能化的更遠(yuǎn)處進(jìn)發(fā)
以前企業(yè)想上馬AI,都是單打獨(dú)斗式地運(yùn)用自身數(shù)據(jù)自主訓(xùn)練,聯(lián)邦學(xué)習(xí)要將各個不同行業(yè)、領(lǐng)域的企業(yè)并入一套標(biāo)準(zhǔn)化的系統(tǒng),在一起進(jìn)行多方聯(lián)合建模。

長按掃碼 閱讀全文