知因智慧CEO任亮:利用AI來發(fā)現(xiàn)金融領(lǐng)域里面的規(guī)律

2018年,商業(yè)創(chuàng)新邁進新的階段,商業(yè)創(chuàng)新在業(yè)務(wù)飛速發(fā)展的同時,伴隨而來的也有風口大熱背后的認知沉淀與實踐積累。7月10日36氪聯(lián)合《零售老板內(nèi)參》舉辦的2018商業(yè)新生態(tài)峰會在北京舉行。本屆峰會以“質(zhì)”為主題,希望新的時代浪潮下新商業(yè)企業(yè)可以看清商業(yè)本質(zhì),最終完成新商業(yè)的革新與升級。

隨著產(chǎn)融結(jié)合的進一步發(fā)展,金融尤其是銀行方面風控越來越被重視。

在今日舉行的“2018年商業(yè)新生態(tài)峰會”上,知因智慧CEO任亮為我們講述了如何通過AI連接金融產(chǎn)業(yè),如何利用AI來發(fā)現(xiàn)金融領(lǐng)域里面的規(guī)律。

任亮表示,必須創(chuàng)造性地利用大數(shù)據(jù)和AI,幫助我們?nèi)ジ玫倪€原整個經(jīng)濟世界,更好的分析經(jīng)濟世界的風險和價值。

知因智慧CEO任亮:利用AI來發(fā)現(xiàn)金融領(lǐng)域里面的規(guī)律

以下為任亮發(fā)言全文:

大家好,我是知因智慧的CEO任亮。很多人都說知因智慧的名字起得好,知其原因從而智慧,其實我在起這個名字的時候,真正的本意是知識基因或者叫智慧基因。我認為整個世界由兩種基因構(gòu)成,一種是推動物種進化的生命基因,一種是推動人文世界與經(jīng)濟世界發(fā)展的知識基因,我希望通過AI發(fā)現(xiàn)知識基因從而獲得智慧。我自己從事金融行業(yè),所以我們希望立足AI,去發(fā)現(xiàn)金融領(lǐng)域里的規(guī)律,獲得知識基因,從而建立起產(chǎn)業(yè)的橋梁。

中美的貿(mào)易戰(zhàn)已經(jīng)開打了,所以下半年到明年我們會有很多企業(yè)受到影響,國家也在做七千億的定項降準,這些錢如何流向?qū)嶓w產(chǎn)業(yè)和實體經(jīng)濟?我們認為最優(yōu)解是通過產(chǎn)融知識圖譜來解決當前的問題,所以今天我來跟大家分享一下如何通過AI連接金融產(chǎn)業(yè),如何通過知識圖譜去發(fā)現(xiàn)他們的規(guī)律。

我們先從世界杯談起,足球界里有一套非常熱門的戰(zhàn)術(shù),叫Tiki-Taka,梅西在這套戰(zhàn)術(shù)中如魚得水。它強調(diào)隊友間的協(xié)同配合,避免單人作戰(zhàn),靠隊友之間的區(qū)域跑位來創(chuàng)造空隙,從而贏得射門機會。

我們可以看到梅西在俱樂部踢球時,他的對手并不敢包夾他,因為周圍的隊友協(xié)同點很多,但是梅西在國家隊時,戰(zhàn)術(shù)施行的不那么完善,所以他常常會陷入重圍,孤軍奮戰(zhàn),于是我們可以得到一個結(jié)論:單點打不過網(wǎng)絡(luò),明星打不過系統(tǒng)。

如果做一個比方的話,我們談知識圖譜,可以說是我們人工智能領(lǐng)域里面的網(wǎng)絡(luò),因為它本質(zhì)上就是一個語義網(wǎng)絡(luò),通過實體和關(guān)系的聚合建立網(wǎng)絡(luò),這個實體就是經(jīng)濟世界里面不同的對象、人和企業(yè)。同時它也是一套系統(tǒng),因為它沒有一個明確的邊界,他可以把我們所看到的各種人工智能領(lǐng)域的方法和技術(shù)融合在里面,所以它非常強大。

去年有一篇文章叫做《為什么知識圖譜終于火了》,探索了這么多年,大家可能發(fā)現(xiàn)在AI和金融這種需要高度專業(yè)知識的領(lǐng)域在落地的時候,知識圖譜或許是一條最佳路徑。我們來看一下整個智能技術(shù)發(fā)展的四個階段,早期是專家系統(tǒng),通過人來判斷,之后是BI商業(yè)智能,一直到感知智能。今天我們談大數(shù)據(jù),人臉識別,圖像、語音、文本等這些數(shù)據(jù)已經(jīng)進入到我們的模型里,去幫助金融機構(gòu)進行判斷。再往后是認知智能,也就是人工智能建立起來的很多標簽畫像,通過識別個人,識別企業(yè)去判斷它的信用。但是我覺得更重要的是現(xiàn)在萬物互聯(lián),人在互聯(lián),經(jīng)濟也在互聯(lián),所以在一個互聯(lián)的世界里面需要通過關(guān)系來去分析這個個體,我們不能僅用個人或者企業(yè)自己的數(shù)據(jù)分析它,而是要把它還原到網(wǎng)絡(luò)里,用網(wǎng)絡(luò)眼睛還原個體,于是知識圖譜就成為了一項核心技術(shù)。今天我們談產(chǎn)融知識圖譜,核心的要義在于要把產(chǎn)業(yè)世界的一個關(guān)系體系建立起來,那么這個世界里面最核心的實體是什么?是企業(yè),圍繞企業(yè)建立起企業(yè)與消費者,以及企業(yè)與員工,企業(yè)與企業(yè)之間的關(guān)系,比如投資鏈、擔保鏈、貿(mào)易鏈、供應(yīng)鏈,通過這個企業(yè)建立起它跟上下游、行業(yè)、地域的關(guān)系,這三個層次的關(guān)系綜合在一起叫做產(chǎn)業(yè),通過大數(shù)據(jù)描述這個產(chǎn)業(yè)的實體和他們連接的類型,通過機器學習去提煉,這些實體和關(guān)系之間的規(guī)律和規(guī)則,所以我們把這三者融合在一起叫做產(chǎn)融知識圖譜。

我們舉幾個例子來看一下產(chǎn)融知識圖譜的表現(xiàn)形態(tài),其實都是我們?nèi)粘I钪虚g最容易理解的這些,比如說客戶、控制關(guān)系、擔保關(guān)系、資金關(guān)系等等,這些都是我們在股權(quán)方面的具體表現(xiàn),包括供應(yīng)鏈里面的上游、中游、下游原料商、批發(fā)商、生產(chǎn)商,這些不同的實體中間有不同的經(jīng)濟往來,這就是關(guān)系,這就是一個典型的知識圖譜的例子。

更大范圍的是產(chǎn)業(yè)鏈,一個產(chǎn)業(yè)通過他的上游和下游會建立起他們之間的經(jīng)濟依存關(guān)系,不管是新能源汽車還是房地產(chǎn),它的原料和上下游,都是我們收集數(shù)據(jù)來構(gòu)建網(wǎng)絡(luò)的目標和對象,在金融行業(yè)不管你分析的是to C還是to B都是產(chǎn)業(yè)里的一個環(huán)節(jié),都是一個實體。

現(xiàn)在一個難點是小微,小微獲取成本非常高,而且風險非常大,怎么辦?我們把小微企業(yè)聚集起來變成一個商圈,變成一個專業(yè)市場,這樣獲取對象會更容易獲取一些數(shù)據(jù),這些手段都是方便我們把原來孤立的個體放在網(wǎng)絡(luò)里,更好的分析它。比如押品估值,房產(chǎn)本身價格在波動,而且價格變動是很多要素決定的,比如他周邊的人口,經(jīng)濟變化,城市發(fā)展的策略等等。所以通過這些要素能去預測它的房價,房價的變動會影響我們金融里面的抵押品價值波動,這個會影響客戶的信用,會影響用戶所在群體的價值。我們從整個鏈條里面可以看到,這個經(jīng)濟世界是互聯(lián)的,我們的大數(shù)據(jù)和AI就是要試圖建立起這樣一個網(wǎng)絡(luò),幫我們更好的還原整個經(jīng)濟世界,去分析他的風險和價值。

在產(chǎn)融知識圖譜的框架之下,我們必須要創(chuàng)造性的利用AI技術(shù),幫助我們?nèi)フ嬲斫馑麄兊囊?guī)律,這些技術(shù)我們稍微總結(jié)一下,其實涵蓋了整個產(chǎn)融圖譜構(gòu)建的全過程,包括了大數(shù)據(jù)和AI算法。

比如我們需要有領(lǐng)域知識的輸入,因為我們做金融,金融一定有很多的領(lǐng)域知識,我們在判斷一個企業(yè)和個人的時候,需要一個體系來判斷,這些都是領(lǐng)域知識圖譜。通過圖計算,相關(guān)的各種算法去總結(jié)網(wǎng)絡(luò)里面它們的特征。圖譜構(gòu)建完以后需要大數(shù)據(jù)來填補他們的關(guān)系去進行量化,除了我們最容易理解的結(jié)構(gòu)化數(shù)據(jù),BI技術(shù)之外,現(xiàn)在更重要的是需要把非結(jié)構(gòu)化的數(shù)據(jù)也融合進來,前面有好幾位嘉賓談到了圖像識別,這是非結(jié)構(gòu)化數(shù)據(jù)的渠道,還有很多文本,特別像我們知因智慧著重在語義識別和文本識別上面,把非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化,從而進入到模型里,量化之后我們?nèi)プ鲱A測。過去我們一直用概率統(tǒng)計模型,現(xiàn)在這個條件下僅用概率不夠,我們需要做大范圍的推理,需要去做量化和預測,然后把它運用到金融場景,去做金融事件的提煉,風險特征的發(fā)現(xiàn),去做傳導等等。

接下來我們來看,在剛才提到的體系下,金融場景是怎么影射的?其實我們最早的金融評估就是打分卡,對應(yīng)的是我們的專家系統(tǒng),后來引入西方的巴塞爾協(xié)議做內(nèi)部評級法,這個就是我們的BI商用制度,現(xiàn)在通過萬物互聯(lián)和知識圖譜獲得模型,對應(yīng)的就是認知時代,所以金融和AI高度相關(guān)。

縱觀這段發(fā)展歷程,金融方面我們其實一直在學習西方,同時也落后于西方,但是從產(chǎn)業(yè)知識圖譜這個角度來看,中國反倒走在前列,為什么呢?因為我們有自己的現(xiàn)實問題,也有自己的獨特條件,我們面對的現(xiàn)實問題是中國的企業(yè)關(guān)系網(wǎng)絡(luò)高度復雜,而且風險頻發(fā),比如說十年前德隆系風險事件發(fā)生后造成了連鎖性風險蔓延,所以這是我們面對的問題。另外我們中國的數(shù)據(jù)又比較集中,因為我們有強勢的政府和監(jiān)管,政府會收集大量的跨領(lǐng)域的數(shù)據(jù),這為我們建模型創(chuàng)造了條件。其實我們早在十年前,2006年的時候就已經(jīng)通過監(jiān)管的牽頭和驅(qū)動,在從事相關(guān)領(lǐng)域的研發(fā)和推進,當時我也非常有幸參與了整個過程。從風險集團事件的發(fā)現(xiàn)演進到2009年我們把這套體系和模型推廣到商業(yè)銀行的機構(gòu),開始做商業(yè)化的實踐,并且在學術(shù)上我們第一次提出了一套基于關(guān)系網(wǎng)絡(luò)和行為角度去建模的方法,而不再局限于傳統(tǒng)的基于財物報表和評價的方法來去預測風險。

知因智慧CEO任亮:利用AI來發(fā)現(xiàn)金融領(lǐng)域里面的規(guī)律

2009年再往后,我本人在中科院一直從事相關(guān)算法方面的研究,后來去IBM做金融大數(shù)據(jù)方面的探索,一直到2016正式創(chuàng)立知因智慧,我們數(shù)據(jù)產(chǎn)業(yè)的成熟,我們金融客戶需求的爆發(fā)也推動我們做了很多標桿性金融事件,這些事件代表了我們產(chǎn)融知識圖譜的方向,它所能解決的問題,的確可以跳脫傳統(tǒng)的限制,在風險管理,精準商機的發(fā)現(xiàn)上取得更好的效果。

接下來我們看一下金融場景該如何應(yīng)用產(chǎn)融知識圖譜,在這個體系之下,最底層是3K平臺,KW、KE、KG,這是知識圖譜的三個核心組建。KE解決的是知識的進化過程,是包含AI算法的建模平臺;KG是知識可視化平臺;KW是核心的知識倉儲,我們一直在采集大數(shù)據(jù),但這些數(shù)據(jù)如何能夠變成我們場景所需要的核心體系,在這里面我們叫知識倉儲。舉一個例子,比如說這里有實體庫、關(guān)系庫、標簽庫、事件庫、語料庫等等。我們以前識別一個人或者企業(yè)的時候需要分析它的ID,但如果沒有ID該怎么辦,怎么判斷它是同一個企業(yè)?比如說IBM,IBM是一個簡稱,2016年大裁員是一個風險事件,而我們銀行記錄的是國際商業(yè)技術(shù)有限公司,這是一個全稱,這兩個詞不匹配就不能納入模型變量里,實體庫就是解決這個問題。很多這樣的內(nèi)容我們把它打包在一起叫做知識倉儲,通過這些支撐來建立客戶譜系,我們把原來那些孤立的個體變成一個網(wǎng)絡(luò),包括產(chǎn)業(yè)譜系,客戶譜系還有它的畫像以及事件,原來我們看風險輿情,是客戶經(jīng)理自己去辨別,現(xiàn)在我們用機器能夠讀懂輿情,能夠把輿情納入到風險變量里,整個體系我們稱之為AI盒子,通過AI盒子我們把這些工作整合在一起,賦能給公司金融、小微金融、風險管理、大資管、大零售等具體場景。

接下來我們通過一個個組件來理解一下整個產(chǎn)融知識圖譜的實現(xiàn)過程。比如說譜系,譜系是圖譜中的核心組件,通過它我們可以描繪它的股權(quán)關(guān)系,也可以描繪它的產(chǎn)業(yè)關(guān)系,這樣我們才能完成把個體還原到網(wǎng)絡(luò)里的第一個步驟。接下來我們要去計算它們的傳導,他們的影響,在這個網(wǎng)絡(luò)里面當一個點發(fā)生問題的時候,它對關(guān)聯(lián)的點和其他的點都有什么樣的影響,那么我們必須要去收集金融事件,并量化事件,必須要測算出傳導路徑,這就是我們的作用。譜系+事件這是我們整個K+盒子里面的核心內(nèi)容。

舉一些實例,一家股份制銀行,通過圖譜他能夠建立企業(yè)客戶的商機,精準商機的發(fā)現(xiàn)、準入和風險傳達。那么通過小微金融,原來的數(shù)據(jù)獲取可能只是一些片段零散的數(shù)據(jù),我們通過譜系,通過小微個體經(jīng)營行為的數(shù)據(jù)融合,我們?nèi)ミM行整個線上評估體系的建立。另一個例子,我們?yōu)橐患译娚探鹑谄髽I(yè)做供應(yīng)鏈預測,供應(yīng)鏈里供貨商未來增長的變化,它未來增長的精準預測。同樣我們也需要構(gòu)建一個知識圖譜,把供貨商跟他的產(chǎn)品還有消費人群這三者建立起關(guān)聯(lián),消費群體的變化和商品結(jié)構(gòu)的變化一定會影響供貨商以及其未來銷量。

風險管理,原來我們都在基于每一個個體收集數(shù)據(jù)預測,現(xiàn)在我們把他在的網(wǎng)絡(luò)建立起來,在網(wǎng)絡(luò)里當一個節(jié)點發(fā)生風險的時候,我們把他所影響的范圍測算出來,這里的核心在于我們連接權(quán)重參數(shù)的訓練。所以當整個供應(yīng)鏈,產(chǎn)業(yè)鏈建立起來后,我們就知道上游的一個風險發(fā)生后會對下游造成什么樣的蔓延和沖擊。

包括資管,這里面PE、VC產(chǎn)業(yè)鏈,通過特殊實體的構(gòu)建,我們能夠找出來一批發(fā)展非??焖俣乙卜浅;钴S的PE企業(yè),從而為金融機構(gòu)提供聯(lián)動或者定制化的金融產(chǎn)品。整個體系里面包括一些核心技術(shù),在這里面可以大家做一個羅列。剛才談到的這些場景,在國內(nèi)的一些標桿型金融機構(gòu),包括國有銀行,股份制銀行,金控,互金,都得到過驗證。

最后一點,我們把剛才提到的內(nèi)容變成了一個一體化的K-BOX,這個BOX把我們的算法、數(shù)據(jù)、云計算,融合成了知識圖譜,去輸送給金融機構(gòu),為它賦能,為它解決行業(yè)里面的痛點和問題。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-07-12
知因智慧CEO任亮:利用AI來發(fā)現(xiàn)金融領(lǐng)域里面的規(guī)律
2018年,商業(yè)創(chuàng)新邁進新的階段,商業(yè)創(chuàng)新在業(yè)務(wù)飛速發(fā)展的同時,伴隨而來的也有風口大熱背后的認知沉淀與實踐積累。

長按掃碼 閱讀全文