知因智慧CEO任亮:利用AI來發(fā)現金融領域里面的規(guī)律

2018年,商業(yè)創(chuàng)新邁進新的階段,商業(yè)創(chuàng)新在業(yè)務飛速發(fā)展的同時,伴隨而來的也有風口大熱背后的認知沉淀與實踐積累。7月10日36氪聯(lián)合《零售老板內參》舉辦的2018商業(yè)新生態(tài)峰會在北京舉行。本屆峰會以“質”為主題,希望新的時代浪潮下新商業(yè)企業(yè)可以看清商業(yè)本質,最終完成新商業(yè)的革新與升級。

隨著產融結合的進一步發(fā)展,金融尤其是銀行方面風控越來越被重視。

在今日舉行的“2018年商業(yè)新生態(tài)峰會”上,知因智慧CEO任亮為我們講述了如何通過AI連接金融產業(yè),如何利用AI來發(fā)現金融領域里面的規(guī)律。

任亮表示,必須創(chuàng)造性地利用大數據和AI,幫助我們去更好的還原整個經濟世界,更好的分析經濟世界的風險和價值。

知因智慧CEO任亮:利用AI來發(fā)現金融領域里面的規(guī)律

以下為任亮發(fā)言全文:

大家好,我是知因智慧的CEO任亮。很多人都說知因智慧的名字起得好,知其原因從而智慧,其實我在起這個名字的時候,真正的本意是知識基因或者叫智慧基因。我認為整個世界由兩種基因構成,一種是推動物種進化的生命基因,一種是推動人文世界與經濟世界發(fā)展的知識基因,我希望通過AI發(fā)現知識基因從而獲得智慧。我自己從事金融行業(yè),所以我們希望立足AI,去發(fā)現金融領域里的規(guī)律,獲得知識基因,從而建立起產業(yè)的橋梁。

中美的貿易戰(zhàn)已經開打了,所以下半年到明年我們會有很多企業(yè)受到影響,國家也在做七千億的定項降準,這些錢如何流向實體產業(yè)和實體經濟?我們認為最優(yōu)解是通過產融知識圖譜來解決當前的問題,所以今天我來跟大家分享一下如何通過AI連接金融產業(yè),如何通過知識圖譜去發(fā)現他們的規(guī)律。

我們先從世界杯談起,足球界里有一套非常熱門的戰(zhàn)術,叫Tiki-Taka,梅西在這套戰(zhàn)術中如魚得水。它強調隊友間的協(xié)同配合,避免單人作戰(zhàn),靠隊友之間的區(qū)域跑位來創(chuàng)造空隙,從而贏得射門機會。

我們可以看到梅西在俱樂部踢球時,他的對手并不敢包夾他,因為周圍的隊友協(xié)同點很多,但是梅西在國家隊時,戰(zhàn)術施行的不那么完善,所以他常常會陷入重圍,孤軍奮戰(zhàn),于是我們可以得到一個結論:單點打不過網絡,明星打不過系統(tǒng)。

如果做一個比方的話,我們談知識圖譜,可以說是我們人工智能領域里面的網絡,因為它本質上就是一個語義網絡,通過實體和關系的聚合建立網絡,這個實體就是經濟世界里面不同的對象、人和企業(yè)。同時它也是一套系統(tǒng),因為它沒有一個明確的邊界,他可以把我們所看到的各種人工智能領域的方法和技術融合在里面,所以它非常強大。

去年有一篇文章叫做《為什么知識圖譜終于火了》,探索了這么多年,大家可能發(fā)現在AI和金融這種需要高度專業(yè)知識的領域在落地的時候,知識圖譜或許是一條最佳路徑。我們來看一下整個智能技術發(fā)展的四個階段,早期是專家系統(tǒng),通過人來判斷,之后是BI商業(yè)智能,一直到感知智能。今天我們談大數據,人臉識別,圖像、語音、文本等這些數據已經進入到我們的模型里,去幫助金融機構進行判斷。再往后是認知智能,也就是人工智能建立起來的很多標簽畫像,通過識別個人,識別企業(yè)去判斷它的信用。但是我覺得更重要的是現在萬物互聯(lián),人在互聯(lián),經濟也在互聯(lián),所以在一個互聯(lián)的世界里面需要通過關系來去分析這個個體,我們不能僅用個人或者企業(yè)自己的數據分析它,而是要把它還原到網絡里,用網絡眼睛還原個體,于是知識圖譜就成為了一項核心技術。今天我們談產融知識圖譜,核心的要義在于要把產業(yè)世界的一個關系體系建立起來,那么這個世界里面最核心的實體是什么?是企業(yè),圍繞企業(yè)建立起企業(yè)與消費者,以及企業(yè)與員工,企業(yè)與企業(yè)之間的關系,比如投資鏈、擔保鏈、貿易鏈、供應鏈,通過這個企業(yè)建立起它跟上下游、行業(yè)、地域的關系,這三個層次的關系綜合在一起叫做產業(yè),通過大數據描述這個產業(yè)的實體和他們連接的類型,通過機器學習去提煉,這些實體和關系之間的規(guī)律和規(guī)則,所以我們把這三者融合在一起叫做產融知識圖譜。

我們舉幾個例子來看一下產融知識圖譜的表現形態(tài),其實都是我們日常生活中間最容易理解的這些,比如說客戶、控制關系、擔保關系、資金關系等等,這些都是我們在股權方面的具體表現,包括供應鏈里面的上游、中游、下游原料商、批發(fā)商、生產商,這些不同的實體中間有不同的經濟往來,這就是關系,這就是一個典型的知識圖譜的例子。

更大范圍的是產業(yè)鏈,一個產業(yè)通過他的上游和下游會建立起他們之間的經濟依存關系,不管是新能源汽車還是房地產,它的原料和上下游,都是我們收集數據來構建網絡的目標和對象,在金融行業(yè)不管你分析的是to C還是to B都是產業(yè)里的一個環(huán)節(jié),都是一個實體。

現在一個難點是小微,小微獲取成本非常高,而且風險非常大,怎么辦?我們把小微企業(yè)聚集起來變成一個商圈,變成一個專業(yè)市場,這樣獲取對象會更容易獲取一些數據,這些手段都是方便我們把原來孤立的個體放在網絡里,更好的分析它。比如押品估值,房產本身價格在波動,而且價格變動是很多要素決定的,比如他周邊的人口,經濟變化,城市發(fā)展的策略等等。所以通過這些要素能去預測它的房價,房價的變動會影響我們金融里面的抵押品價值波動,這個會影響客戶的信用,會影響用戶所在群體的價值。我們從整個鏈條里面可以看到,這個經濟世界是互聯(lián)的,我們的大數據和AI就是要試圖建立起這樣一個網絡,幫我們更好的還原整個經濟世界,去分析他的風險和價值。

在產融知識圖譜的框架之下,我們必須要創(chuàng)造性的利用AI技術,幫助我們去真正理解他們的規(guī)律,這些技術我們稍微總結一下,其實涵蓋了整個產融圖譜構建的全過程,包括了大數據和AI算法。

比如我們需要有領域知識的輸入,因為我們做金融,金融一定有很多的領域知識,我們在判斷一個企業(yè)和個人的時候,需要一個體系來判斷,這些都是領域知識圖譜。通過圖計算,相關的各種算法去總結網絡里面它們的特征。圖譜構建完以后需要大數據來填補他們的關系去進行量化,除了我們最容易理解的結構化數據,BI技術之外,現在更重要的是需要把非結構化的數據也融合進來,前面有好幾位嘉賓談到了圖像識別,這是非結構化數據的渠道,還有很多文本,特別像我們知因智慧著重在語義識別和文本識別上面,把非結構化的數據結構化,從而進入到模型里,量化之后我們去做預測。過去我們一直用概率統(tǒng)計模型,現在這個條件下僅用概率不夠,我們需要做大范圍的推理,需要去做量化和預測,然后把它運用到金融場景,去做金融事件的提煉,風險特征的發(fā)現,去做傳導等等。

接下來我們來看,在剛才提到的體系下,金融場景是怎么影射的?其實我們最早的金融評估就是打分卡,對應的是我們的專家系統(tǒng),后來引入西方的巴塞爾協(xié)議做內部評級法,這個就是我們的BI商用制度,現在通過萬物互聯(lián)和知識圖譜獲得模型,對應的就是認知時代,所以金融和AI高度相關。

縱觀這段發(fā)展歷程,金融方面我們其實一直在學習西方,同時也落后于西方,但是從產業(yè)知識圖譜這個角度來看,中國反倒走在前列,為什么呢?因為我們有自己的現實問題,也有自己的獨特條件,我們面對的現實問題是中國的企業(yè)關系網絡高度復雜,而且風險頻發(fā),比如說十年前德隆系風險事件發(fā)生后造成了連鎖性風險蔓延,所以這是我們面對的問題。另外我們中國的數據又比較集中,因為我們有強勢的政府和監(jiān)管,政府會收集大量的跨領域的數據,這為我們建模型創(chuàng)造了條件。其實我們早在十年前,2006年的時候就已經通過監(jiān)管的牽頭和驅動,在從事相關領域的研發(fā)和推進,當時我也非常有幸參與了整個過程。從風險集團事件的發(fā)現演進到2009年我們把這套體系和模型推廣到商業(yè)銀行的機構,開始做商業(yè)化的實踐,并且在學術上我們第一次提出了一套基于關系網絡和行為角度去建模的方法,而不再局限于傳統(tǒng)的基于財物報表和評價的方法來去預測風險。

知因智慧CEO任亮:利用AI來發(fā)現金融領域里面的規(guī)律

2009年再往后,我本人在中科院一直從事相關算法方面的研究,后來去IBM做金融大數據方面的探索,一直到2016正式創(chuàng)立知因智慧,我們數據產業(yè)的成熟,我們金融客戶需求的爆發(fā)也推動我們做了很多標桿性金融事件,這些事件代表了我們產融知識圖譜的方向,它所能解決的問題,的確可以跳脫傳統(tǒng)的限制,在風險管理,精準商機的發(fā)現上取得更好的效果。

接下來我們看一下金融場景該如何應用產融知識圖譜,在這個體系之下,最底層是3K平臺,KW、KE、KG,這是知識圖譜的三個核心組建。KE解決的是知識的進化過程,是包含AI算法的建模平臺;KG是知識可視化平臺;KW是核心的知識倉儲,我們一直在采集大數據,但這些數據如何能夠變成我們場景所需要的核心體系,在這里面我們叫知識倉儲。舉一個例子,比如說這里有實體庫、關系庫、標簽庫、事件庫、語料庫等等。我們以前識別一個人或者企業(yè)的時候需要分析它的ID,但如果沒有ID該怎么辦,怎么判斷它是同一個企業(yè)?比如說IBM,IBM是一個簡稱,2016年大裁員是一個風險事件,而我們銀行記錄的是國際商業(yè)技術有限公司,這是一個全稱,這兩個詞不匹配就不能納入模型變量里,實體庫就是解決這個問題。很多這樣的內容我們把它打包在一起叫做知識倉儲,通過這些支撐來建立客戶譜系,我們把原來那些孤立的個體變成一個網絡,包括產業(yè)譜系,客戶譜系還有它的畫像以及事件,原來我們看風險輿情,是客戶經理自己去辨別,現在我們用機器能夠讀懂輿情,能夠把輿情納入到風險變量里,整個體系我們稱之為AI盒子,通過AI盒子我們把這些工作整合在一起,賦能給公司金融、小微金融、風險管理、大資管、大零售等具體場景。

接下來我們通過一個個組件來理解一下整個產融知識圖譜的實現過程。比如說譜系,譜系是圖譜中的核心組件,通過它我們可以描繪它的股權關系,也可以描繪它的產業(yè)關系,這樣我們才能完成把個體還原到網絡里的第一個步驟。接下來我們要去計算它們的傳導,他們的影響,在這個網絡里面當一個點發(fā)生問題的時候,它對關聯(lián)的點和其他的點都有什么樣的影響,那么我們必須要去收集金融事件,并量化事件,必須要測算出傳導路徑,這就是我們的作用。譜系+事件這是我們整個K+盒子里面的核心內容。

舉一些實例,一家股份制銀行,通過圖譜他能夠建立企業(yè)客戶的商機,精準商機的發(fā)現、準入和風險傳達。那么通過小微金融,原來的數據獲取可能只是一些片段零散的數據,我們通過譜系,通過小微個體經營行為的數據融合,我們去進行整個線上評估體系的建立。另一個例子,我們?yōu)橐患译娚探鹑谄髽I(yè)做供應鏈預測,供應鏈里供貨商未來增長的變化,它未來增長的精準預測。同樣我們也需要構建一個知識圖譜,把供貨商跟他的產品還有消費人群這三者建立起關聯(lián),消費群體的變化和商品結構的變化一定會影響供貨商以及其未來銷量。

風險管理,原來我們都在基于每一個個體收集數據預測,現在我們把他在的網絡建立起來,在網絡里當一個節(jié)點發(fā)生風險的時候,我們把他所影響的范圍測算出來,這里的核心在于我們連接權重參數的訓練。所以當整個供應鏈,產業(yè)鏈建立起來后,我們就知道上游的一個風險發(fā)生后會對下游造成什么樣的蔓延和沖擊。

包括資管,這里面PE、VC產業(yè)鏈,通過特殊實體的構建,我們能夠找出來一批發(fā)展非??焖俣乙卜浅;钴S的PE企業(yè),從而為金融機構提供聯(lián)動或者定制化的金融產品。整個體系里面包括一些核心技術,在這里面可以大家做一個羅列。剛才談到的這些場景,在國內的一些標桿型金融機構,包括國有銀行,股份制銀行,金控,互金,都得到過驗證。

最后一點,我們把剛才提到的內容變成了一個一體化的K-BOX,這個BOX把我們的算法、數據、云計算,融合成了知識圖譜,去輸送給金融機構,為它賦能,為它解決行業(yè)里面的痛點和問題。

極客網企業(yè)會員

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-07-12
知因智慧CEO任亮:利用AI來發(fā)現金融領域里面的規(guī)律
2018年,商業(yè)創(chuàng)新邁進新的階段,商業(yè)創(chuàng)新在業(yè)務飛速發(fā)展的同時,伴隨而來的也有風口大熱背后的認知沉淀與實踐積累。

長按掃碼 閱讀全文