從事大數(shù)據(jù)征信行業(yè),你必須知道這些

征信行業(yè)歷史起源

征信機(jī)構(gòu)始于19世紀(jì)30年代的美國。雛形是一些商業(yè)調(diào)研機(jī)構(gòu),服務(wù)民間或銀行借貸業(yè)務(wù),獲取信息途徑通過招募些調(diào)研人員去街巷走訪,然后逐漸形成規(guī)模及規(guī)范化。

作為起源之地,美國有3大征信機(jī)構(gòu)都有百年歷史,例如全國性3大個人征信機(jī)構(gòu)益博睿、艾荃法克斯、環(huán)聯(lián)。3大征信機(jī)構(gòu)數(shù)據(jù)源95%相同、覆蓋90%美國人??梢钥闯雒绹恼餍艛?shù)據(jù)覆蓋率是非常廣的。其征信服務(wù)覆蓋行業(yè)也非常多。在美國個人征信收到嚴(yán)格的監(jiān)管,監(jiān)管法律也非常健全,目前企業(yè)征信基本不受監(jiān)管。

大數(shù)據(jù)
中國征信行業(yè)歷史起源

在中國,最早的專職征信機(jī)構(gòu)是中華征信所,于1932年6月6日創(chuàng)辦。國內(nèi)征信行業(yè)快速發(fā)展基本是2003年后開始。在這一年中國人民銀行征信管理局也成立了。2017年6月個人信息安全法出臺,整個征信行業(yè)對數(shù)據(jù)的敏感性輸出做了很大調(diào)整,很多敏感信息接口都主動關(guān)停。

大數(shù)據(jù)
中國央行征信覆蓋情況

國內(nèi),央行征信數(shù)據(jù)其實只覆蓋了3.8億左右的自然人,覆蓋率非常低,還有幾億人只有簡單的身份數(shù)據(jù)。美國已達(dá)90%以上,因此在國內(nèi)單靠央行數(shù)據(jù)已經(jīng)不太符合創(chuàng)新型的互金行業(yè)信貸產(chǎn)品。從而催生了各式各樣的數(shù)據(jù)公司(包括備案的征信機(jī)構(gòu))嘗試將非央行征信的電商、社交等數(shù)據(jù)應(yīng)用于信貸風(fēng)控,例如京東白條。

大數(shù)據(jù)
中國個人征信行業(yè)查詢規(guī)模情況

無論國外還是國內(nèi),企業(yè)征信的發(fā)展都不如個人征信。從國內(nèi)央行征信查詢數(shù)據(jù)來看,2015年已達(dá)6.3億,這還只是央行體系內(nèi)的數(shù)據(jù)查詢量,可見征信行業(yè)市場可見還是非常巨大。以此類推,央行外的類征信數(shù)據(jù)市場規(guī)模應(yīng)該也是非??陀^。

大數(shù)據(jù)
中國個人征信行業(yè)備案情況

在國內(nèi)還沒有一家征信機(jī)構(gòu)獲得正式牌照。之前沸沸揚揚的8大征信機(jī)構(gòu)也只是屬于備案階段。國內(nèi)2016年底備案有134家機(jī)構(gòu),最新公布的數(shù)據(jù)其實只有133家征信機(jī)構(gòu)還在備案,經(jīng)過全面的初步調(diào)研,僅有20%不到的征信機(jī)構(gòu)是屬于有業(yè)務(wù)開展,其他的大多還在籌備和摸索階段。這些備案機(jī)構(gòu)屬于正規(guī)軍,市場上還有很多數(shù)據(jù)科技公司也在做征信業(yè)務(wù),但為了避開監(jiān)管,多打著“信貸風(fēng)控”等名號開展數(shù)據(jù)查詢的交易業(yè)務(wù)。而這些非正規(guī)軍卻非常有活力,各種創(chuàng)新的信貸模型產(chǎn)品層出不窮,具體哪些真的好用,還無法判斷。

后續(xù)將征信備案機(jī)構(gòu)及非備案機(jī)構(gòu)歸類為“大數(shù)據(jù)行業(yè)”機(jī)構(gòu)

大數(shù)據(jù)
中國征信行業(yè)數(shù)據(jù)主要類型

征信行業(yè)使用的數(shù)據(jù)主要包括傳統(tǒng)央行的征信數(shù)據(jù)及互聯(lián)網(wǎng)征信數(shù)據(jù)。

互聯(lián)網(wǎng)征信包含的數(shù)據(jù)主要涉及傳統(tǒng)央行的征信數(shù)據(jù)、經(jīng)營數(shù)據(jù),身份數(shù)據(jù)、社交數(shù)據(jù)、消費/財務(wù)數(shù)據(jù)、乃至日?;顒訑?shù)據(jù)、特定場景下的行為數(shù)據(jù)等。嚴(yán)格來說互聯(lián)網(wǎng)征信數(shù)據(jù)大多數(shù)與個人信用是弱相關(guān)的,因此才有N中關(guān)系型算法來驗證各種數(shù)據(jù)相關(guān)性來判斷個人信用可靠性。

傳統(tǒng)征信體系的征信(央行)由于體制和技術(shù)等原因使用多限于金融行業(yè),而互聯(lián)網(wǎng)金融平臺的大數(shù)據(jù)征信結(jié)果往往有在金融業(yè)外的更多應(yīng)用。

大數(shù)據(jù)
中國互聯(lián)網(wǎng)征信行業(yè)數(shù)據(jù)類型

互聯(lián)網(wǎng)征信數(shù)據(jù)使用的比較多的主要有個人身份信息(個人基本信息、教育學(xué)歷信息、駕駛證信息)、個人消費相關(guān)數(shù)據(jù)(資產(chǎn)信息、興趣愛好、電商注冊行為),銀行持卡人數(shù)據(jù)(POS交易信息、個人借貸卡賬單信息、線上線下支付數(shù)據(jù)),互聯(lián)網(wǎng)用戶及行為信息(APP瀏覽數(shù)據(jù)、WEB瀏覽數(shù)據(jù)、地理位置信息),司法被執(zhí)行信息(裁判文書信息、履約被執(zhí)行信息、失信行為信息)、借貸黑名單高風(fēng)險客戶名單(傳統(tǒng)金融、互聯(lián)網(wǎng)金融)、航旅信息(出行頻率、票務(wù)信息)、位置信息(實時位置、常用地址、出行軌跡)等。 但掌握這些信息的企業(yè)基本屬于行業(yè)內(nèi)的巨頭,例如3大運營商、京東、淘寶等。

大數(shù)據(jù)
大數(shù)據(jù)的風(fēng)控框架

基于國內(nèi)的征信行業(yè)大調(diào)研,基于大數(shù)據(jù)的風(fēng)控框架大致是這樣。一些枝節(jié)部分其實對應(yīng)了貸前中后使用到的一些大數(shù)據(jù)及大數(shù)據(jù)的來源。其中對應(yīng)不同環(huán)節(jié)使用的技術(shù)能力和數(shù)據(jù)源要求都不一樣。在P2P等高風(fēng)險行業(yè),使用多頭數(shù)據(jù)來做阻斷或獲客都可以。數(shù)據(jù)的使用不是一成不變,均要看行業(yè)、產(chǎn)品、風(fēng)險定價等靈活使用。在支付環(huán)節(jié),結(jié)合位置信息就成了反盜刷的功能。這里不一一舉例。

大數(shù)據(jù)
大數(shù)據(jù)風(fēng)控行業(yè)類型

圍繞大數(shù)據(jù)框架的整體思路發(fā)展,大數(shù)據(jù)風(fēng)控行業(yè)其實簡單來分有3種:個人/企業(yè)數(shù)據(jù)接口批發(fā)、個人/企業(yè)數(shù)據(jù)接口整合報告、個人/企業(yè)數(shù)據(jù)建模及分析系統(tǒng)。圖上均是行業(yè)內(nèi)比較知名的一些機(jī)構(gòu)。產(chǎn)品輸出方式:各類接口直接聯(lián)調(diào)調(diào)用、網(wǎng)頁版登錄查詢及管理、定制化風(fēng)控報告、聯(lián)合建模。

大數(shù)據(jù)
個人征信模型通用簡版思路

最后說下非全自動的個人征信模型簡版思路:首先需要接入各種各樣的數(shù)據(jù)源,這些數(shù)據(jù)源需要與業(yè)務(wù)需求符合,其次將各類裸數(shù)據(jù)拆分,根據(jù)業(yè)務(wù)類型及其他規(guī)則進(jìn)行特征提取,初步分類。然后,各類特征將根據(jù)不同算法逐一組合成對應(yīng)模型,應(yīng)用與不同業(yè)務(wù)場景。不同模型經(jīng)過機(jī)器學(xué)習(xí)(監(jiān)督學(xué)習(xí)及無監(jiān)督學(xué)習(xí))的方式,輸出相應(yīng)分值,給與各模型相應(yīng)的參考。最好還需要有經(jīng)驗人士,根據(jù)得分進(jìn)行最后的決策。

大數(shù)據(jù)
補充

銀行機(jī)構(gòu)等大型企業(yè)的信貸產(chǎn)品多以央行征信數(shù)據(jù)為主,非央行的大數(shù)據(jù)為輔。而消費金融及P2P等機(jī)構(gòu),因為面對的客戶群、產(chǎn)品及風(fēng)險等原因,多以非央行大數(shù)據(jù)為主,基本不使用央行數(shù)據(jù)。國內(nèi)征信行業(yè)合作伙伴默認(rèn)征信系統(tǒng)有2套:央行征信系統(tǒng)和民間借貸征信系統(tǒng)。正常情況,銀行基本都接入了央行征信,因此銀行類客戶對自身信用記錄非常在意。但互金行業(yè)基本沒進(jìn)央行征信系統(tǒng),而是聯(lián)合成立了民間征信平臺。在民間借貸征信系統(tǒng)里,其實也會影響其借貸行為。特別是現(xiàn)在銀行的信貸產(chǎn)品及信用卡都開始使用多頭借貸這些數(shù)據(jù)輔助很多小貸公司卻只給多頭借貸名單上有還款能力的客戶借款

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-10-20
從事大數(shù)據(jù)征信行業(yè),你必須知道這些
征信行業(yè)歷史起源 征信機(jī)構(gòu)始于19世紀(jì)30年代的美國。雛形是一些商業(yè)調(diào)研機(jī)構(gòu),服務(wù)民間或銀行借貸業(yè)務(wù),獲取信息途徑通過招募些調(diào)研人員去街巷走訪,然后逐漸形成規(guī)

長按掃碼 閱讀全文