信也科技論文榮獲WWW國際頂級學術會議FinWeb研討會最佳論文

近日,信也科技(NYSE:FINV)學術領域再創(chuàng)佳績,由人工智能團隊幾位專家聯(lián)合撰寫的題為《Financial Fraud Detection on Micro-credit Loan Scenario via Fuller Location Information Embedding》的學術論文,被評為The International World Wide Web Conference - WWW2021(以下簡稱“WWW2021”)中FinWeb研討會的最佳論文,這也是信也科技首次作為第一作者撰寫論文入選頂級國際會議并獲得“最佳論文”榮譽。

與此同時,信也科技也受邀成為該會議的首家中國贊助支持伙伴,與Microsoft、Amazon、Facebook、Google 等世界知名互聯(lián)網(wǎng)高科技企業(yè)一同為該會議的發(fā)展提供支持,并在會上共同分享、探討未來互聯(lián)網(wǎng)發(fā)展趨勢。

全新的嵌入式網(wǎng)絡算法助力解決“金融欺詐”痛點

此次會議中,信也科技投遞了名為《Financial Fraud Detection on Micro-credit Loan Scenario via Fuller Location Information Embedding》的論文。據(jù)悉,該論文在組委會國內(nèi)外知名學者專家的匿名評審后獲得高度認可,并將在WWW會議上的金融科技主題討論會進行專場分享。

論文探討了金融科技領域非常重要的話題——“金融欺詐檢測”,它不僅是風險控制引擎的關鍵功能之一,也為利率定價政策提供了最有力的保證,是助力個人借款業(yè)務健康發(fā)展的重要工具之一。

當傳統(tǒng)金融欺詐檢測手段無法滿足金融科技的檢測需求時,本論文中提出了一種以“互聯(lián)網(wǎng)”的方法去解決問題的新思路,以數(shù)據(jù)驅動的算法作為金融欺詐檢測的主要工具。

論文重點討論了新思路將如何融合表示用戶數(shù)據(jù),如何證明其有效性,以及如何用在具體的業(yè)務模型中:從用戶相關的位置信息(比如線下用戶提交申請的地點、身份證上的地址等)和相關數(shù)據(jù)中抽取相應的特征(例如客戶行為、經(jīng)濟及社會相關的數(shù)據(jù)),構建地理位置的一個嵌入表示,并以此預測客戶在未來一段時間內(nèi)是否存在逾期的可能。論文設計和探索了與位置(地址)相關的新信息,這些信息被證實是金融欺詐檢測的重要因素之一(如圖1)。

信也科技論文榮獲WWW國際頂級學術會議FinWeb研討會最佳論文

圖一:地址和房價信息對逾期的影響

論文論證了位置坐標和房價量化分析位置信息與欺詐行為之間的關系。然而在實際工作中,很少有人關注這些信息。這其中通常存在著利用位置信息的三大挑戰(zhàn):(1)數(shù)據(jù)稀疏性使金融欺詐檢測模型難以充分學習到位置信息與欺詐行為之間的關系;(2)僅考慮位置信息而不具有居民個性的金融欺詐檢測模型時,欺詐識別位置信息的能力被大大削弱;(3)位置信息的表示需要是有效且易于使用的,以便在下游任務中使用。

論文的一大貢獻是提出了一種基于自動編碼器的位置信息嵌入網(wǎng)絡FLIE,它可克服上述挑戰(zhàn),將理論應用在實踐中。與原來的位置信息(用位置坐標表示)相比,FLIE不僅包含原坐標信息,還引入了位置坐標的其他屬性,即社區(qū)坐標和社區(qū)信息。此外,FLIE還考慮了客戶的個性及行為數(shù)據(jù),以增加客戶區(qū)分度。因此,FLIE的信息量比原始位置信息更為豐富(如圖2所示)。

信也科技論文榮獲WWW國際頂級學術會議FinWeb研討會最佳論文

圖二:地址embedding FLIE的整體架構(圖(a) 四類信息作為FLIE的輸入,及embedding的模塊化結果,圖(b) encoding部分的結構)

為了更好的應對挑戰(zhàn),解決數(shù)據(jù)稀疏問題,FLIE進行了自監(jiān)督學習。相對于監(jiān)督學習,自監(jiān)督學習是從極不平衡數(shù)據(jù)中學習信息的更好選擇。同時,FLIE還將客戶個性引入到位置信息嵌入中,克服個體差異,增強位置信息嵌入的欺詐識別能力。我們的應用程序收集了豐富的經(jīng)過授權的客戶行為,這些信息隱含了客戶的自然和社會屬性,因此非常適合為位置信息嵌入補充個性化信息。那么,FLIE探索了位置坐標、社區(qū)坐標、社區(qū)信息和客戶行為之間的關系。最后,FLIE用大量數(shù)據(jù)中學習嵌入的位置信息,取代人工制作的特征,解決了在下游任務中重復構建特征的問題。論文采用了全局和局部的兩層注意力機制,也是一個明顯的特征,既簡化了注意力模型的復雜度,又保證了整體模型特征的充分抽取(見圖3)。

信也科技論文榮獲WWW國際頂級學術會議FinWeb研討會最佳論文

圖三:全局和局部注意力機制通用的模型結構

上述模型在現(xiàn)實中被用于風險控制中,包括了逾期客戶預測和客戶分群兩大任務。逾期客戶預測涉及欺詐客戶檢測、信用額度和利率定價等應用??蛻舴秩旱膽冒ㄔO置借款策略、營銷、睡眠客戶喚醒和對不同客戶群的風險控制建模。

由此可見,FLIE模型在通過不斷試驗論證并應用后,將幫助行業(yè)進一步解決是風險控制中的金融欺詐檢測,推動行業(yè)發(fā)展,為我國金融科技健康發(fā)展貢獻積極力量。

厚積薄發(fā),實現(xiàn)WWW2021精彩亮相

被稱為“互聯(lián)網(wǎng)發(fā)展的風向標”的WWW2021,是被csrankings.org,csmetrics.org及中國計算機學會高度認可的A類推薦學術會議,曾在世界各地多個國家和地區(qū)舉辦,是互聯(lián)網(wǎng)業(yè)界的頂級盛事,并成為學術界以及產(chǎn)業(yè)界人士探討技術、交流思想、推動互聯(lián)網(wǎng)演變發(fā)展的峰會。

本屆WWW2021將于2021年4月12日到4月23日在位于歐洲心臟的斯洛文尼亞首都盧布爾雅那舉行,此次信也科技論文入選并被評選為FinWeb最佳論文,同時作為首家中國地區(qū)的贊助支持伙伴受邀參與大會專場研討,標志著信也科技在學術研究方面的重大飛躍。

WWW2021選擇信也科技作為贊助合作伙伴是對其技術科研能力的認可。在過去五年中,信也科技的研發(fā)費用累計達10億元,投入金額在行業(yè)內(nèi)屬于較高水平,而對業(yè)務全流程的精細化運營以及技術微創(chuàng)新將是信也后續(xù)進行科技投入的重點方向。

截至2021年3月31日,信也科技共登記軟件著作權171項,另外已成功提交125個專利申請,12個被授權。信也科技還擁有高新技術企業(yè)、上海市企業(yè)技術中心、計算機三級等保等資質(zhì)。目前,信也科技完備的自研技術已實現(xiàn)了對業(yè)務流程的全覆蓋,如人臉識別、多場景OCR、聲紋識別等多模態(tài)核身、增信技術,語音識別、意圖識別、對話管理、語音生成等全流程智能對話機器人技術,以及基于復雜網(wǎng)絡的不良中介識別和團伙識別技術等。此外,還形成了智能投放、精準營銷、核身、反欺詐、風控決策流、Automl模型平臺和智能機器人等一系列AI產(chǎn)品。

信也科技每年舉辦的信也科技杯(前身“魔鏡杯”),更是不斷推動和激勵金融科技行業(yè)的技術進步與創(chuàng)新。信也科技取得成績的背后是長久以來著眼于科技并致力于科研的信念,亦是信也科技長期堅持與包括加州理工大學、加州大學洛杉磯分校、浙江大學等在內(nèi)的海內(nèi)外頂級名校以及知名科技企業(yè)合作開展產(chǎn)學研聯(lián)動的成果。

今后,信也科技將繼續(xù)保持對科技研發(fā)的關注與投入,并進一步加深與高校的科研合作,力求在相關領域進行新嘗試與新突破,努力實現(xiàn)“科技,讓金融更美好”的使命。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )