人民網
人民網

AI風控落地:同盾科技復雜網絡4.0重磅發布 多項創新加碼團伙欺詐分析

2018年03月07日14:21 | 來源:中國網
小字號
原標題:AI風控落地:同盾科技復雜網絡4.0重磅發布,多項創新加碼團伙欺詐分析

  團伙欺詐的泛濫,給傳統風控方式帶來挑戰。同盾科技復雜網絡4.0提供實時可視化關聯分析,通過更深層信息挖掘和推理,提供動態分析和監測。在反欺詐領域,如實時團伙檢測、催收號碼識別等,以及客戶價值挖掘等均有廣泛應用。其中,百億級金融圖數據庫(幾百萬團伙及其成員)、風險傳播算法及知識表示學習系首次發布。

  一、欺詐趨勢:團伙欺詐成頑疾

  “窮則變、變則通、通則久”

  1.欺詐產業化成新趨勢

  近年來,傳統金融機構業務逐漸互聯網化,新金融模式也層出不窮,但金融的本質未變,風控依然是核心。傳統金融風險在互聯網金融領域依然存在。同時,追求速度的互聯網金融也打開了“潘多拉”盒子,“快”意味著效率,也意味著缺陷和額外的風險,事實証明,隨著互聯網金融的普及,金融欺詐也隨之普及,並大有西風壓倒東風之勢,讓從業者聞“欺詐”色變。

  “苟富貴,勿相忘”和“逐利性”,讓一部分先“富”起來的人,帶動其他人共同“致富”,並逐漸形成了有組織、有紀律和分工明確的欺詐上下游產業鏈,如專業的技術開發產業、身份信用包裝和虛假身份提供產業、業務漏洞發現和欺詐方法傳授產業。據不完全統計,僅2017年,中國的網絡欺詐導致的損失近5000億元。“誰割肉,誰痛苦,誰改變”,因此,金融機構團伙反欺詐的需求強烈而迫切,自是不言而喻的。

  2.團伙欺詐案例

  如下選取三個真實的團伙欺詐案例,相關企業及人名已作模糊化處理。

  *案例一:銀行信用卡養卡套現

  “某團伙在某村庄以招工的名義大量收取村民的身份証,並申請信用卡,然后刷卡透支,讓村民背負銀行債務。此時,銀行按照過往經驗便會判定該村地址為欺詐地址,使該村村民抹上信用污點。”風控難點:銀行卡套現風險。

  *案例二:汽車金融“零首付”中間團伙騙貸

  “某團伙打出‘零首付購車’廣告,墊付首付款和代辦貸款,購車人不花錢即可拿到車。於是,購車人購買價值25萬的本田,團伙墊付10萬的首付款后,要求先將車開走用於抵押辦理高額度信用卡,再從信用卡中取走墊付的首付款。當把車開走后便杳無音信,購車人不僅未拿到車,每月得還6000多元的銀行貸款。”風控難點:中間人團伙騙貸已成為汽車金融風險最高的風險類型。

  *案例三:娛樂直播羊毛黨薅羊毛

  “某團伙利用某直播平台業務拓展需要,利用大量的新用戶身份信息注冊、登錄平台領取紅包,成功薅羊毛數百萬”。風控難點:快速識別注冊、登錄或營銷場景下,注冊手機號或設備風險。

  其他如信貸行業、第三方支付、電商、保險等領域的團伙欺詐也猶如雨后春筍般層出疊見,本文不再一一詳述。

  3.團伙欺詐識別的難點&挑戰點

  商場如戰場,金融領域競爭激烈,若比競爭對手審核快1s或風控正確率多1%,則市場份額會發生根本改變。“知彼知己”是制勝良策,同盾科技作為智能風控服務商,在分析大量真實團伙欺詐案例基礎上,化繁為簡、歸納總結出團伙欺詐的特點、共性和作案手段,如技術更新快、組織基本穩定、關聯關系強,以及為節省成本,通常會重復利用信息、設備和賬號等(如圖1所示),最終“撥開雲霧見月明”,揪出“狐狸尾巴”。

  圖1:團伙欺詐的特點

  團伙欺詐導致風控難度急劇上升,基於線性模型的傳統風控,未評估關聯關系對風險的影響。“窮則思變”,單純依靠“增加產品審核流程、全方位的人工調查比對”導致成本居高不下且往往事倍功半,行業迫切需要更多數據源、自動化團伙分析和決策模型。但數據和技術的高門檻讓人望而卻步,非一朝一夕所能解決。

  正所謂“當此困頓之局,唯破局者可立”,同盾科技基於”智能誠信網絡”理念、技術的持續創新以及新場景的戰略部署,在數據、技術、場景和計算能力方面積累了豐富的實戰經驗,早在2015年即部署復雜網絡技術應對團伙欺詐挑戰,經過3年調優,已迭代至復雜網絡4.0。

  二、破局:同盾科技復雜網絡的創新性應用

  “工欲善其事,必先利其器”

  【知識儲備:人類最擅長的思維方式是將點和線關聯,並由點及面、抽絲剝繭,逐步理清邏其中的輯推理關系。世間萬物是錯綜復雜的關系網,但無論形式多麼復雜,其本質都是簡單的三元組,即:實體-關系-實體。】

  1.復雜網絡產品

  (1)復雜網絡定義

  從概念評述:復雜網絡能針對復雜對象的關聯關系進行非線性建模,由節點(實體)和節點之間錯綜復雜的關系(實體之間關系)構成拓扑網絡,當異常關系聚集出現時,即可識別欺詐行為。拓展了風險識別的邊界和維度,解決了金融場景數據量大、數據復雜和數據不完整的基本問題,幫助金融機構減少風險,降低風控成本,提高決策效率。

  從產品評述:復雜網絡是同盾科技核心產品和技術之一,融合同盾大數據和外部數據,提供實時可視化關聯分析,將規則、關系及變量通過關系網絡表現,通過更深層信息挖掘和推理,提供動態分析和監測。在反欺詐領域,如實時團伙檢測、催收號碼識別等,以及客戶價值挖掘等均有廣泛應用

  (2)復雜網絡技術原理

  “打鐵還需自身硬”,數據和技術是關鍵。同盾科技打通跨行業數據及外部數據,結合文本、圖片等非結構化數據抽取技術,完成結構化與非結構化信息融合,將時空大數據編織成“實體-關系-實體”的拓扑關系網,當輸入“種子數據/線索”,則由點及面、抽絲剝繭,最終順藤摸瓜找到與之有關聯的所有信息,並通過圖計算、知識表示和機器學習等技術進行黑中介團伙等的智能化挖掘分析。

  圖2:同盾科技復雜網技術原理

  “知易行難”,同盾科技在復雜網絡和知識圖譜領域做了深入探索,在關系網絡分析中融合組合、數值和統計思維,積累了一些經驗和技巧。在可擴展性算法方面:如局部網絡推理、高斯-馬爾可夫隨機場中取樣、稀疏化、圖分割、拉普拉斯范式等。數據可視化方面:使用仿真力學模型替代傳統的拓扑圖關系可視化算法。通過持續的實踐-反饋-實踐,不斷提升復雜網絡的精准度。

  圖3:復雜網絡圖分割探索優化

  (3)復雜網絡功能

  復雜網絡在應用上,既可作為產品輸出,也可作為技術能力輸出。

  實時風險群體分析、可視化工作台及風險群體報告是復雜網絡作為產品輸出的呈現,分別在事前、事中和事后支持欺詐團伙的智能化分析。實時風險群體分析支持靈活的策略配置,可毫秒級返回分析結果(見下圖),如:關聯風險分、豐富的量化指標、關系圖和建議,直觀呈現欺詐團伙的組織形式、核心成員、地址及時間特性。可視化工作台可進行數據動態關聯分析,如分析人員聚類、時間聚類、地址聚類等。風險群體報告則可針對批量數據進行團伙風險分析。

  圖4:實時風險群體分析結果

  圖5:實時風險群體分析分布圖(中介團伙分布圖,相關詳情已脫敏隱去)

  圖6:可視化工作台界面

  復雜網絡作為技術能力輸出,在催收號碼識別、客戶價值挖掘等產品有應用。

  (4)復雜網絡應用場景

  復雜網絡支持全場景的實時數據可視化分析,如:銀行養卡套現、申請欺詐檢測、賬戶保護、羊毛黨識別、惡意刷單作弊等。

  2.復雜網絡4.0的創新性

  “以終為始”,反欺詐效果是關鍵,創新性體現在三個層面:

  其一,數據層面:多源數據融合+NLP,重構金融圖數據庫。

  “數據比技術更重要”是行業共識,有高質量數據,即使簡單算法,也能取得好效果。復雜網絡4.0融合多來源數據,重構數據清洗、信息抽取和融合方案,使用全新圖數據庫框架,重構金融圖數據庫,新圖數據庫具有分布式、高可擴展性和可維護性,可支持千億級數據毫秒級實時查詢響應。同時,使用NLP技術,將非結構化與結構化數據融合,形成包含100億節點(實體)、300億邊(關系)的金融圖譜。

  其二,技術層面:結合風險傳播算法、知識表示和機器學習,進行深度挖掘分析,開啟AI風控。

  風控作為金融平台競爭力的核心,最早依賴於規則架構,后來演化為規則加模型架構,現在趨向於 AI。AI風控體現在兩方面:風險傳播算法、知識表示和機器學習。

  1.風險傳播算法

  風險傳播算法依據“近朱者赤,近墨者黑“的原理,從已知風險節點角度評估整個網絡節點的風險程度。利用網絡結構進行風險傳播,進而提高風險節點的覆蓋度。

  2.知識表示和機器學習

  構建數據關系網絡是“智能分析”的第一步,利用合適方法將數據價值充分發揮,進而挖掘未知的關聯才是目的。使用network embedding方法將高維信息映射到低維空間,解決數據稀疏問題,使知識融合和推理的性能顯著提升,結合機器學習,利用無監督算法進行風險群體的識別。實際應用中,通過機器學習對圖分割算法不斷調優,劃分不同的團伙和團伙特征,對判斷團伙性質有重要決策作用,如"30%的節點為風險名單"、"40%的節點命中疑似垃圾注冊風險類型"。

  其三,應用層面:行業化+本地化並駕齊驅,復雜網絡全方位技術輸出。

  數據壁壘導致通用關系網無法適應行業特性,在抽取行業特征基礎上、消除噪聲、構建行業化關系網絡勢在必行,如:信貸關系網絡、汽車金融關系網絡、保險關系網絡、羊毛黨關系網絡等,提高反欺詐效果。

  針對銀行、汽車金融及保險公司,在風控雲方案之外,本地化部署也是著力點之一,可解決強監管,數據無法上“雲”的問題。由於本地化數據業務閉環屬性更強,數據更全面,在標簽數據基礎上,可深度優化有監督學習模型,取得更精准的效果。但無論本地化數據量級多大,相對於跨行業大數據而言,都是“小數據“。融合本地化數據與同盾大數據,結合監督算法和無監督算法,進一步反哺原有本地化風控規則,完善本地化方案的不足,進而提高反欺詐效果。

  復雜網絡作為技術能力全方位向同盾各產品線輸出,如評估系統性風險的小微企業的擔保關系圈、催收號碼識別及基於關系網絡的客戶價值挖掘等。

  三、實踐:典型案例及應用示例分析

  “實踐是檢驗真理的唯一標准”

  1.銀行信用卡養卡套現

  【行業風險點】信用卡非法套現。

  【案例分析】案例一,銀行可以利用復雜網絡,抽取現數據關聯性,從關聯中分辨出是否使用類似的電話號碼、地址以及區域,將關聯屬性與其他金融數據輸入深度學習網絡做有監督的訓練,在數十萬欺詐案例數據上得到一個動態識別模型。

  【復雜網絡分析】兩個人共用一套信息(手機號和身份証),進而逐步關聯,形成鏈條型關系網絡。

  圖7:復雜網絡分布圖(id=身份証,mob=手機號,card=銀行卡)

  2.汽車金融中介欺詐

  【行業風險點】汽車金融是特殊的金融產品,風控難點:如身份偽造、中介欺詐、團伙欺詐、騙車二抵等,二手車金融作為最有潛力的產品之一,其團伙欺詐風險尤其泛濫。

  【案例分析】案例二的汽車金融團伙欺詐,具有典型的地域性和組織性。

  【復雜網絡分析】

  圖8:復雜網絡分布圖

  3.直播娛樂羊毛黨識別

  【行業風險點】消費金融、娛樂直播等行業推出的優惠活動,吸引羊毛黨們有組織的參加,逐漸形成了羊毛黨“專業化”、“組織化”和“地域化”的發展趨勢。

  【案例分析】案例三可通過復雜網絡識別注冊、登錄手機號或設備群體風險,找出團伙的核心成員,分析地址聚集性和組織形式等。

  【復雜網絡分析】箭頭所指手機號未知風險,單純通過專家規則無法識別其風險。但通過復雜網絡分析可知,該手機號所關聯的設備與大量虛假號碼關聯(羊毛黨典型特征),因而可判定箭頭所指手機號為虛假號碼,為羊毛黨所掌控。

  圖9:復雜網絡分布圖

  “行百裡者半九十”,同盾科技復雜網絡4.0是又一個新起點。未來,將不斷推陳出新、加快產品技術迭代,如:關系類型深度挖掘推理、資金鏈關系圖等。在應用領域,與銀行、汽車金融和保險領域深度融合,如保險領域的理賠反欺詐場景,如車險,醫療險等場景的團伙欺詐分析,進一步提高團伙欺詐風險識別的精准度和效率。

(責編:朱傳戈、李昉)

分享讓更多人看到

返回頂部