作者 | 金旺
2018年,P2P產(chǎn)業(yè)暴雷,行業(yè)失序。
這一年,各地面臨最大的問題是:當?shù)氐降子卸嗌偌移髽I(yè)在從事非法金融活動,這些企業(yè)又存在怎樣的風險?
由此一并受到社會高度關注的,還有風控行業(yè)。
當時在螞蟻集團做C類風控的一支團隊,面對如此洶涌的行業(yè)大潮,也開始思考其中問題,著手構建商業(yè)信用視角的企業(yè)風險大腦。
當時的企業(yè)風險大腦主要在做兩件事:全網(wǎng)的輿情監(jiān)控、全網(wǎng)企業(yè)信息識別。
“當時我們已經(jīng)能夠通過全網(wǎng)信息理解一家企業(yè)在做什么,判斷出他們是否在從事非法金融活動,”回憶起團隊在2019年構建的企業(yè)風險大腦,螞蟻數(shù)科安全科技技術總監(jiān)章鵬如是說。
企業(yè)風險大腦,也成了螞蟻蟻盾后來進一步進入產(chǎn)業(yè)風控領域的開端。
四年后的今天,蟻盾已經(jīng)進入到金融、出行、大宗貿(mào)易等十數(shù)個行業(yè)2000余家企業(yè),開始作為copilot,輔助企業(yè)進行風險評估和拓客決策。
01 蟻盾“入仕”三部曲
2019年,螞蟻蟻盾搭建的企業(yè)風險大腦實際上是面向監(jiān)管部門,為監(jiān)管部門提供服務的。
在2020年,當螞蟻蟻盾決定將企業(yè)風險大腦的客戶從政府監(jiān)管部門擴展至企業(yè)時,他們發(fā)現(xiàn),當時市面上已經(jīng)有了一些企業(yè)信息聚合類平臺。
例如2014年成立的企查查和天眼查,這樣的平臺已經(jīng)初步具備企業(yè)風險評估能力。
當時螞蟻蟻盾團隊想到的是,要再往前走一步——不僅要做信息聚合,還要做信用逾期風險這樣非常具體的風險評估。
而這其中的技術是螞蟻蟻盾團隊在支付寶內(nèi)做風控時就已經(jīng)開始在做的事,是他們擅長的領域。
于是,這一年,當有企業(yè)用到螞蟻數(shù)科的企業(yè)風險大腦時,他們會發(fā)現(xiàn),這一產(chǎn)品除了全網(wǎng)企業(yè)識別和輿情監(jiān)控外,還融入了工商和司法輿情信息,并對這些信息做了進一步的解讀和穿透,當點擊基于這些信息生成的風險標簽時,可以看到這一風險的判斷依據(jù)。
信用逾期模型的加入,讓螞蟻蟻盾的企業(yè)風險大腦在進入企業(yè)市場時,有了自己的獨特性,不過,只有這一個模型,遠遠無法滿足企業(yè)市場的風云莫測。
章鵬發(fā)現(xiàn),在這一產(chǎn)品進入市場后,要面對企業(yè)生產(chǎn)決策中的諸多考量。
“當我們只為企業(yè)提供這一個模型,企業(yè)工作流又是離線運行時,企業(yè)很難用起來。”
基于這樣的考慮,螞蟻蟻盾的企業(yè)風險大腦開始向2.0版本演進,搭建一站式工作臺的想法也由此萌生。
在這個過程中,螞蟻蟻盾團隊不僅從拓客、準入到監(jiān)控,構建起了全鏈路一站式平臺,還通過搭建授權鏈路、引入私域數(shù)據(jù),提升模型和決策能力。
與此同時,風險指標池、行業(yè)圖譜、交互建模等技術開始被進一步引入。
當螞蟻蟻盾的企業(yè)風險大腦進化為一站式產(chǎn)業(yè)風控平臺時,已經(jīng)與市場上的企業(yè)信息查詢平臺的邏輯完全不同,章鵬認為,二者至少有以下幾點不同:
第一,我們不只是一個信息聚合平臺,如今的蟻盾-產(chǎn)業(yè)風控平臺已經(jīng)走向一站式工作臺,所以企業(yè)實際上已經(jīng)能在這一平臺上完成諸如獲客、準入、監(jiān)控等工作;
第二,蟻盾-產(chǎn)業(yè)風控平臺不只基于公開數(shù)據(jù),要把企業(yè)風險識別準,還要引入行業(yè)特征數(shù)據(jù),甚至需要授權的私域數(shù)據(jù),所以我們可以與企業(yè)生產(chǎn)系統(tǒng)進行打通,實現(xiàn)更精準的風險識別;
第三,我們希望和企業(yè)生產(chǎn)系統(tǒng)進行更多連接時,企業(yè)一定會對我們產(chǎn)品的準確性、效能有更高要求,因此我們也可以有更多定制,包括開放的能力出現(xiàn),包括我們在做的數(shù)據(jù)和知識的交互式建模。
章鵬認為,現(xiàn)在蟻盾擁有的能力相當于“信息聚合+一站式工作臺+與客戶生產(chǎn)關系打通”。
這樣的產(chǎn)業(yè)風控平臺,嵌入到了企業(yè)事前、事中、事后全流程數(shù)智風險管理工作流中,從而為產(chǎn)業(yè)協(xié)作降低風險、提升效率。
02 數(shù)據(jù)驅動or知識驅動?
數(shù)據(jù)驅動,是消費互聯(lián)網(wǎng)體系中的一個重要策略,然而,當進入到產(chǎn)業(yè)風控領域時,數(shù)據(jù)驅動這條路不再走得通。
“在消費互聯(lián)網(wǎng)領域,數(shù)據(jù)足夠多,有數(shù)據(jù)驅動就已經(jīng)足夠了;但在產(chǎn)業(yè)風控領域,實際情況剛好相反——這時我們往往有很多知識,但卻沒有足夠多的數(shù)據(jù),”章鵬如是說。
如此一來,要想做好產(chǎn)業(yè)風控,蟻盾就需要走出一條新路,一條將公域數(shù)據(jù)和私域數(shù)據(jù)有效融合的新路。
知識交互建模,就是蟻盾在這條路上摸索出來的一種新范式。
在知識交互建模范式中,整個建模過程被劃分成了客戶上傳樣本、樣本擴充、生成樣本標簽、生成行業(yè)模型四步。
章鵬解釋稱,“在一個行業(yè)模型真實建模過程中,帶標簽的樣本其實很少,因為一個企業(yè)運營系統(tǒng)中的逾期客戶最多可能也只有三五十個,再多公司就要破產(chǎn)了。
“對于我們來說,如何根據(jù)行業(yè)經(jīng)驗(知識)擴展樣本標簽就成了問題的關鍵。”
據(jù)章鵬介紹,整個樣本標簽擴展過程,又可以分為如下幾步:
首先,需要企業(yè)風控人員根據(jù)經(jīng)驗給出一定的規(guī)則,并結合蟻盾積累的行業(yè)模板,形成統(tǒng)一的準入規(guī)則;
其次,知識交互建模引擎借助弱監(jiān)督學習,通過這些準確率并不高的規(guī)則,推斷出很多新的企業(yè),并為這些新企業(yè)打標簽;
然后,專家根據(jù)新的企業(yè)標注,以及標簽關聯(lián)的結果和原因,對自動打標簽的結果進行修正。
最后,通過專家修正后的標簽更新平臺規(guī)則。
“如此循環(huán)往復,當我們擁有足夠多的標簽時,我們的建模工作也就完成了一大半。”
章鵬告訴我們,“通過這樣的知識交互建模方式,我們幫某個客戶將樣本標簽擴展了5倍,AUC模型性能從60%提升到了85%,建模周期也從原來的數(shù)月縮短到了一周。”
03 平臺構建的“二八定律”
時至今日,蟻盾已經(jīng)是螞蟻集團安全科技商業(yè)化品牌,對外提供包含身份安全、交易安全、合規(guī)安全等全鏈路風控產(chǎn)品和服務。
在2023年云棲大會上,蟻盾正式對外發(fā)布了“知識交互建模引擎”,通過將實體產(chǎn)業(yè)知識與AI模型有機結合,最快10分鐘就能為企業(yè)定制自主可控的垂直領域AI風控引擎。
目前,這一引擎已經(jīng)面向大宗商品行業(yè)開始落地測試。
蟻盾產(chǎn)品負責人李莎指出,“從最開始做一個通用平臺給到某個具體客戶,到客戶提出更多功能需求,我們的算法團隊進而幫客戶做定制化需求的不斷往復,我們現(xiàn)在依然處在一個從定制化產(chǎn)品向通用化產(chǎn)品轉型過程中。”
“未來,我們期望的是80%的客戶需求能夠直接由我們通用平臺中已有的能力得到滿足,另外20%需要定制化的功能,我們會開放出來,由我們的合作伙伴來完成。”
不過,李莎也坦言,“我們現(xiàn)在還處于將我們通用平臺的能力從能夠滿足客戶50%的需求提高到80%的過程中。”
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。
關注智造、硬件、機器人。