作者 | 金旺
2018年,P2P產業(yè)暴雷,行業(yè)失序。
這一年,各地面臨最大的問題是:當地到底有多少家企業(yè)在從事非法金融活動,這些企業(yè)又存在怎樣的風險?
由此一并受到社會高度關注的,還有風控行業(yè)。
當時在螞蟻集團做C類風控的一支團隊,面對如此洶涌的行業(yè)大潮,也開始思考其中問題,著手構建商業(yè)信用視角的企業(yè)風險大腦。
當時的企業(yè)風險大腦主要在做兩件事:全網的輿情監(jiān)控、全網企業(yè)信息識別。
“當時我們已經能夠通過全網信息理解一家企業(yè)在做什么,判斷出他們是否在從事非法金融活動,”回憶起團隊在2019年構建的企業(yè)風險大腦,螞蟻數科安全科技技術總監(jiān)章鵬如是說。
企業(yè)風險大腦,也成了螞蟻蟻盾后來進一步進入產業(yè)風控領域的開端。
四年后的今天,蟻盾已經進入到金融、出行、大宗貿易等十數個行業(yè)2000余家企業(yè),開始作為copilot,輔助企業(yè)進行風險評估和拓客決策。
01 蟻盾“入仕”三部曲
2019年,螞蟻蟻盾搭建的企業(yè)風險大腦實際上是面向監(jiān)管部門,為監(jiān)管部門提供服務的。
在2020年,當螞蟻蟻盾決定將企業(yè)風險大腦的客戶從政府監(jiān)管部門擴展至企業(yè)時,他們發(fā)現,當時市面上已經有了一些企業(yè)信息聚合類平臺。
例如2014年成立的企查查和天眼查,這樣的平臺已經初步具備企業(yè)風險評估能力。
當時螞蟻蟻盾團隊想到的是,要再往前走一步——不僅要做信息聚合,還要做信用逾期風險這樣非常具體的風險評估。
而這其中的技術是螞蟻蟻盾團隊在支付寶內做風控時就已經開始在做的事,是他們擅長的領域。
于是,這一年,當有企業(yè)用到螞蟻數科的企業(yè)風險大腦時,他們會發(fā)現,這一產品除了全網企業(yè)識別和輿情監(jiān)控外,還融入了工商和司法輿情信息,并對這些信息做了進一步的解讀和穿透,當點擊基于這些信息生成的風險標簽時,可以看到這一風險的判斷依據。
信用逾期模型的加入,讓螞蟻蟻盾的企業(yè)風險大腦在進入企業(yè)市場時,有了自己的獨特性,不過,只有這一個模型,遠遠無法滿足企業(yè)市場的風云莫測。
章鵬發(fā)現,在這一產品進入市場后,要面對企業(yè)生產決策中的諸多考量。
“當我們只為企業(yè)提供這一個模型,企業(yè)工作流又是離線運行時,企業(yè)很難用起來。”
基于這樣的考慮,螞蟻蟻盾的企業(yè)風險大腦開始向2.0版本演進,搭建一站式工作臺的想法也由此萌生。
在這個過程中,螞蟻蟻盾團隊不僅從拓客、準入到監(jiān)控,構建起了全鏈路一站式平臺,還通過搭建授權鏈路、引入私域數據,提升模型和決策能力。
與此同時,風險指標池、行業(yè)圖譜、交互建模等技術開始被進一步引入。
當螞蟻蟻盾的企業(yè)風險大腦進化為一站式產業(yè)風控平臺時,已經與市場上的企業(yè)信息查詢平臺的邏輯完全不同,章鵬認為,二者至少有以下幾點不同:
第一,我們不只是一個信息聚合平臺,如今的蟻盾-產業(yè)風控平臺已經走向一站式工作臺,所以企業(yè)實際上已經能在這一平臺上完成諸如獲客、準入、監(jiān)控等工作;
第二,蟻盾-產業(yè)風控平臺不只基于公開數據,要把企業(yè)風險識別準,還要引入行業(yè)特征數據,甚至需要授權的私域數據,所以我們可以與企業(yè)生產系統進行打通,實現更精準的風險識別;
第三,我們希望和企業(yè)生產系統進行更多連接時,企業(yè)一定會對我們產品的準確性、效能有更高要求,因此我們也可以有更多定制,包括開放的能力出現,包括我們在做的數據和知識的交互式建模。
章鵬認為,現在蟻盾擁有的能力相當于“信息聚合+一站式工作臺+與客戶生產關系打通”。
這樣的產業(yè)風控平臺,嵌入到了企業(yè)事前、事中、事后全流程數智風險管理工作流中,從而為產業(yè)協作降低風險、提升效率。
02 數據驅動or知識驅動?
數據驅動,是消費互聯網體系中的一個重要策略,然而,當進入到產業(yè)風控領域時,數據驅動這條路不再走得通。
“在消費互聯網領域,數據足夠多,有數據驅動就已經足夠了;但在產業(yè)風控領域,實際情況剛好相反——這時我們往往有很多知識,但卻沒有足夠多的數據,”章鵬如是說。
如此一來,要想做好產業(yè)風控,蟻盾就需要走出一條新路,一條將公域數據和私域數據有效融合的新路。
知識交互建模,就是蟻盾在這條路上摸索出來的一種新范式。
在知識交互建模范式中,整個建模過程被劃分成了客戶上傳樣本、樣本擴充、生成樣本標簽、生成行業(yè)模型四步。
章鵬解釋稱,“在一個行業(yè)模型真實建模過程中,帶標簽的樣本其實很少,因為一個企業(yè)運營系統中的逾期客戶最多可能也只有三五十個,再多公司就要破產了。
“對于我們來說,如何根據行業(yè)經驗(知識)擴展樣本標簽就成了問題的關鍵。”
據章鵬介紹,整個樣本標簽擴展過程,又可以分為如下幾步:
首先,需要企業(yè)風控人員根據經驗給出一定的規(guī)則,并結合蟻盾積累的行業(yè)模板,形成統一的準入規(guī)則;
其次,知識交互建模引擎借助弱監(jiān)督學習,通過這些準確率并不高的規(guī)則,推斷出很多新的企業(yè),并為這些新企業(yè)打標簽;
然后,專家根據新的企業(yè)標注,以及標簽關聯的結果和原因,對自動打標簽的結果進行修正。
最后,通過專家修正后的標簽更新平臺規(guī)則。
“如此循環(huán)往復,當我們擁有足夠多的標簽時,我們的建模工作也就完成了一大半。”
章鵬告訴我們,“通過這樣的知識交互建模方式,我們幫某個客戶將樣本標簽擴展了5倍,AUC模型性能從60%提升到了85%,建模周期也從原來的數月縮短到了一周。”
03 平臺構建的“二八定律”
時至今日,蟻盾已經是螞蟻集團安全科技商業(yè)化品牌,對外提供包含身份安全、交易安全、合規(guī)安全等全鏈路風控產品和服務。
在2023年云棲大會上,蟻盾正式對外發(fā)布了“知識交互建模引擎”,通過將實體產業(yè)知識與AI模型有機結合,最快10分鐘就能為企業(yè)定制自主可控的垂直領域AI風控引擎。
目前,這一引擎已經面向大宗商品行業(yè)開始落地測試。
蟻盾產品負責人李莎指出,“從最開始做一個通用平臺給到某個具體客戶,到客戶提出更多功能需求,我們的算法團隊進而幫客戶做定制化需求的不斷往復,我們現在依然處在一個從定制化產品向通用化產品轉型過程中。”
“未來,我們期望的是80%的客戶需求能夠直接由我們通用平臺中已有的能力得到滿足,另外20%需要定制化的功能,我們會開放出來,由我們的合作伙伴來完成。”
不過,李莎也坦言,“我們現在還處于將我們通用平臺的能力從能夠滿足客戶50%的需求提高到80%的過程中。”
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統,首次實現AI根據復雜指令創(chuàng)作完整長篇音頻故事。該系統結合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠將復雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質量,在多項測試中超越包括Sora在內的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質量樣本的訓練數據集和MM-AlignBench評測基準,通過創(chuàng)新的數據生成和質量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內完成10天全球天氣預報,準確性超越傳統方法90%的指標。該模型采用圖神經網絡技術,通過學習40年歷史數據掌握天氣變化規(guī)律,在極端天氣預測方面表現卓越,能耗僅為傳統方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。
關注智造、硬件、機器人。