貸中交易拒絕撈回策略
風控業務背景
隨著流量獲客成本日益昂貴,以及存量客戶越來越多,各金融機構對存量客戶的經營日益重視。部分拒絕交易的風險尚可接受,如果將其撈回,則可以促進交易額GMV上升,幫助公司佔據更大的市場份額。
那麼,如何從拒絕客戶中撈回部分相對優質的客戶呢?本文嘗試系統地介紹這一方案。
目錄
Part 1。 拒絕撈回的概念和目的
Part 2。 尋找可放鬆的拒絕規則
Part 3。 如何開展拒絕人群推斷
Part 4。 離線評估撈回人群風險
Part 5。 策略規則的部署工作流
Part 6。 線上監控撈回策略效果
Part 7。 總結
致謝
版權宣告
參考資料
Part 1。 拒絕撈回的概念和目的
客戶透過准入、貸前反欺詐、授信(定額定價)後,便進入
動支(draw)
階段,即在額度範圍內可以發起借款申請。動支階段,風控系統將會執行交易反欺詐、信用策略自動稽核、人工信用稽核等環節,最終決定該筆動支申請是否予以
放款(loan)
。
任何風控系統都無法完美區分開好人和壞人,因此在透過和拒絕樣本中均有好人壞人。只是在風控的排序篩選後,拒絕樣本中壞人比例相對於透過樣本更高。注意,好壞定義是根據所需控制的風險目標決定的,並不是絕對的。
拒絕撈回是指從拒絕的客戶中,再選擇一些滿足一定條件的客戶,予以透過。在《利用Swap Set分析風控模型更替的影響》中,我們提到過兩個概念:
swap out
:以放貸樣本進行測算,只要風險高於可接受水平,予以拒絕。
swap in
:推斷拒絕樣本風險,在拒絕樣本中撈回部分好人,予以透過。
顯然,由於缺乏拒絕樣本的貸後風險標籤,swap in會比swap out難度較大。
圖 1 - 拒絕回撈的概念
Part 2. 尋找可放鬆的拒絕規則
通常,線上將執行著很多條風控策略規則。那麼,我們該如何去選擇可以放鬆的拒絕規則呢?可從以下幾個維度來衡量一條規則的放鬆價值,即:
拒絕率
:拒絕率越高,這條規則的影響力則越大,也就具有更大的最佳化空間。為此,我們可以統計線上規則的拒絕分佈,如圖2所示。
誤傷率
:從貸後表現上看,某些規則如果誤傷率較高,這就意味著不適合再繼續執行。我們就要考慮下線。
軟硬度
:硬規則(hard rule)是指必須嚴拒,不能退讓的規則,包括黑名單、反欺詐規則等。軟規則(soft rule)則是指一些較為模稜兩可,命中並不一定絕對是壞的規則,比如多頭規則等。
圖 2 - 拒絕原因分佈
Part 3. 如何
開展拒絕人群推斷
在《風控建模中的樣本偏差與拒絕推斷》中,我們接觸過拒絕推斷的概念。在本文中,我們可以採用Data methods中的——接受本該拒絕(Reject Acceptance)。這是一種
風險下探
操作,是以犧牲部分資金來換取貸後風險表現的博弈。
如圖3所示,我們將樣本分為三種,包括:
正常透過樣本(PS)
:被風控透過的樣本,可以獲知貸後風險表現。
正常拒絕樣本(RJ)
:被風控拒絕的樣本,無法獲知貸後風險表現。
應拒未拒樣本(spy PS
):實際上,這部分樣本本該被風控拒絕,但考慮到我們對閾值外的樣本一無所知,因此有選擇性地放過少量閾值外樣本,並形象地取名為
間諜(spy)
。可以作為拒絕總體的抽樣,用以探知拒絕人群的風險表現。
圖 3 - 申請訂單的3種狀態
在模型和策略迭代中,我們常會煩惱,隨著策略閾值越來越緊,無法獲知閾值外樣本的X和Y,導致模型越學越偏。因此,這部分應拒未拒樣本(spy PS)具有很大的價值。
Part 4. 離線評估撈回人群風險
如何從拒絕人群中撈回相對優質的客戶呢? 現介紹一種樸素的撈回策略生成方法:
模型圈人
:利用信用評分模型對拒絕人群排序,初步選出頭部相對最優的人群。
閾值放鬆
:輔以其他維度變數,圈定目標撈回人群。在《模型視角下的風控策略規則發現》中,我們介紹過
畫格子法
來制定策略規則。
風險評估
:定義風險目標,評估撈回人群的風險水平,如果不滿足要求,則返回步驟1,重新調整撈回策略規則。
我們再詳細介紹下步驟3的風險評估部分。
1. 透過PS樣本
:
用以確定大盤風險水平,作為參照基準。例如,大盤違約率為2%,這樣我們心裡就有大概的判斷,風險高於這個水平就不可接受。
2. 間諜PS樣本
:
用以估算撈回的拒絕樣本的風險水平。保守起見,我們需留出一定的
裕量
,比如控制違約率不超過1。2%(大盤的60%)。這是出於兩方面考慮:
1)間諜樣本量通常較少,在評估中容易波動,導致風險估計不準確。
2)拒絕樣本難以被線上風控系統所認可,在回撈時就應該予以更嚴格的要求。
圖 4 - 離線評估策略規則有效性
最終,我們可能生成這樣一條撈回規則:
if x1 > 600 and x2 < 5 then ‘LH’ else ‘RJ’
在近期樣本上,同樣需要評估撈回量的穩定性,確保處在正常的波動中,而不會持續升高或降低的情況。
Part 5. 策略規則的部署工作流
在離線分析制定策略後,我們會在決策引擎中部署多條策略。此時就有2種備選工作流,即序列和並行。那麼這兩種方式有何差異點呢?
1. 序列式回撈
:
各策略存在先後優先順序,瀑布式回撈。對於命中對應撈回策略的訂單,將被打上相應的標記flag,進入撈回池。每條被撈回的訂單,
只會具有一個flag
。
這種方案下,越處於下游的撈回策略面向的人群資質越差。此時,當我們上線一條新策略時,就需要評估增量撈回人群的風險表現。如果線上策略不下線,那麼越到後面,撈回策略的迭代最佳化空間越小。
2. 並行式回撈
:
各策略同時對全量拒絕訂單篩選,並行式回撈。對於命中對應撈回策略的訂單,將被打上相應的標記flag,進入撈回池。每條被撈回的訂單,
至少具有一個flag
。
這樣的好處在於每條策略都是公平的,可以得到真實的撈回佔比。每條策略之間形成相互的AB測試。等待風險表現完全,我們就可以根據命中相應flag的訂單來評估策略的優劣。
但是,不同策略的撈回量,以及對應的風險不同,我們該如何比較?筆者認為,撈回策略的評估指標,以風險作為第一指標,即:
無論撈回量大小,風險越低,策略越優
。
因此,筆者更為推薦第2種方案,這便於評估策略之間的差異,以及迭代最佳化。策略可以有優先順序之分,但可以
記錄所有命中的flag,以及優先順序最高的一條策略作為reason code。
圖 5 - 兩種回撈策略部署工作流
Part 6。 線上監控撈回策略效果
策略上線後,監控是必不可少的環節。由於撈回策略可能會引入更多的壞人,我們更需要關注撈回資產的質量。
1. 前期監控
:
上線初期,資產還未有貸後表現。因此,我們主要
關注撈回人群佔比的穩定性
。若出現某一天撈回量突然上升的現象,就需要立馬排查原因。畢竟撈回量越高,風險就一般會越高,這是一個強預警訊號。
具體地,可參考統計以下指標:
撈回(動支/借據)訂單 = 命中撈回策略flag的(動支/借據)訂單
撈回筆數佔比 = 撈回筆數 / 總筆數
撈回金額佔比 = 撈回金額 / 總金額
件均 = 金額 / 筆數
2. 後期監控
:
當資產開始具備貸後表現(如首期入催率),那麼就可以
比較撈回與大盤的風險差異
。這是由於離線評估是基於歷史客群樣本,上線後可能客群已經發生了變化。動態評估風險的變化,有助於我們把握資產質量。
Part 7. 總結
拒絕回撈是一種較為冒險的嘗試,畢竟從原本拒絕的人群中給予放款,雖然初衷在於提升交易額,但在這下探風控邊界的同時,稍有不慎就會讓風險上升。
圖 6 - 風險邊界的探知
另外,我們還可以從哪些方向著手呢? 筆者認為,其他最佳化空間在於:
降低額度:控制風險敞口。
提高利率:以更高的利率來覆蓋更高的風險。
控制期數:假設一個支援3、6、12期的信貸產品,對於部分客戶限定其只能借3期。
致謝
所有參考資料中的各位作者,以及XX、TYY、WYZ、GMY,感謝給我的啟發。文中仍有理解不到位之處,在此拋磚引玉。
版權宣告
歡迎轉載分享
,
請在文章中註明作者和原文連結,感謝您對知識的尊重和對本文的肯定。
原文作者:求是汪在路上(知乎ID)
原文連結:
https://
zhuanlan。zhihu。com/p/13
9100161/
著作權歸作者所有。
商業轉載請聯絡作者獲得授權,非商業轉載請註明出處,侵權轉載將追究相關責任
。
參考資料
關於作者
:
在某網際網路金融公司從事風控建模、反欺詐、資料探勘等方面工作,目前致力於將實踐經驗固化分享,量化成長軌跡。歡迎交流