本發明屬于金融數據,尤其涉及一種基于二叉樹的信貸風險動態歸因分析方法。
背景技術:
1、在信貸風控領域中,動支率、逾期率以及回收率等是衡量企業運營水平及風控水平的關鍵指標,然而當這些指標出現異常波動時,企業需要快速定位出是哪部分客群導致出現這種結果。傳統的歸因分析主要依賴人工開展監控、分析和決策,存在效率低下、風險應對不及時等問題。
2、為了自動實現對異常信貸指標的歸因分析,在發明專利申請cn202411974941.5《一種用于逾期指標變化的歸因分析方法及系統》中通過對信貸指標的變動情況為基礎確定關聯指標特征,并以關聯指標特征的關聯系數的排序結果進行信貸指標的變動歸因分析,提升了歸因分析的處理的準確性,但是卻存在以下技術問題:
3、在進行歸因分析時,由于信貸指標的數量較多,同時不同的信貸指標還存在著一定的關聯性,因此若采用下鉆維度的方式實現對關聯信貸指標的分析處理,則不可避免的會導致歸因分析的處理效率和難度難以滿足要求。
4、為解決上述技術問題,本申請提供一種基于二叉樹的信貸風險動態歸因分析方法。
技術實現思路
1、為實現本發明目的,本發明采用如下技術方案:
2、具體的,本申請提供一種基于二叉樹的信貸風險動態歸因分析方法,具體包括:
3、s1利用信貸產品類型將歷史信貸用戶劃分至多個客戶群體,以信貸風險指標在不同的單位時段中的變動情況,確定所述信貸風險指標的指標穩定時段;
4、s2獲取在不同的指標穩定時段中的客戶群體的關聯指標的變動情況,以所述關聯指標的變動情況確定所述客戶群體中的驚喜度關聯群體;
5、s3確定所述驚喜度關聯群體對應的歷史信貸用戶在指標評估時段中的構成數據,并結合所述驚喜度關聯群體的數量以及指標評估時段中的信貸風險指標的變動數據,確定所述驚喜度關聯群體的解釋度閾值;
6、s4以所述驚喜度關聯群體以及解釋度閾值為基礎構建二叉樹,并以不同的驚喜度關聯群體的解釋度和驚喜度為基礎進行二叉樹葉子節點的生成以及信貸風險指標的歸因結果的生成處理。
7、本發明的有益效果在于:
8、以在穩定指標時段中的關聯指標的變動情況確定客戶群體中的驚喜度關聯群體,實現了對關聯指標頻繁變動的客戶群體的篩選,進而也為進行歸因分析時排除關聯指標頻繁變動的客戶群體,保證歸因分析的處理效率奠定了基礎。
9、以不同的驚喜度關聯群體的解釋度和驚喜度為基礎進行二叉樹葉子節點的生成以及信貸風險指標的歸因結果的生成處理,充分考慮到在利用二叉樹進行歸因分析時,不同的精細度關聯群體由于關聯指標的變動情況與信貸風險指標的變動情況的關聯程度的差異,進行差異化的二叉樹葉子節點的生成,提升了二叉樹葉子節點的生成處理效率和準確性,同時也提升了歸因分析的處理的效率。
10、進一步的技術方案在于,所述信貸產品類型根據信貸服務平臺對不同的群體開發的信貸產品進行確定。
11、進一步的技術方案在于,將歷史信貸用戶劃分至多個客戶群體,具體包括:
12、將屬于同一種信貸產品類型的客戶劃分至同一個客戶群體。
13、進一步的技術方案在于,所述信貸風險指標包括動支率、逾期率以及回收率。
14、進一步的技術方案在于,所述信貸風險指標的指標穩定時段的確定的方法為:
15、以在不同的單位時段中不同日期的信貸風險指標的平均值,確定不同的單位時段中的基準值;
16、根據所述單位時段中不同日期的信貸風險指標與所述基準值的偏差量,進行所述日期中的指標變動日期的確定;
17、根據所述指標變動日期的數量占比,確定所述單位時段是否為所述信貸風險指標的指標穩定時段。
18、進一步的技術方案在于,所述指標變動日期是信貸指標與所述基準值的偏差量不在預設指標偏差量區間內的日期。
19、進一步的技術方案在于,當所述單位時段中的指標變動日期的數量占比大于預設變動日期數量占比時,則確定所述單位時段不屬于所述信貸風險指標的指標穩定時段。
20、進一步的技術方案在于,構建二叉樹,具體包括:
21、獲取對應的驚喜度關聯群體的關聯指標數據,解釋度閾值,客群占比閾值;
22、若驚喜度關聯群體的歷史信貸用戶的數量占比小于客群占比閾值時,計算該客群的解釋度及驚喜度,并將該客群作為二叉樹葉子節點;
23、若驚喜度關聯群體的歷史信貸用戶的數量占比不小于客群占比閾值時,
24、計算該客群的關聯指標的解釋度及驚喜度,并當所述驚喜度關聯群體的解釋度不滿足解釋度閾值的約束條件時,將所述驚喜度關聯群體作為二叉樹葉子結點;
25、當所述驚喜度關聯群體的解釋度滿足解釋度閾值的約束條件時,以所述驚喜度關聯群體的子群體的歷史信貸用戶的基礎信息的相似程度為基礎,進行驚喜度關聯群體的二次劃分得到子群體,以所述驚喜度滿足驚喜度閾值的子群體為基礎構建二叉樹葉子結點,以二叉樹葉子結點構建決策樹。
26、進一步的技術方案在于,將在某一維度的基礎信息的偏差量均在預設偏差范圍內的歷史信貸用戶劃分至同一個子群體。
27、進一步的技術方案在于,所述基礎信息包括職業、收入、地區、信貸額度、支用數據和客戶端。
28、進一步的技術方案在于,所述驚喜度關聯群體的關聯指標的解釋度根據驚喜度關聯群體在所述評估目標時段的關聯指標與穩定指標時段的關聯指標的平均值的偏差量、和所述信貸風險指標在評估目標時段與穩定指標時段的關聯指標的平均值的偏差量的比值進行確定。
29、進一步的技術方案在于,所述驚喜度關聯群體的驚喜度的確定的方法為:
30、以在不同的單位時段中不同日期的信貸風險指標的平均值,確定不同的單位時段中的基準值,根據所述單位時段中不同日期的信貸風險指標與所述基準值的偏差量,進行所述日期中的指標變動日期的確定;
31、根據所述評估目標時段中的指標變動日期的數量占比、與不同的指標穩定時段中的指標變動日期的數量占比,的比值確定所述客群的驚喜度。
32、進一步的技術方案在于,進行信貸風險指標的歸因結果的生成處理,具體包括:
33、將二叉樹葉子結點的的解釋度滿足解釋度閾值的客戶群體,作為所述信貸風險指標的輸出結果。
34、其他特征和優點將在隨后的說明書中闡述,本發明的目的和其他優點在說明書以及附圖中所特別指出的結構來實現和獲得。
35、為使本發明的上述目的、特征和優點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細說明如下。
1.一種基于二叉樹的信貸風險動態歸因分析方法,其特征在于,具體包括:
2.如權利要求1所述的基于二叉樹的信貸風險動態歸因分析方法,其特征在于,所述信貸產品類型根據信貸服務平臺對不同的群體開發的信貸產品進行確定。
3.如權利要求1所述的基于二叉樹的信貸風險動態歸因分析方法,其特征在于,將歷史信貸用戶劃分至多個客戶群體,具體包括:
4.如權利要求1所述的基于二叉樹的信貸風險動態歸因分析方法,其特征在于,所述信貸風險指標包括動支率、逾期率以及回收率。
5.如權利要求1所述的基于二叉樹的信貸風險動態歸因分析方法,其特征在于,所述信貸風險指標的指標穩定時段的確定的方法為:
6.如權利要求5所述的基于二叉樹的信貸風險動態歸因分析方法,其特征在于,所述指標變動日期是信貸指標與所述基準值的偏差量不在預設指標偏差量區間內的日期。
7.如權利要求1所述的基于二叉樹的信貸風險動態歸因分析方法,其特征在于,構建二叉樹,具體包括:
8.如權利要求7所述的基于二叉樹的信貸風險動態歸因分析方法,其特征在于,所述基礎信息包括職業、收入、地區、信貸額度、支用數據和客戶端。
9.如權利要求7所述的基于二叉樹的信貸風險動態歸因分析方法,其特征在于,所述驚喜度關聯群體的關聯指標的解釋度根據驚喜度關聯群體在所述評估目標時段的關聯指標與穩定指標時段的關聯指標的平均值的偏差量、和所述信貸風險指標在評估目標時段與穩定指標時段的關聯指標的平均值的偏差量的比值進行確定。
10.如權利要求7所述的基于二叉樹的信貸風險動態歸因分析方法,其特征在于,進行信貸風險指標的歸因結果的生成處理,具體包括: