本發(fā)明涉及投資服務(wù),特別涉及一種企業(yè)風(fēng)險預(yù)警方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、在現(xiàn)代企業(yè)管理中,企業(yè)面臨著各種風(fēng)險,尤其是在法律和財務(wù)方面。在現(xiàn)有的風(fēng)險識別方案中,針對某一企業(yè)進行風(fēng)險預(yù)測時往往只依據(jù)該企業(yè)的大量相關(guān)數(shù)據(jù)進行預(yù)測,有時還需要依賴于人工的經(jīng)驗來判斷是否存在風(fēng)險,這樣一來將無法保障風(fēng)險預(yù)測的及時性以及準(zhǔn)確性,進一步可能導(dǎo)致企業(yè)的決策者無法及時采取措施應(yīng)對風(fēng)險并產(chǎn)生不必要的損失。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種企業(yè)風(fēng)險預(yù)警方法、裝置、設(shè)備及存儲介質(zhì),能夠有效地提高企業(yè)風(fēng)險預(yù)測的及時性、準(zhǔn)確性以及可信度,從而使得企業(yè)決策者能夠及時根據(jù)風(fēng)險預(yù)測結(jié)果提前采取措施來降低損失,進而提升了企業(yè)風(fēng)險管理的效率。其具體方案如下:
2、第一方面,本技術(shù)提供了一種企業(yè)風(fēng)險預(yù)警方法,應(yīng)用于企業(yè)風(fēng)控系統(tǒng),包括:
3、基于預(yù)設(shè)預(yù)數(shù)據(jù)處理對原始企業(yè)數(shù)據(jù)進行企業(yè)特征提取以及企業(yè)預(yù)測變量定義,并根據(jù)預(yù)設(shè)數(shù)值特征轉(zhuǎn)換規(guī)則對得到的企業(yè)特征以及企業(yè)預(yù)測變量進行處理,以得到目標(biāo)企業(yè)特征以及對應(yīng)的目標(biāo)預(yù)測變量;
4、基于所述目標(biāo)企業(yè)特征確定對應(yīng)的企業(yè)特征向量,并將所述企業(yè)特征向量以及對應(yīng)的所述目標(biāo)預(yù)測變量存儲至預(yù)設(shè)向量數(shù)據(jù)庫中;
5、通過從所述預(yù)設(shè)向量數(shù)據(jù)庫中提取數(shù)據(jù)并進行數(shù)據(jù)集劃分,以確定相應(yīng)的訓(xùn)練集以及測試集;
6、在基于隨機森林算法以及所述訓(xùn)練集進行機器學(xué)習(xí)模型訓(xùn)練時,通過計算與所述訓(xùn)練集中的各所述企業(yè)特征向量分別對應(yīng)的距離度量信息進行預(yù)設(shè)向量數(shù)據(jù)庫檢索,以便基于得到的檢索結(jié)果以及當(dāng)前機器學(xué)習(xí)模型確定對應(yīng)的風(fēng)險預(yù)測結(jié)果,以完成機器學(xué)習(xí)模型訓(xùn)練;
7、利用所述測試集對訓(xùn)練后的當(dāng)前機器學(xué)習(xí)模型進行機器學(xué)習(xí)模型測試,以在測試通過后,基于得到的目標(biāo)機器學(xué)習(xí)模型觸發(fā)企業(yè)風(fēng)險預(yù)警操作。
8、可選的,所述根據(jù)預(yù)設(shè)數(shù)值特征轉(zhuǎn)換規(guī)則對得到的企業(yè)特征以及企業(yè)預(yù)測變量進行處理,包括:
9、將企業(yè)特征中的成立日期轉(zhuǎn)換為企業(yè)成立年限,以得到對應(yīng)的第一目標(biāo)企業(yè)特征;
10、對所述企業(yè)特征中的注銷風(fēng)險參數(shù)以及得到的企業(yè)預(yù)測變量進行數(shù)值表示或二元變量表示,以得到對應(yīng)的第二目標(biāo)企業(yè)特征以及目標(biāo)預(yù)測變量;所述注銷風(fēng)險參數(shù)包括營業(yè)收入信息、負(fù)債率、市場競爭程度以及訴訟記錄,所述企業(yè)預(yù)測變量包括注銷變量與吊銷變量;
11、基于獨熱編碼對所述企業(yè)特征中的登記狀態(tài)信息與登記機關(guān)進行數(shù)值特征轉(zhuǎn)換,以確定對應(yīng)的第三目標(biāo)企業(yè)特征。
12、可選的,所述基于所述目標(biāo)企業(yè)特征確定對應(yīng)的企業(yè)特征向量,包括:
13、統(tǒng)計各企業(yè)的所述第一目標(biāo)企業(yè)特征、所述第二目標(biāo)企業(yè)特征以及所述第三目標(biāo)企業(yè)特征,并基于統(tǒng)計結(jié)果進行特征向量構(gòu)建,以確定與各所述企業(yè)分別對應(yīng)的企業(yè)特征向量。
14、可選的,所述基于隨機森林算法以及所述訓(xùn)練集進行機器學(xué)習(xí)模型訓(xùn)練,包括:
15、基于隨機森林算法、所述訓(xùn)練集以及當(dāng)前機器學(xué)習(xí)模型中的第一機器學(xué)習(xí)模型與第二機器學(xué)習(xí)模型分別進行企業(yè)注銷預(yù)測與企業(yè)吊銷預(yù)測,以完成與所述第一機器學(xué)習(xí)模型與所述第二機器學(xué)習(xí)模型分別對應(yīng)的機器學(xué)習(xí)模型訓(xùn)練操作。
16、可選的,所述通過計算與所述訓(xùn)練集中的各所述企業(yè)特征向量分別對應(yīng)的距離度量信息進行預(yù)設(shè)向量數(shù)據(jù)庫檢索,包括:
17、針對所述訓(xùn)練集中的任一所述企業(yè)特征向量,通過所述預(yù)設(shè)向量數(shù)據(jù)庫確定當(dāng)前企業(yè)特征向量與數(shù)據(jù)庫中的各所述企業(yè)特征向量之間的余弦相似度以及歐氏距離,以確定與當(dāng)前企業(yè)特征向量對應(yīng)的距離度量信息;
18、基于所述距離度量信息對所述預(yù)設(shè)向量數(shù)據(jù)庫進行向量檢索,以得到與當(dāng)前企業(yè)特征向量對應(yīng)的檢索結(jié)果。
19、可選的,所述基于得到的檢索結(jié)果以及當(dāng)前機器學(xué)習(xí)模型確定對應(yīng)的風(fēng)險預(yù)測結(jié)果,包括:
20、基于所述檢索結(jié)果對當(dāng)前企業(yè)特征向量進行特征融合,以得到融合后特征向量;
21、利用當(dāng)前機器學(xué)習(xí)模型與所述融合后特征向量進行風(fēng)險預(yù)測,以確定與當(dāng)前企業(yè)特征向量對應(yīng)的風(fēng)險預(yù)測結(jié)果;所述風(fēng)險預(yù)測結(jié)果為對應(yīng)的所述目標(biāo)預(yù)測變量的預(yù)測值。
22、可選的,所述利用所述測試集對訓(xùn)練后的當(dāng)前機器學(xué)習(xí)模型進行機器學(xué)習(xí)模型測試,包括:
23、利用所述測試集以及訓(xùn)練后的當(dāng)前機器學(xué)習(xí)模型進行機器學(xué)習(xí)模型測試,并基于得到的測試結(jié)果進行企業(yè)特征重要性分析、機器學(xué)習(xí)模型性能評估以及混淆矩陣構(gòu)建,以確定所述訓(xùn)練后的當(dāng)前機器學(xué)習(xí)模型是否通過測試。
24、第二方面,本技術(shù)提供了一種企業(yè)風(fēng)險預(yù)警裝置,應(yīng)用于企業(yè)風(fēng)控系統(tǒng),包括:
25、數(shù)據(jù)預(yù)處理模塊,用于基于預(yù)設(shè)預(yù)數(shù)據(jù)處理對原始企業(yè)數(shù)據(jù)進行企業(yè)特征提取以及企業(yè)預(yù)測變量定義,并根據(jù)預(yù)設(shè)數(shù)值特征轉(zhuǎn)換規(guī)則對得到的企業(yè)特征以及企業(yè)預(yù)測變量進行處理,以得到目標(biāo)企業(yè)特征以及對應(yīng)的目標(biāo)預(yù)測變量;
26、向量存儲模塊,用于基于所述目標(biāo)企業(yè)特征確定對應(yīng)的企業(yè)特征向量,并將所述企業(yè)特征向量以及對應(yīng)的所述目標(biāo)預(yù)測變量存儲至預(yù)設(shè)向量數(shù)據(jù)庫中;
27、數(shù)據(jù)提取模塊,用于通過從所述預(yù)設(shè)向量數(shù)據(jù)庫中提取數(shù)據(jù)并進行數(shù)據(jù)集劃分,以確定相應(yīng)的訓(xùn)練集以及測試集;
28、機器學(xué)習(xí)模型訓(xùn)練模塊,用于在基于隨機森林算法以及所述訓(xùn)練集進行機器學(xué)習(xí)模型訓(xùn)練時,通過計算與所述訓(xùn)練集中的各所述企業(yè)特征向量分別對應(yīng)的距離度量信息進行預(yù)設(shè)向量數(shù)據(jù)庫檢索,以便基于得到的檢索結(jié)果以及當(dāng)前機器學(xué)習(xí)模型確定對應(yīng)的風(fēng)險預(yù)測結(jié)果,以完成機器學(xué)習(xí)模型訓(xùn)練;
29、風(fēng)險預(yù)警模塊,用于利用所述測試集對訓(xùn)練后的當(dāng)前機器學(xué)習(xí)模型進行機器學(xué)習(xí)模型測試,以在測試通過后,基于得到的目標(biāo)機器學(xué)習(xí)模型觸發(fā)企業(yè)風(fēng)險預(yù)警操作。
30、第三方面,本技術(shù)提供了一種電子設(shè)備,包括:
31、存儲器,用于保存計算機程序;
32、處理器,用于執(zhí)行所述計算機程序,以實現(xiàn)前述的企業(yè)風(fēng)險預(yù)警方法的步驟。
33、第四方面,本技術(shù)提供了一種計算機可讀存儲介質(zhì),用于保存計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)前述的企業(yè)風(fēng)險預(yù)警方法的步驟。
34、可見,本技術(shù)中,通過企業(yè)風(fēng)控系統(tǒng),首先基于預(yù)設(shè)預(yù)數(shù)據(jù)處理對原始企業(yè)數(shù)據(jù)進行企業(yè)特征提取以及企業(yè)預(yù)測變量定義,并根據(jù)預(yù)設(shè)數(shù)值特征轉(zhuǎn)換規(guī)則對得到的企業(yè)特征以及企業(yè)預(yù)測變量進行處理,以得到目標(biāo)企業(yè)特征以及對應(yīng)的目標(biāo)預(yù)測變量;基于所述目標(biāo)企業(yè)特征確定對應(yīng)的企業(yè)特征向量,并將所述企業(yè)特征向量以及對應(yīng)的所述目標(biāo)預(yù)測變量存儲至預(yù)設(shè)向量數(shù)據(jù)庫中;通過從所述預(yù)設(shè)向量數(shù)據(jù)庫中提取數(shù)據(jù)并進行數(shù)據(jù)集劃分,以確定相應(yīng)的訓(xùn)練集以及測試集;在基于隨機森林算法以及所述訓(xùn)練集進行機器學(xué)習(xí)模型訓(xùn)練時,通過計算與所述訓(xùn)練集中的各所述企業(yè)特征向量分別對應(yīng)的距離度量信息進行預(yù)設(shè)向量數(shù)據(jù)庫檢索,以便基于得到的檢索結(jié)果以及當(dāng)前機器學(xué)習(xí)模型確定對應(yīng)的風(fēng)險預(yù)測結(jié)果,以完成機器學(xué)習(xí)模型訓(xùn)練;利用所述測試集對訓(xùn)練后的當(dāng)前機器學(xué)習(xí)模型進行機器學(xué)習(xí)模型測試,以在測試通過后,基于得到的目標(biāo)機器學(xué)習(xí)模型觸發(fā)企業(yè)風(fēng)險預(yù)警操作。也即,本技術(shù)中通過企業(yè)風(fēng)控系統(tǒng)采集原始企業(yè)數(shù)據(jù),提取企業(yè)特征、定義預(yù)測變量,以確定企業(yè)的特征向量并存儲至預(yù)設(shè)向量數(shù)據(jù)庫。然后利用預(yù)設(shè)向量數(shù)據(jù)庫確定訓(xùn)練集,并在結(jié)合隨機森林算法進行機器學(xué)習(xí)模型訓(xùn)練時,基于訓(xùn)練集中的特征向量的距離度量信息進行數(shù)據(jù)庫檢索,以利用當(dāng)前機器學(xué)習(xí)模型完成訓(xùn)練。然后利用測試集測試訓(xùn)練后的當(dāng)前機器學(xué)習(xí)模型,以在測試通過后,得到目標(biāo)機器學(xué)習(xí)模型,并觸發(fā)企業(yè)風(fēng)險預(yù)警操作。這樣一來,能夠有效地提高企業(yè)風(fēng)險預(yù)測的及時性、準(zhǔn)確性以及可信度,從而使得企業(yè)決策者能夠及時根據(jù)風(fēng)險預(yù)測結(jié)果提前采取措施來降低損失,進而提升了企業(yè)風(fēng)險管理的效率。