本申請涉及互聯網,具體而言,涉及一種異常信息的識別方法、裝置、計算機可讀介質及電子設備。
背景技術:
1、目前,識別異常信息的方式主要是通過算法或者模型對信息本身進行識別,然而,這種方式只能對已知異常類型的信息進行識別,無法感知和識別出未知異常類型的信息,導致了異常信息識別的時效性較低且覆蓋率較低。
技術實現思路
1、本申請的實施例提供了一種異常信息的識別方法、裝置、計算機可讀介質及電子設備,進而至少在一定程度上可以及時感知和識別出未知異常類型的信息,提高異常信息識別的時效性和覆蓋率。
2、本申請的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本申請的實踐而習得。
3、根據本申請實施例的一個方面,提供了一種異常信息的識別方法,所述方法包括:獲取目標信息相關方的特征信息;根據所述特征信息確定與多個異常信息識別特征分別對應的特征值;將與各異常信息識別特征分別對應的特征值輸入至預先訓練得到的信用評分模型,通過所述信用評分模型預測得到所述目標信息相關方的信用評分;若根據所述信用評分確定所述目標信息相關方屬于指定信用類別,則從與所述目標信息相關方相關的信息中過濾出目標異常信息,其中,屬于指定信用類別的信息相關方的信用評分低于屬于其他信用類別的信息相關方的信用評分;根據所述目標異常信息訓練得到目標異常信息識別模型,并基于所述目標異常信息識別模型進行異常信息識別。
4、根據本申請實施例的一個方面,提供了一種異常信息的識別裝置,所述裝置包括:獲取單元,用于獲取目標信息相關方的特征信息;確定單元,用于根據所述特征信息確定與多個異常信息識別特征分別對應的特征值;輸入單元,用于將與各異常信息識別特征分別對應的特征值輸入至預先訓練得到的信用評分模型,通過所述信用評分模型預測得到所述目標信息相關方的信用評分;過濾單元,用于若根據所述信用評分確定所述目標信息相關方屬于指定信用類別,則從與所述目標信息相關方相關的信息中過濾出目標異常信息,其中,屬于指定信用類別的信息相關方的信用評分低于屬于其他信用類別的信息相關方的信用評分;訓練和識別單元,用于根據所述目標異常信息訓練得到目標異常信息識別模型,并基于所述目標異常信息識別模型進行異常信息識別。
5、在本申請的一些實施例中,基于前述方案,所述裝置還包括目標信息相關方確定單元;在獲取目標信息相關方的特征信息之前,所述目標信息相關方確定單元用于:基于原始異常信息識別模型識別在預定時間區間內發布的至少一個異常信息;確定各所述異常信息的信息相關方,作為所述目標信息相關方;所述訓練和識別單元配置為:以所述目標異常信息作為訓練樣本,基于所述訓練樣本對所述原始異常信息識別模型進行訓練,得到所述目標異常信息識別模型。
6、在本申請的一些實施例中,基于前述方案,所述訓練和識別單元配置為:基于所述目標異常信息識別模型對在下一預定時間區間內發布的異常信息進行識別,并基于識別出的異常信息重新執行確定各所述異常信息的信息相關方的步驟及后續步驟。
7、在本申請的一些實施例中,基于前述方案,所述目標異常信息的異常類型與各所述異常信息的異常類型均不相同。
8、在本申請的一些實施例中,基于前述方案,所述裝置還包括信用評分模型訓練單元;在根據所述特征信息確定與多個異常信息識別特征分別對應的特征值之前,所述信用評分模型訓練單元配置為:獲取多個信息相關方的特征信息和各信息相關方的信用標簽;針對每一信息相關方,根據所述信息相關方的特征信息確定所述信息相關方的與多個特征分別對應的特征值;根據各信息相關方的特征值和信用標簽從所述多個特征中篩選出所述多個異常信息識別特征;根據各信息相關方的與異常信息識別特征對應的特征值和各信息相關方的信用標簽構建訓練樣本集;基于所述訓練樣本集訓練得到信用評分模型。
9、在本申請的一些實施例中,基于前述方案,所述過濾單元配置為:將與所述目標信息相關方相關的信息分別與預設的關鍵詞典進行匹配;根據匹配結果從與所述目標信息相關方相關的信息中過濾出目標異常信息。
10、在本申請的一些實施例中,基于前述方案,所述信用評分模型是基于極端梯度提升模型訓練得到的,所述極端梯度提升模型通過如下方式進行樹的分裂:針對每個異常信息識別特征,基于訓練樣本集確定所述異常信息識別特征的每個分割點的增益值,并選取所述增益值最大的分割點作為所述異常信息識別特征的最佳分割點;根據各異常信息識別特征的最佳分割點進行樹的分裂。
11、在本申請的一些實施例中,基于前述方案,所述信息為廣告,所述目標信息相關方為目標廣告的發布者或者目標廣告所傳播的產品的生產者。
12、在本申請的一些實施例中,基于前述方案,所述異常信息識別特征屬于以下中的一類:與在管理部門記錄的狀態相關的特征、與歷史異常統計數據相關的特征、與用于引導廣告點擊者執行特定行動的網頁相關的特征。
13、根據本申請實施例的一個方面,提供了一種計算機可讀介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現如上述實施例中所述的異常信息的識別方法。
14、根據本申請實施例的一個方面,提供了一種電子設備,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當所述一個或多個程序被所述一個或多個處理器執行時,使得所述一個或多個處理器實現如上述實施例中所述的異常信息的識別方法。
15、根據本申請實施例的一個方面,提供了一種計算機程序產品,所述計算機程序產品包括計算機指令,所述計算機指令存儲在計算機可讀存儲介質中,計算機設備的處理器從所述計算機可讀存儲介質讀取所述計算機指令,所述處理器執行所述計算機指令,使得所述計算機設備執行如上述實施例中所述的異常信息的識別方法。
16、在本申請的一些實施例所提供的技術方案中,通過在獲取到目標信息相關方的特征信息之后,對應確定出多個異常信息識別特征分別對應的特征值,再將與多個異常信息識別特征分別對應的特征值輸入至信用評分模型,得到該信用評分模型輸出的信用評分,從而實現對目標信息相關方的信用評分的預測,然后,通過根據信用評分確定目標信息相關方的信用評分較低的情況下,從與所述目標信息相關方相關的信息中過濾出目標異常信息,并在利用目標異常信息繼續訓練出目標異常信息識別模型之后,利用目標異常信息識別模型進行異常信息識別。因此,本申請實施例的方案巧妙地從目標信息相關方的信用評分的角度對信用評分較低的目標信息相關方對應的信息進行監測,由于目標異常信息并不是通過傳統的異常信息識別模型識別得到的,而是通過過濾得到的,因此,其很可能為未知異常類型的信息,因此,可以快速為未知異常類型的識別提供訓練樣本,在此基礎上,通過根據目標異常信息訓練得到目標異常信息識別模型,在基于目標異常信息識別模型進行異常信息識別時可以及時感知和識別出未知異常類型的信息,提高了異常信息識別的時效性和覆蓋率。
17、應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本申請。
1.一種異常信息的識別方法,其特征在于,所述方法包括:
2.根據權利要求1所述的異常信息的識別方法,其特征在于,在獲取目標信息相關方的特征信息之前,所述方法還包括:
3.根據權利要求2所述的異常信息的識別方法,其特征在于,所述基于所述目標異常信息識別模型進行異常信息識別,包括:
4.根據權利要求2所述的異常信息的識別方法,其特征在于,所述目標異常信息的異常類型與各所述異常信息的異常類型均不相同。
5.根據權利要求1所述的異常信息的識別方法,其特征在于,在根據所述特征信息確定與多個異常信息識別特征分別對應的特征值之前,所述方法還包括:
6.根據權利要求1所述的異常信息的識別方法,其特征在于,所述從與所述目標信息相關方相關的信息中過濾出目標異常信息,包括:
7.根據權利要求1所述的異常信息的識別方法,其特征在于,所述信用評分模型是基于極端梯度提升模型訓練得到的,所述極端梯度提升模型通過如下方式進行樹的分裂:
8.根據權利要求1-7任意一項所述的異常信息的識別方法,其特征在于,所述信息為廣告,所述目標信息相關方為目標廣告的發布者或者目標廣告所傳播的產品的生產者。
9.根據權利要求8所述的異常信息的識別方法,其特征在于,所述異常信息識別特征屬于以下中的一類:與在管理部門記錄的狀態相關的特征、與歷史異常統計數據相關的特征、與用于引導廣告點擊者執行特定行動的網頁相關的特征。
10.一種異常信息的識別裝置,其特征在于,所述裝置包括:
11.一種計算機可讀介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至9中任一項所述的異常信息的識別方法。
12.一種電子設備,其特征在于,包括:
13.一種計算機程序產品,其特征在于,所述計算機程序產品包括計算機指令,所述計算機指令存儲在計算機可讀存儲介質中,計算機設備的處理器從所述計算機可讀存儲介質讀取所述計算機指令,所述處理器執行所述計算機指令,使得所述計算機設備執行如權利要求1至9中任一項所述的異常信息的識別方法。