本發明涉及網絡流量,特別涉及一種對抗性流量示例生成方法、系統和計算機設備。
背景技術:
1、能源互聯網在我國眾多行業加快部署,電力、煤炭、油氣、石化等重要能源領域的關鍵基礎設施、生產設備、控制系統將逐步聯網化、數字化、智能化,一旦受到惡意攻擊,將造成重大經濟損失,甚至威脅人身安全,給國家安全帶來重大安全風險。隨著網絡流量變得日益復雜,在能源互聯網領域,攻擊者利用對抗樣本攻擊技術對關鍵能源設備和網絡基礎設施實施破壞,為了防護能源互聯網安全,通過生成對抗性流量示例,對加密惡意流量檢測模型進行再訓練。
2、目前,針對能源互聯網的對抗性流量示例生成技術仍存在不足,現有的對抗性流量示例生成方法在對抗學習過程中,由于鑒別器過于強大,導致其快速識別生成器輸出與真實樣本之間的差異,從而迫使生成器不斷提高樣本質量,這種強烈的競爭,導致鑒別器陷入局部滯后,進而影響整個模型的訓練效果和收斂速度。
技術實現思路
1、本發明的主要目的為提供一種對抗性流量示例生成方法,旨在解決現有技術中的技術問題。
2、本發明提出一種對抗性流量示例生成方法,包括:
3、獲取隨機噪聲向量和真實流量樣本,并提取所述真實流量樣本的重要攻擊特征數據;
4、將所述隨機噪聲向量輸入至生成器中,得到正常流量特征數據;
5、將所述正常流量特征數據和重要攻擊特征數據進行特征拼接融合,得到偽造流量樣本;
6、對所述偽造對抗流量樣本進行對抗訓練,得到對抗流量樣本;
7、根據所述真實流量樣本和偽造流量樣本獲取梯度懲罰項;
8、根據所述偽造流量樣本、對抗流量樣本和真實流量樣本獲取總損失,并判斷所述總損失是否大于預設損失;
9、若所述總損失大于預設損失,則判定所述偽造流量樣本為真實流量;
10、若所述總損失不大于預設損失,則返回至將所述隨機噪聲向量輸入至生成器中,得到正常流量特征數據的步驟,直至總損失大于預設損失。
11、作為優選,所述的提取所述網絡流量的重要攻擊特征步驟,包括:
12、獲取所述網絡流量的所有流量特征,并根據所述所有流量特征獲取多個攻擊特征;
13、根據每個所述攻擊特征和所有流量特征獲取對應預測邊際貢獻;
14、將所有流量特征平均劃分為多個流量樣本子集,并根據每個所述攻擊特征和流量樣本子集獲取對應平均邊際貢獻;
15、根據多個所述平均邊際貢獻和預測邊際貢獻獲取每個攻擊特征的權重值;
16、將多個所述權重值按照大小順序進行排序,得到權重排序表;
17、設立分割值,并將所述權重排序表中大于分割值的權重值進行分割,得到重要權重值表;
18、將所述重要權重值表中每個權重值所對應的攻擊特征標記為重要攻擊特征。
19、作為優選,所述據每個所述攻擊特征和流量樣本子集獲取對應平均邊際貢獻的步驟,包括:
20、將每個所述流量樣本子集中輸入至梯度提升模型中,得到第一預測值;
21、將每個所述流量樣本子集中的特征數據替換為將每個所述攻擊特征,得到替換流量樣本;
22、將每個替換流量樣本輸入至梯度提升模型中,得到第二預測值;
23、根據每個所述第二預測值和第一預測值獲取對應邊際貢獻;
24、根據多個所述邊際貢獻計算平均邊際貢獻,其中計算公式為:
25、
26、其中,p(g)k表示第k個平均邊際貢獻,j(b)k表示第k個邊際貢獻,k表示邊際貢獻的序號,n表示邊際貢獻的數量。
27、作為優選,所述根據所述真實流量樣本和偽造流量樣本獲取梯度懲罰項的步驟,包括:
28、獲取隨機插值系數表,其中,所述隨機插值系數表包括多個按照大小順序依次排列的插值系數;
29、根據每個所述插值系數、真實流量樣本和偽造流量樣本計算對應插值樣本,其中,計算公式為:
30、c(yb)i=αi*z(y)+(1-αi)w(y);
31、其中,c(yb)i表示第i個插值樣本,αi表示第i個插值系數,i表示插值系數的序號,z(y)表示真實流量樣本,w(y)表示偽造流量樣本;
32、根據多個所述插值樣本的均值獲取插值期望值;
33、將每個所述插值樣本輸入至判別器中,得到對應插值輸出,并獲取每個于所述插值輸出相對于對應插值樣本的梯度;
34、對每個所述梯度進行l2范數的計算,得到梯度平方和;
35、根據所述插值期望值和多個梯度平方和計算梯度懲罰項,其中計算公式為:
36、
37、其中,t(c)表示梯度懲罰項,λ表示懲罰項的權重參數,c(q)表示插值期望值,表示第i個梯度,d(c(yb)i)表示第i個插值輸出,c(yb)i表示第i個插值樣本。
38、作為優選,所述根據所述偽造流量樣本、對抗流量樣本和真實流量樣本獲取總損失的步驟,包括:
39、根據所述偽造流量樣本獲取偽造樣本期望值,并根據所述偽造樣本期望值獲取偽造樣本損失;
40、對所述偽造對抗流量樣本進行對抗訓練,得到對抗流量樣本;
41、根據所述對抗流量樣本獲取對抗樣本期望值,根據所述真實流量樣本獲取真實樣本期望值;
42、根據所述對抗樣本期望值獲取對抗樣本損失,根據所述真實樣本期望值獲取真實樣本損失;
43、根據所述梯度懲罰項、真實樣本損失、偽造樣本損失和對抗樣本損失獲取總損失。
44、作為優選,所述根據所述對抗樣本期望值獲取對抗樣本損失,根據所述真實樣本期望值獲取真實樣本損失的步驟,包括:
45、獲取對抗流量樣本,并將所述對抗流量樣本輸入至判別器中,得到對抗樣本真實概率;
46、根據所述對抗樣本期望值和對抗樣本真實概率計算對抗樣本損失,其中,計算公式為:
47、d(y)=d(qw)*[log(1-d(yg))];
48、其中,d(y)表示對抗樣本損失,d(qw)表示對抗樣本期望值,d(yg)表示對抗樣本真實概率;
49、獲取真實流量樣本,并將所述真實流量樣本輸入至判別器中,得到真實樣本真實概率;
50、根據所述真實樣本期望值和真實樣本真實概率計算真實樣本損失,其中,計算公式為:
51、z(y)=z(qw)*logz(yg);
52、其中,z(y)表示真實樣本損失,z(qw)表示真實樣本期望值,z(yg)表示真實樣本真實概率。
53、本技術還提供一種對抗性流量示例生成系統,包括:
54、第一獲取模塊,用于獲取隨機噪聲向量和真實流量樣本,并提取所述真實流量樣本的重要攻擊特征數據;
55、輸入模塊,用于將所述隨機噪聲向量輸入至生成器中,得到正常流量特征數據;
56、拼接模塊,用于將所述正常流量特征數據和重要攻擊特征數據進行特征拼接融合,得到偽造流量樣本;
57、訓練模塊,用于對所述偽造對抗流量樣本進行對抗訓練,得到對抗流量樣本;
58、第二獲取模塊,用于根據所述真實流量樣本和偽造流量樣本獲取梯度懲罰項;
59、第三獲取模塊,用于根據所述偽造流量樣本、對抗流量樣本和真實流量樣本獲取總損失;
60、判斷模塊,用于判斷所述總損失是否大于預設損失;
61、若所述總損失大于預設損失,則判定所述偽造流量樣本為真實流量;
62、若所述總損失不大于預設損失,則返回至將所述隨機噪聲向量輸入至生成器中,得到正常流量特征數據的步驟,直至總損失大于預設損失。
63、作為優選,所述第一獲取模塊,包括:
64、第一獲取單元,用于獲取所述網絡流量的所有流量特征,并根據所述所有流量特征獲取多個攻擊特征;
65、第二獲取單元,用于根據每個所述攻擊特征和所有流量特征獲取對應預測邊際貢獻;
66、劃分單元,用于將所有流量特征平均劃分為多個流量樣本子集,并根據每個所述攻擊特征和流量樣本子集獲取對應平均邊際貢獻;
67、第三獲取單元,用于根據多個所述平均邊際貢獻和預測邊際貢獻獲取每個攻擊特征的權重值;
68、排序單元,用于將多個所述權重值按照大小順序進行排序,得到權重排序表;
69、分割單元,用于設立分割值,并將所述權重排序表中大于分割值的權重值進行分割,得到重要權重值表;
70、標記單元,用于將所述重要權重值表中每個權重值所對應的攻擊特征標記為重要攻擊特征。
71、本發明還提供了一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現上述對抗性流量示例生成方法的步驟。
72、本發明還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現上述對抗性流量示例生成方法的步驟。
73、本發明的有益效果為:本發明通過多項關鍵優化,顯著提升了能源互聯網中對抗性流量示例生成的效果,通過利用權重值算法對攻擊特征進行評估與篩選,保留了原始惡意行為的核心特征,增強了生成示例在真實能源互聯網場景中的適用性和真實性,通過對梯度進行懲罰,可以抑制鑒別器的過擬合,保持生成器與鑒別器之間的對抗平衡,避免一方過于強大或過于弱小,從而促進生成器和鑒別器之間的良性互動,能夠有效捕捉流量序列中的關鍵信息,進一步提升了生成對抗性流量示例的質量,加速了訓練的收斂過程,并提升了模型的穩定性,通過不斷調整生成器,確保偽造流量樣本與真實流量樣本之間的差異逐漸減小,從而使生成的樣本更符合真實網絡流量的特征,這種高保真度的對抗性流量示例能夠更真實地反映出原始攻擊行為的模式,通過這些優化措施,生成的對抗性流量示例不僅具有高偽裝性,還能夠保留原始攻擊行為,并通過再訓練有效提升對抗檢測性能,從而為能源互聯網中的網絡安全提供更強的保障,使得本發明具有較高的實際應用價值,并可為能源互聯網提供個性化、精準的網絡安全服務,具有廣闊的應用前景。