1.一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:所述方法包括以下步驟:
2.根據權利要求1所述的一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:在步驟s1中,對于惡意詞典w,首先收集的惡意詞匯,對收集的惡意詞匯進行處理,形成惡意詞典:
3.根據權利要求2所述的一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:在步驟s2中,建立融合惡意詞典與bert預訓練模型的惡意url文本內容檢測網絡,其中,文本內容檢測網絡包括輸入層、bert預訓練模型、惡意值計算模塊、多尺度卷積模塊以及softmax分類器,輸入層輸入文本內容,采用bert預訓練模型對文本進行特征提取,惡意值計算模塊用于計算惡意權重向量,多尺度卷積模塊,提取不同尺度下的特征,并通過softmax輸出最終預測的惡意分類結果。
4.根據權利要求3所述的一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:在步驟s3中,bert預訓練模型按照以下步驟對輸入的文本內容進行特征提?。?/p>
5.根據權利要求4所述的一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:在步驟s4中,惡意值計算模塊按照以下步驟計算惡意權重向量:
6.根據權利要求5所述的一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:在步驟s5中,多尺度卷積模塊的處理過程包括:
7.根據權利要求6所述的一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:在步驟s51中,首先根據通道數自適應計算一維卷積的核大小k,核大小k的計算公式為:
8.根據權利要求6所述的一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:在步驟s52中,最終的特征向量ac表示為:
9.根據權利要求6所述的一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:在步驟s53中,多頭自注意力計算為:
10.根據權利要求6所述的一種融合惡意詞典與bert預訓練模型的惡意url檢測方法,其特征在于:在步驟s54中,特征向量m的第i個類別的得分zi為: