1.一種基于詞義聚合和語義分離技術的加密流量分類方法,其特征在于,包括以下步驟:
2.如權利要求1所述的方法,其特征在于,bert分詞器使用wordpiece分詞器。
3.如權利要求1所述的方法,其特征在于,流量編碼器選用預訓練的bert編碼器。
4.如權利要求1所述的方法,其特征在于,詞義聚合器利用bert分詞器保留的子詞長度信息來聚合隱藏狀態表示的詞義。
5.如權利要求1所述的方法,其特征在于,在提示模板的引導下將包級別的語義特征通過語義分離器進行語義分離的步驟包括:
6.如權利要求5所述的方法,其特征在于,將包級別的語義特征和提示的隱藏狀態表示一同進行激活處理的公式如下:
7.如權利要求5所述的方法,其特征在于,接利用殘差結構組合包級別的語義特征和對應的獨立隱藏狀態,然后進行平均池化處理,公式如下:
8.如權利要求1所述的方法,其特征在于,分類器基于多層感知器和sigmoid函數進行分類預測,公式如下:
9.如權利要求1或8所述的方法,其特征在于,訓練時使用如下交叉熵損失函數對模型進行優化:
10.一種基于詞義聚合和語義分離技術的加密流量分類系統,其特征在于,包括: