麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

惡意論壇的識別方法及裝置制造方法

文檔序號:8004962閱讀:324來源:國知局
惡意論壇的識別方法及裝置制造方法
【專利摘要】本發明公開了一種惡意論壇的識別方法及裝置。該方法包括獲取待訪問論壇的論壇名稱和該論壇的版塊名稱;將論壇名稱和版塊名稱分別與預存關鍵詞庫中的惡意關鍵詞進行匹配;若匹配成功,則識別該論壇為惡意論壇。通過本發明,無論對已知的惡意論壇或未知的惡意論壇,均能夠對其進行識別,克服了現有技術中只能對已知的惡意論壇進行識別的缺陷。
【專利說明】惡意論壇的識別方法及裝置
【技術領域】
[0001]本發明涉及互聯網領域,特別是涉及一種惡意論壇的識別方法及裝置。
【背景技術】
[0002]惡意論壇是指故意在計算機系統上執行惡意任務的病毒、蠕蟲和特洛伊木馬等的非法論壇。這類論壇通常都有一個共同特點,他們通常情況下是以某種頁面形式讓人們正常瀏覽頁面內容,同時非法獲取用戶計算機中的各種數據。現如今,惡意論壇嚴重地影響用戶的網絡環境,所以,對惡意論壇的識別也已經成為保證網絡安全的重要工作之一,目前,通常采用如下兩種技術對惡意論壇進行識別。
[0003]第一種,在防火墻的內存中存儲有惡意論壇的IP (Internet Protocol,網絡之間互連的協議)地址以及符合該IP地址的所有URL (Uniform Resource Locator,統一資源定位符)的對應關系。當獲取到用戶訪問某論壇的URL請求時,還要獲取該論壇的IP地址,根據該論壇的IP地址在防火墻內存中查找該IP地址對應的所有URL,并將論壇URL與防火墻內存中該IP地址對應的所有URL進行對比,對比成功則說明該論壇為惡意論壇。
[0004]第二種,將用戶想要訪問的論壇的URL與惡意關鍵詞列表頁匹配,在匹配結果中選取基準關鍵字,并對這組關鍵字進行順序標號標識,若該組關鍵字的順序號標識數目與保存的惡意關鍵詞表中的該組關鍵字的順序號標識數目一致,則說明該論壇為惡意論壇。
[0005]上述兩種技術均為基于URL對比的方式,這就需要預先獲取到惡意論壇的URL并存儲,因此僅能夠對已知的惡意論壇進行識別和過濾,對未知的惡意論壇無法進行識別和處理。

【發明內容】

[0006]鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的惡意論壇的識別方法及裝置。
[0007]本發明提供了一種惡意論壇的識別方法,包括:
[0008]獲取待訪問論壇的論壇名稱和論壇的版塊名稱;
[0009]將論壇名稱和版塊名稱分別與預存關鍵詞庫中的惡意關鍵詞進行匹配;
[0010]若匹配成功,則識別論壇為惡意論壇。
[0011]進一步地,在識別論壇為惡意論壇之后,還包括:
[0012]收集所有已知惡意論壇的論壇名稱和版塊名稱并進行處理,得到論壇名稱列表和版塊名稱列表;
[0013]對論壇名稱列表和版塊名稱列表進行熱點聚合,得到新惡意關鍵詞,將新惡意關鍵詞添加到關鍵詞庫中。
[0014]進一步地,對論壇名稱列表和版塊名稱列表進行熱點聚合,得到新惡意關鍵詞,包括:
[0015]根據最長公共子序列LCS算法,生成與論壇名稱列表和版塊名稱列表各自對應的熱點詞表;
[0016]根據詞語出現頻率在各個熱點詞表中選擇熱點關鍵詞;
[0017]將獲取的各個熱點關鍵詞進行合并,作為新惡意關鍵詞。
[0018]進一步地,各個熱點詞表的生成方式包括:
[0019]對于論壇名稱列表和版塊名稱列表而言,
[0020]采用最長公共子序列LCS算法對其中包含的每兩個詞進行匹配;
[0021]獲取每兩個詞之間的最長公共子序列,作為熱點關鍵詞;
[0022]將獲取的所有熱點關鍵詞進行組合,得到與其對應的熱點詞表。
[0023]進一步地,根據詞語出現頻率在各個熱點詞表中選擇熱點關鍵詞,包括:
[0024]根據預設規則分別對各個熱點詞表中的熱點關鍵詞進行篩選;
[0025]在篩選后的各個熱點詞表中選擇出現頻率由高到低的預設個數熱點關鍵詞。
[0026]進一步地,根據預設規則分別對各個熱點詞表中的熱點關鍵詞進行篩選,包括:
[0027]對各個熱點詞表進行常用語去除處理,其中,常用語為使用頻率超過預設次數的詞語;
[0028]判斷處理后的各個熱點詞表中的熱點關鍵詞所對應的論壇是否為惡意論壇;
[0029]若是,保留該關鍵詞;
[0030]若否,去除該關鍵詞。
[0031]進一步地,收集所有已知惡意論壇的論壇名稱和版塊名稱并進行處理,包括:
[0032]收集所有已知惡意論壇的論壇名稱和版塊名稱并存入各自對應的預處理庫;
[0033]對各個預處理庫中、來自同一網絡之間互連協議IP地址的名稱進行消重處理。
[0034]進一步地,對論壇名稱列表和版塊名稱列表進行熱點聚合,包括:
[0035]每隔預設時間對論壇名稱列表和版塊名稱列表進行熱點聚合。
[0036]進一步地,惡意關鍵詞包括論is名稱關鍵詞和版塊名稱關鍵詞;
[0037]將論壇名稱以及版塊名稱分別與預存關鍵詞庫中的惡意關鍵詞進行匹配,包括:
[0038]將論壇名稱與論壇名稱關鍵詞匹配,將版塊名稱與版塊名稱關鍵詞匹配;
[0039]當論壇名稱與論壇名稱關鍵詞匹配,且版塊名稱與版塊名稱關鍵詞匹配時,則確認匹配成功;
[0040]當論壇名稱與論壇名稱關鍵詞匹配,且版塊名稱關鍵詞為空時,則確認匹配成功;
[0041]當版塊名稱與版塊名稱關鍵詞匹配,且論壇名稱關鍵詞為空時,則確認匹配成功;
[0042]否則,確認匹配失敗,則論壇為非惡意論壇。
[0043]本發明還提供了一種惡意論壇的識別裝置,包括:
[0044]存儲器,配置為存儲包含惡意關鍵詞的關鍵詞庫;
[0045]用戶輸入接口,配置為接收用戶訪問論壇的指示;
[0046]名稱獲取器,配置為獲取待訪問論壇的論壇名稱和論壇的版塊名稱;
[0047]名稱匹配器,配置為讀取存儲器和名稱獲取器,將論壇名稱和版塊名稱分別與關鍵詞庫中的惡意關鍵詞進行匹配;
[0048]惡意論壇識別器,配置為若名稱匹配器確認匹配成功,則識別論壇為惡意論壇。[0049]進一步地,上述裝置還包括:
[0050]名稱處理器,配置為收集所有已知惡意論壇的論壇名稱和版塊名稱并進行處理,得到論壇名稱列表和版塊名稱列表;
[0051]聚合生成器,配置為對名稱處理器得到的論壇名稱列表和版塊名稱列表進行熱點聚合,得到新惡意關鍵詞,將新惡意關鍵詞存儲到存儲器的關鍵詞庫中。
[0052]進一步地,聚合生成器包括:
[0053]詞表生成單元,配置為根據最長公共子序列LCS算法,生成與論壇名稱列表和版塊名稱列表各自對應的熱點詞表;
[0054]選取單元,配置為根據詞語出現頻率在詞表生成單元生成的各個熱點詞表中選擇熱點關鍵詞;
[0055]合并單元,配置為將選取單元獲取的各個熱點關鍵詞進行合并,作為新惡意關鍵詞,將新惡意關鍵詞存儲到存儲器的關鍵詞庫中。
[0056]進一步地,詞表生成單元還配置為按照如下方式生成各個熱點詞表:
[0057]對于論壇名稱列表和版塊名稱列表而言,
[0058]采用最長公共子序列LCS算法對其中包含的每兩個詞進行匹配;
[0059]獲取每兩個詞之間的最長公共子序列,作為熱點關鍵詞;
[0060]將獲取的所有熱點關鍵詞進行組合,得到與其對應的熱點詞表。
[0061]進一步地,選取單元配置為按照如下方式在各個熱點詞表中選擇熱點關鍵詞:
[0062]根據預設規則分別對詞表生成單元生成的各個熱點詞表中的熱點關鍵詞進行篩選;
[0063]在篩選后的各個熱點詞表中選擇出現頻率由高到低的預設個數熱點關鍵詞。
[0064]進一步地,選取單元還配置為按照如下方式對各個熱點詞表中的熱點關鍵詞進行篩選:
[0065]對詞表生成單元生成的各個熱點詞表進行常用語去除處理,其中,常用語為使用頻率超過預設次數的詞語;
[0066]判斷處理后的各個熱點詞表中的熱點關鍵詞所對應的論壇是否為惡意論壇;
[0067]若是,保留該關鍵詞;
[0068]若否,去除該關鍵詞。
[0069]進一步地,名稱處理器配置為:
[0070]收集所有已知惡意論壇的論壇名稱和版塊名稱并存入各自對應的預處理庫;
[0071]對各個預處理庫中、來自同一網絡之間互連協議IP地址的名稱進行消重處理,得到論壇名稱列表和版塊名稱列表。
[0072]進一步地,聚合生成器還配置為每隔預設時間對論壇名稱列表和版塊名稱列表進行熱點聚合,得到新惡意關鍵詞,將新惡意關鍵詞存儲到存儲器的關鍵詞庫中。
[0073]進一步地,存儲器中的惡意關鍵詞包括論壇名稱關鍵詞和版塊名稱關鍵詞;
[0074]名稱匹配器配置為按照如下方式執行匹配操作:
[0075]將論壇名稱與論壇名稱關鍵詞匹配,將版塊名稱與版塊名稱關鍵詞匹配;
[0076]當論壇名稱與論壇名稱關鍵詞匹配,且版塊名稱與版塊名稱關鍵詞匹配時,則確認匹配成功;[0077]當論壇名稱與論壇名稱關鍵詞匹配,且版塊名稱關鍵詞為空時,則確認匹配成功;
[0078]當版塊名稱與版塊名稱關鍵詞匹配,且論壇名稱關鍵詞為空時,則確認匹配成功;
[0079]否則,確認匹配失敗,則論壇為非惡意論壇。
[0080]本發明提供了一種惡意論壇的識別方法及裝置,通過本發明,使終端能夠識別出與關鍵詞庫中惡意關鍵詞匹配的論壇為惡意論壇。在每次識別惡意論壇之后,還會進行熱點聚合生成新惡意關鍵詞,并將其存入關鍵詞庫。新惡意關鍵詞的添加,豐富了關鍵詞庫,從而使得本發明能夠識別出更多的惡意論壇。
[0081]可見,對于本發明,無論待識別的論壇為已知論壇還是未知論壇,只要其論壇名稱和版塊名稱能夠與關鍵詞庫中的惡意關鍵詞相匹配,就能夠對其進行識別,克服了現有技術中只能對已知的惡意論壇進行識別的缺陷。進一步地,現有技術中,當惡意論壇的URL的存儲數量較大時,會導致查找效率降低,而本發明在對惡意論壇進行識別時,以論壇的論壇名稱和版塊名稱為單位進行處理,從而提高了惡意論壇的識別效率。另外,由于現有技術中惡意論壇的IP地址經常發生變化,而當原IP地址已經為正常論壇所用時,就易導致將原IP地址對應的論壇識別為惡意論壇,而本發明在識別惡意論壇時,僅使用論壇名稱和版塊名稱即可,從而能夠有效地避免了誤將正常論壇識別為惡意論壇。
[0082]上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的【具體實施方式】。
[0083]根據下文結合附圖對本發明具體實施例的詳細描述,本領域技術人員將會更加明了本發明的上述以及其他目的、優點和特征。
【專利附圖】

【附圖說明】
[0084]通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本發明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0085]圖1是根據本發明一個實施例的一種惡意論壇的識別方法流程圖;
[0086]圖2是根據本發明一個實施例的熱點聚合方法流程圖;
[0087]圖3是根據本發明一個實施例的一種惡意論壇的識別裝置框圖。
【具體實施方式】
[0088]在此提供的算法和顯示不與任何特定計算機、虛擬系統或者其它設備固有相關。各種通用系統也可以與基于在此的示教一起使用。根據上面的描述,構造這類系統所要求的結構是顯而易見的。此外,本發明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現在此描述的本發明的內容,并且上面對特定語言所做的描述是為了披露本發明的最佳實施方式。
[0089]相關技術提及,在識別惡意論壇時,均為基于URL對比的方式來識別待訪問的論壇是否為惡意論壇,因此,僅能夠對已知的惡意論壇進行識別和處理,對未知的惡意論壇無法進行識別和處理。為了解決上述技術問題,本發明實施例提供了一種惡意論壇的識別方法及裝置。
[0090]下面結合附圖,對本發明實施例提供的一種惡意論壇的識別方法及裝置進行詳細地說明。本發明實施例對具有瀏覽論壇功能的終端進行了改進,例如,本實施例中的終端可以為PC (Personal Computer,個人計算機)、手機、手持電腦等用戶終端設備。
[0091]實施例一
[0092]本實施例為本發明的一個具體應用場景,通過本實施例,能夠更加清楚、具體地闡述本發明所提供的方法。
[0093]圖1示出了根據本發明一個實施例的一種惡意論壇的識別方法流程圖。該方法具體包括步驟SlOl至S106。
[0094]S101,獲取用戶待訪問論壇的論壇名稱和版塊名稱。
[0095]本實施例中,論壇名稱和版塊名稱為論壇指示了論壇的所包括的內容。開發者在為論壇名稱命名時,一般情況會根據內容來對其進行命名,每個論壇只有一個名稱。但是,論壇中的內容是以版塊的形式進行劃分的,一個論壇中通常至少要包括一個版塊,每個版塊包含了不同話題的內容,所以,版塊名稱可以根據所涉及的話題內容來設定。例如:名稱為“攝影帝國”的論壇,其在版塊劃分和命名時,可以按照攝影的場景來進行,如版塊名稱具體可以為“繽紛世界”、“海底世界”等,當用戶看到不同的版塊名稱時,就能夠快速地得知其包含的話題,便于用戶選擇自己感興趣的版塊進行瀏覽。
[0096]在獲取到該論壇的論壇名稱和版塊名稱之后,執行步驟S102。在步驟S102中,將獲取的論壇名稱和版塊名稱分別與預存關鍵詞庫中的惡意關鍵詞進行匹配,并確認是否匹配成功。若確認匹配成功,則觸發步驟S103將該論壇識別為惡意論壇的操作,若匹配不成功,則觸發步驟S104將該論壇識別為非惡意論壇的操作。
[0097]可選地,為了實現本步驟S102,需要在終端中預先存儲一個關鍵詞庫,該關鍵詞庫中包括了已經收集的關于惡意論壇的惡意關鍵詞。需要說明的是,關鍵詞庫中包括的惡意關鍵詞為兩類,其中一類為論壇名稱關鍵詞,用于與獲取的論壇名稱進行匹配,另一類為版塊名稱關鍵詞,用于與獲取的版塊名稱進行匹配。其中,論壇名稱關鍵詞為與預先統計的惡意論壇名稱相關的詞,版塊名稱關鍵詞為與預先統計的惡意論壇的版塊名稱相關的詞,關鍵詞庫中的論壇名稱關鍵詞和版塊名稱關鍵詞以詞組的形式存儲。可選地,在本實施例中,關鍵詞庫中每組惡意關鍵詞的存儲結構如下表一所不。
[0098]表一
[0099]
【權利要求】
1.一種惡意論壇的識別方法,包括: 獲取待訪問論壇的論壇名稱和所述論壇的版塊名稱; 將所述論壇名稱和所述版塊名稱分別與預存關鍵詞庫中的惡意關鍵詞進行匹配; 若匹配成功,則識別所述論壇為惡意論壇。
2.根據權利要求1所述的方法,其中,在識別所述論壇為惡意論壇之后,還包括: 收集所有已知惡意論壇的論壇名稱和版塊名稱并進行處理,得到論壇名稱列表和版塊名稱列表; 對所述論壇名稱列表和所述版塊名稱列表進行熱點聚合,得到新惡意關鍵詞,將所述新惡意關鍵詞添加到所述關鍵詞庫中。
3.根據權利要求1或2所述的方法,其中,所述對所述論壇名稱列表和所述版塊名稱列表進行熱點聚合,得到新惡意關鍵詞,包括: 根據最長公共子序列LCS算法,生成與所述論壇名稱列表和所述版塊名稱列表各自對應的熱點詞表; 根據詞語出現頻率在各個熱點詞表中選擇熱點關鍵詞; 將獲取的各個熱點關鍵詞進行合并,作為新惡意關鍵詞。
4.根據權利要求3所述的方法,其中,所述根據詞語出現頻率在各個熱點詞表中選擇熱點關鍵詞,包括: 根據預設規則分別對各個熱點詞表中的熱點關鍵詞進行篩選; 在篩選后的各個熱點詞表中選擇出現頻率由高到低的預設個數熱點關鍵詞。
5.根據權利要求1至4任一項所述的方法,其中,所述惡意關鍵詞包括論壇名稱關鍵詞和版塊名稱關鍵詞; 將所述論壇名稱以及所述版塊名稱分別與預存關鍵詞庫中的惡意關鍵詞進行匹配,包括: 將所述論壇名稱與所述論壇名稱關鍵詞匹配,將所述版塊名稱與所述版塊名稱關鍵詞匹配; 當所述論壇名稱與所述論壇名稱關鍵詞匹配,且所述版塊名稱與所述版塊名稱關鍵詞匹配時,則確認匹配成功; 當所述論壇名稱與所述論壇名稱關鍵詞匹配,且所述版塊名稱關鍵詞為空時,則確認匹配成功; 當所述版塊名稱與所述版塊名稱關鍵詞匹配,且所述論壇名稱關鍵詞為空時,則確認匹配成功; 否則,確認匹配失敗,則所述論壇為非惡意論壇。
6.一種惡意論壇的識別裝置,包括: 存儲器,配置為存儲包含惡意關鍵詞的關鍵詞庫; 用戶輸入接口,配置為接收用戶訪問論壇的指示; 名稱獲取器,配置為獲取待訪問論壇的論壇名稱和所述論壇的版塊名稱; 名稱匹配器,配置為讀取所述存儲器和所述名稱獲取器,將所述論壇名稱和所述版塊名稱分別與所述關鍵詞庫中的惡意關鍵詞進行匹配; 惡意論壇識別器,配置為若所述名稱匹配器確認匹配成功,則識別所述論壇為惡意論壇。
7.根據權利要求6所述的裝置,其中,所述裝置還包括: 名稱處理器,配置為收集所有已知惡意論壇的論壇名稱和版塊名稱并進行處理,得到論壇名稱列表和版塊名稱列表; 聚合生成器,配置為對所述名稱處理器得到的論壇名稱列表和版塊名稱列表進行熱點聚合,得到新惡意關鍵詞,將所述新惡意關鍵詞存儲到所述存儲器的關鍵詞庫中。
8.根據權利要求6或7所述的裝置,其中,所述聚合生成器包括: 詞表生成單元,配置為根據最長公共子序列LCS算法,生成與所述論壇名稱列表和所述版塊名稱列表各自對應的熱點詞表; 選取單元,配置為根據詞語出現頻率在所述詞表生成單元生成的各個熱點詞表中選擇熱點關鍵詞; 合并單元,配置為將所述選取單元獲取的各個熱點關鍵詞進行合并,作為新惡意關鍵詞,將所述新惡意關鍵詞存儲到所述存儲器的關鍵詞庫中。
9.根據權利要求8所述的裝置,其中,所述選取單元配置為按照如下方式在各個熱點詞表中選擇熱點關鍵詞: 根據預設規則分別對所述詞表生成單元生成的各個熱點詞表中的熱點關鍵詞進行篩選; 在篩選后的各個熱點詞表中選擇出現頻率由高到低的預設個數熱點關鍵詞。
10.根據權利要求6至9任一項所述的裝置,其中,所述存儲器中的惡意關鍵詞包括論壇名稱關鍵詞和版塊名稱關鍵詞; 所述名稱匹配器配置為按照如下方式執行匹配操作: 將所述論壇名稱與所述論壇名稱關鍵詞匹配,將所述版塊名稱與所述版塊名稱關鍵詞匹配; 當所述論壇名稱與所述論壇名稱關鍵詞匹配,且所述版塊名稱與所述版塊名稱關鍵詞匹配時,則確認匹配成功; 當所述論壇名稱與所述論壇名稱關鍵詞匹配,且所述版塊名稱關鍵詞為空時,則確認匹配成功; 當所述版塊名稱與所述版塊名稱關鍵詞匹配,且所述論壇名稱關鍵詞為空時,則確認匹配成功; 否則,確認匹配失敗,則所述論壇為非惡意論壇。
【文檔編號】H04L29/06GK103475642SQ201310368712
【公開日】2013年12月25日 申請日期:2013年8月22日 優先權日:2013年8月22日
【發明者】朱珊珊, 林英杰 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 襄城县| 东乡族自治县| 巧家县| 右玉县| 万年县| 汪清县| 祁连县| 云梦县| 嘉定区| 白玉县| 公主岭市| 资阳市| 桐庐县| 贵德县| 婺源县| 镇康县| 娄烦县| 临武县| 汤原县| 阳春市| 汽车| 体育| 武乡县| 南乐县| 勐海县| 河曲县| 博兴县| 青川县| 克东县| 乐平市| 新兴县| 丁青县| 西青区| 锦州市| 富蕴县| 孝义市| 敖汉旗| 普陀区| 潞城市| 洛浦县| 承德市|