專利名稱:一種基于詞表的信息搜索方法及搜索系統的制作方法
技術領域:
本發明涉及通信技術領域,特別是涉及一種基于詞表的信息搜索方法及搜索系統。
背景技術:
隨著實時信息網絡和內容發布工具以及多媒體設備的發展,各種各樣的信息越來越多,搜索作為一種獲取信息的重要手段,使得用戶在豐富的信息資源中能夠快速找到所需要的信息,并成為信息時代不可或缺的重要工具。目前在互聯網上存在以下幾種常見的信息安全問題:敏感信息、色情內容、社會爭議性事件、違禁物品信息、賭博類信息、詐騙內容、非法廣告信息等。這些不健康的信息使信息檢索的安全性受到了挑戰,為了保證輸出的搜索結果符合要求,搜索采取了安全策略。目前的搜索系統,對于詞表中不同主題詞統一采用同一種安全策略,即詞表僅對應設置一種安全策略,安全策略包括例如,不返回敏感詞搜索結果、直接返回敏感詞搜索結果或者返回過濾后的敏感詞搜索結果。因此,如果制定的安全策略的安全等級較高,會過濾全部敏感信息,不返回敏感詞搜索結果,這樣會將安全等級較低的敏感信息也全部過濾掉;如果制定的安全策略的安全等級較低,則會在搜索結果中返回全部或部分安全等級較高的敏感詞搜索結果。這已經越來越不滿足現有的搜索需求,無法根據不同的搜索需求對搜索結果進行安全性控制。
發明內容
本發明的目的在于提供一種基于詞表的信息搜索方法及搜索系統,用以解決采用同一安全策略導致的搜索結果可控性及靈活性無法保證的問題。為此,本發明實施例采用如下技術方案:
本發明實施例提供一種基于詞表的信息搜索方法,所述詞表中的主題詞具有各自的安全等級,各安全等級對應設置有相應的安全策略;所述方法包括:
搜索系統接收包含有關鍵詞的搜索請求;
所述搜索系統根據所述關鍵詞,在所述詞表中進行查詢,得到匹配的主題詞;
所述搜索系統根據匹配到的主題詞進行搜索,并根據匹配到的主題詞對應的安全等級,確定該安全等級對應的安全策略,根據該安全策略得到所述主題詞的搜索結果。本發明實施例提供一種基于詞表的信息搜索系統,所述詞表中的主題詞具有各自的安全等級;所述搜索系統包括:存儲模塊、接收模塊、查詢模塊、安全模塊以及輸出模塊,其中,
存儲模塊,用于存儲安全等級與安全策略的對應關系;
接收模塊,用于接收包含有關鍵詞的搜索請求;
查詢模塊,用于根據所述接收模塊接收到的關鍵詞在所述詞表中進行查詢,得到匹配的主題詞;
安全模塊,用于根據所述查詢模塊匹配到的主題詞的安全等級,以及所述存儲模塊存儲的對應關系,確定該安全等級對應的安全策略;
搜索模塊,用于根據匹配到的主題詞進行搜索,并根據所述安全模塊確定的安全策略得到所述主題詞的搜索結果。與現有技術相比,本發明的實施例具有如下優點:
本發明的實施例中,詞表中的主題詞具有各自的安全等級,各安全等級對應設置有相應的安全策略,當用戶發起搜索時,搜索系統根據關鍵詞在詞表中進行查詢,得到匹配的主題詞,并根據匹配到的主題詞進行搜索,根據匹配到的主題詞對應的安全等級,確定該安全等級對應的安全策略,并根據該安全策略得到主題詞的搜索結果,從而使不同安全等級的主題詞可以執行不同的安全策略,獲得不同的搜索結果,保證了搜索結果在安全性要求方面的可控性,以及搜索結果的靈活性。
圖1為本發明實施例提供的基于詞表的信息搜索方法流程示意 圖2為本發明實施例提供的基于詞表的信息搜索系統的結構框圖。
具體實施例方式下面將結合本發明中的附圖,對本發明中的技術方案進行清楚、完整的描述,顯然,所描述的實施例是本發明的一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動的前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。本發明實施例中,詞表中的每個主題詞具有各自的安全等級,即安全等級作為主題詞的一個屬性而存在。各安全等級對應設置有相應的安全策略。安全等級可以根據實際需要進行劃分,例如,敏感信息、色情內容、社會爭議性事件、部分違禁物品、賭博類信息、詐騙內容、非法廣告信息等對社會的危害程度不同,在建立詞表時,為詞表中的各主題詞設置各自的安全等級。例如,將涉及詐騙內容的主題詞的安全等級設置為最高,將涉及非法廣告信息的主題詞安全等級設置為次之。安全策略通常是指搜索結果的呈現策略,例如,目前常見的安全策略有:返回全部搜索結果、返回部分搜索結果或不返回搜索結果。通過采用安全策略可以實現過濾敏感信息的功能,在此不再贅述。本發明實施例中,可根據安全控制需要,為詞表內主題詞的不同安全等級設置相應的安全策略。例如,為最高的安全等級設置不返回搜索結果的安全策略,為中等的安全等級設置返回部分搜索結果的安全策略,為最低的安全等級設置返回全部搜索結果的安全策略。具體實現時,可設置詞表中主題詞的安全等級與安全策略的映射關系表,通過該映射關系表即可查到安全等級對應的安全策略。搜索系統可以根據時間或者需要更新詞表中主題詞的安全等級與安全策略的映射關系表。例如,在重要節日或者舉辦重要的政治活動、社會活動、體育賽事等時間段內,可以將中等安全等級的主題詞與全部不返回搜索結果的安全策略相對應,實現高安全性控制。當節日過后或者活動結束后,可以僅僅將包含留敏感信息、社會爭議性事件、部分違禁物品等內容的安全等級較高的主題詞與全部不返回搜索結果的安全策略相對應。又例如,原來最低安全等級對應的安全策略為全部返回搜索結果,目前根據實際需要,需要調整為部分返回搜索結果,針對這種情況,僅需在映射關系表中將所述最低安全等級對應的安全策略調整為部分返回搜索結果即可,無需修改詞表。基于以上設置,圖1示出了本發明實施例提供的基于詞表的信息搜索方法的流程,如圖所示,該流程可包括:
步驟11,搜索系統接收包含有關鍵詞的搜索請求。搜索系統接收到搜索請求后,通常會根據搜索請求中攜帶的信息進行分詞處理,以確定出關鍵詞。分詞處理方式可采用現有方式實現,本發明實施例對分詞處理方式不做限制。步驟12,搜索系統根據關鍵詞在詞表中進行查詢,得到匹配的主題詞。具體的,得到關鍵詞的匹配的主題詞可采用現有方式實現,例如,通過詞表的精確匹配邏輯實現。步驟13,搜索系統根據匹配到的主題詞進行搜索,并根據匹配到的主題詞對應的安全等級,確定該安全等級對應的安全策略,根據該安全策略得到該主題詞的搜索結果。具體的,當搜索系統得到匹配的主題詞之后,根據該該主題詞的安全等級,通過查詢存儲于本地的主題詞的安全等級與安全策略的映射關系表,獲得對應的安全策略,并采用該安全策略得到該主題詞的搜索結果。對于文獻類文件,搜索結果包括文獻的作者、標題等信息;對于網頁類文件,搜索結果包括該網頁的URL。通過以上描述可以看出,本發明的實施例中,詞表中的主題詞具有各自的安全等級,各安全等級對應設置有相應的安全策略,當用戶發起搜索時,搜索系統根據關鍵詞在詞表中進行查詢,得到匹配的主題詞,根據匹配到的主題詞進行搜索,并根據匹配到的主題詞對應的安全等級,確定該安全等級對應的安全策略,根據該安全策略得到主題詞的搜索結果,從而使不同安全等級的主題詞可以執行不同的安全策略,返回不同的搜索結果,保證了搜索結果在安全性要求方面的可控性,以及搜索結果的靈活性。此外,當安全策略發生改變時,只需調整安全策略或者更新安全策略與安全等級的對應關系,無需修改詞表,從而減少了人工維護詞表的工作,降低了詞表維護的復雜性。本發明實施例還提供了一種基于詞表的信息搜索系統,詞表中的主題詞具有各自的安全等級,如圖2所示,該搜索系統包括:
存儲模塊21,用于存儲安全等級與安全策略的對應關系。接收模塊22,用于接收包含有關鍵詞的搜索請求。查詢模塊23,用于根據接收模塊22接收到的關鍵詞在詞表中進行查詢,得到匹配的主題詞。安全模塊24,用于根據查詢模塊23匹配到的主題詞的安全等級,以及存儲模塊21存儲的對應關系,確定該安全等級對應的安全策略。搜索模塊25,用于根據匹配到的主題詞進行搜索,并根據所述安全模塊24確定的安全策略得到所述主題詞的搜索結果。具體的,存儲模塊21具體用于存儲映射關系表,映射關系表包括:詞表中主題詞的安全等級與安全策略的映射關系。安全模塊24具體用于,確定所述查詢模塊23匹配到的主題詞的安全等級,根據該安全等級查找存儲模塊21中存儲的映射關系表,得到對應的安全策略。具體的,本發明實施例基于詞表的信息搜索系統還可以包括:更新模塊26,用于根據時間或者需要更新主題詞的安全等級與安全策略的對應關系。具體實現時,更新模塊26可以更新存儲模塊21中存儲的映射關系表。安全模塊是搜索系統中的重要一環,眾多業務例如微博搜索,Qzone社區搜索等都為安全模塊提供了實現和檢測的平臺,本發明主要是通過在詞表中查詢主題詞,根據匹配的主題詞進行搜索,執行主題詞對應的安全策略,得到相應搜索結果,從而實現詞表的安全性控制。本發明的信息搜索方法及搜索系統,通過不同安全等級的主題詞執行不同的安全策略,得到不同的搜索結果,使得搜索結果的安全性可控、易控,不僅大大的提高了搜索系統靈活性與可控性,同時也降低了人工維護詞表的工作。本領域技術人員可以理解實施例中的裝置中的模塊可以按照實施例描述進行分布于實施例的裝置中,也可以進行相應變化位于不同于本實施例的一個或多個裝置中。上述實施例的模塊可以合并為一個模塊,也可以進一步拆分成多個子模塊。通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到本發明可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件,但很多情況下前者是更佳的實施方式。基于這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品存儲在一個存儲介質中,包括若干指令用以使得一臺終端設備(可以是手機,個人計算機,服務器,或者網絡設備等)執行本發明各個實施例所述的方法。以上所述僅是本發明的優選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視本發明的保護范圍。
權利要求
1.一種基于詞表的信息搜索方法,其特征在于,所述詞表中的主題詞具有各自的安全等級,各安全等級對應設置有相應的安全策略;所述方法包括: 搜索系統接收包含有關鍵詞的搜索請求; 所述搜索系統根據所述關鍵詞,在所述詞表中進行查詢,得到匹配的主題詞; 所述搜索系統根據匹配到的主題詞進行搜索,并根據匹配到的主題詞對應的安全等級,確定該安全等級對應的安全策略,根據該安全策略得到所述主題詞的搜索結果。
2.如權利要求1所述的方法,其特征在于,所述搜索系統根據匹配到的主題詞對應的安全等級,確定該安全等級對應的安全策略,具體包括: 搜索系統通過查找存儲于本地的映射關系表,確定安全等級對應的安全策略,所述映射關系表包括:詞表中主題詞的安全等級與安全策略的映射關系。
3.如權利要求1所述的方法,其特征在于,還包括:搜索系統更新所述安全等級與所述安全策略的對應關系。
4.一種基于詞表的信息搜索系統,其特征在于,所述詞表中的主題詞具有各自的安全等級;所述搜索系統包括:存儲模塊、接收模塊、查詢模塊、安全模塊以及輸出模塊,其中, 存儲模塊,用于存儲安全等級與安全策略的對應關系; 接收模塊,用于接收包含有關鍵詞的搜索請求; 查詢模塊,用于根據所述接收模塊接收到的關鍵詞在所述詞表中進行查詢,得到匹配的主題詞; 安全模塊,用于根據所述查詢模塊匹配到的主題詞的安全等級,以及所述存儲模塊存儲的對應關系,確定該安全等級對應的安全策略; 搜索模塊,用于根據匹配到的主題詞進行搜索,并根據所述安全模塊確定的安全策略得到所述主題詞的搜索結果。
5.如權利要求4所述的搜索系統,其特征在于,所述存儲模塊具體用于,存儲映射關系表,所述映射關系表包括:詞表中主題詞的安全等級與安全策略的映射關系; 所述安全模塊具體用于,確定所述查詢模塊匹配到的主題詞的安全等級,根據該安全等級查找所述存儲模塊中存儲的映射關系表,得到對應的安全策略。
6.如權利要求4所述的搜索系統,其特征在于,還包括: 更新模塊,用于更新所述存儲模塊中存儲的安全等級與安全策略的對應關系。
全文摘要
本發明公開了一種基于詞表的信息搜索方法及搜索系統,詞表中的主題詞具有各自的安全等級,各安全等級對應設置有相應的安全策略;所述方法包括搜索系統接收包含有關鍵詞的搜索請求;搜索系統根據關鍵詞在所述詞表中進行查詢,得到匹配的主題詞;搜索系統根據匹配到的主題詞進行搜索,并根據匹配到的主題詞對應的安全等級,確定該安全等級對應的安全策略,根據該安全策略得到搜索結果。本發明保證了搜索結果安全性的可控,以及搜索結果的靈活性。
文檔編號G06F17/30GK103198066SQ20121000269
公開日2013年7月10日 申請日期2012年1月6日 優先權日2012年1月6日
發明者王沁泉, 王佳強, 楊娜, 胡文翠, 潘樹燊, 文勖 申請人:騰訊科技(深圳)有限公司