麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

面向電力生產管理系統關系數據庫的關鍵詞搜索方法

文檔序號:6375185閱讀:235來源:國知局
專利名稱:面向電力生產管理系統關系數據庫的關鍵詞搜索方法
技術領域
本發明屬于電力信息技術領域,具體涉及面向電力生產管理系統關系數據庫的關鍵詞搜索方法。
背景技術
基于關鍵詞的搜索引擎是目前信息檢索的主要方式,現有的互聯網搜索引擎主要針對靜態網頁進行索引,而企業級搜索引擎則更多地關注于文檔、視頻、圖像等非結構化數據的檢索。對于電力應用而言,往往同時需要結構化數據和非結構化文本,兩類信息的融合成為一個核心問題。目前兩類信息的檢索分別使用關系數據庫和關鍵詞查詢技術實現,尚無有機集成。解決這一問題的關鍵在于尋求高效的信息查詢方法,從而實現對兩類信息的自由查詢。鑒于關鍵詞查詢在非結構化數據檢索中的易用性,目前的熱點在于將關鍵詞查詢技術應用到關系數據庫領域。在電力行業的實際應用中,大量數據保存在后臺關系型數 據庫,需要特定的查詢接口,同時數據查詢要求操作人員具有專業的背景知識來分析數據間的關聯關系。針對這一問題,現有的網絡搜索引擎無法提供電力結構化數據的檢索,需要研究基于關鍵詞的數據庫搜索技術。目前數據庫搜索技術研究主要包括三個方面I)基礎理論和算法的研究,涉及關系庫建模、系統體系結構設計和搜索排序算法分析;2)搜索準確性研究,涉及搜索性能、搜索結果顯示等重要環節的優化;3)傳統搜索引擎擴展,涉及面向用戶的語義搜索分析,以及研究如何將數據庫搜索技術向分布式環境遷移。目前數據庫搜索技術主要存在如下需要解決的問題I)在實時性要求較高的場合,搜索引擎需要從數據庫模式中分析用戶輸入的關鍵字與數據庫查詢語言間的關系,并提供在線的數據查詢,但數據庫模式的復雜性導致查詢效率低下;2)在實時性要求較低的場合,現有的解決方案通過數據采集將數據庫中的記錄進行組織和本地存儲,但數據記錄的規模的急劇膨脹導致數據的存儲和分析效率不高;3)現有的搜索結果排序一般使用IR索引或繼承傳統搜索引擎的PageRank算法,但這類排序機制是否適用于數據庫搜索的場合尚無定論。

發明內容
為了克服上述現有技術的不足,本發明提供一種面向電力生產管理系統關系數據庫的關鍵詞搜索方法,該方法能夠有效關聯業務數據庫的不同關系表,結合業務知識和流程規范實現全局化的數據查詢,降低業務數據查詢的復雜性,使得用戶可以快速、方便地獲取所需的搜索結果。為了實現上述發明目的,本發明采取如下技術方案
一種面向電力生產管理系統關系數據庫的關鍵詞搜索方法,所述方法包括以下步驟步驟I :根據關鍵詞定位關系表;步驟2 :依據業務詞典規約查詢過程;步驟3 :以關鍵詞為中心查詢數據;步驟4 :依據業務規則擴展查詢模式;步驟5:返回查詢結果。所述步驟I中,用戶通過查詢節點索引表,在數據庫模式圖中找到至少包含一個搜索關鍵詞的節點,其中數據庫模式圖是無向圖G= (V,E),V為頂點的集合,每個頂點對應于一個關系表,E為邊的集合,每條邊對應于一個外鍵關系。所述節點索引表創建過程為將數據表關系表中的每列的各個字段拼接成文檔,對該文檔抽取關鍵詞,形成關鍵詞到表名、列名的倒排索引。所述步驟2中,篩選所述關鍵詞對應的節點,若關鍵詞不存在于節點對應的業務詞典,則去除該節點。所述業務詞典的創建過程為選取關系表中的關鍵屬性,將表格中所有關鍵屬性列拼接成文檔,對該文檔抽取關鍵詞,形成該關系表對應的業務詞典。所述步驟3中,以生成的節點為中心進行擴展,生成候選的數據查詢模式,每個查詢模式是數據庫模式圖的子圖,且包含了所有的關鍵詞。根據權利要求6所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于采用寬度遍歷方法生成所述數據查詢模式,過程如下I)定義隊列Q、V,將所有產生的中心節點作為初始模式添加到隊列Q和V ;2)從Q中取出模式P,將P的關聯模式(P1, P2,…,P1J添加到隊列Q和V,其中關聯模式Pi(i=l,2,…,η)滿足如下條件a) IPi I = |Ρ|+1,Pi SPi 中包含節點的個數;b)Pi為連通圖且不存在于V ;3)依次遍歷Q中所有的模式,直到Q為空,選取符合如下條件的查詢模式作為輸出
結果a)輸出模式需要包含所有的關鍵詞;b)所有葉子節點均包含至少一個關鍵詞;c)輸出模式的大小應小于預定的最大值。所述步驟4中,先引入業務規則形成先驗知識庫,再對生成的查詢模式進行擴展,將密切相關的其它節點加入到該查詢模式。所述業務規則是業務流程上密切關聯的多個關系表的集合ITiIi=I, 2,…,N},其中Ti為表名,N為該規則的長度。所述步驟5中,對每個候選查詢模式均拼接SQL查詢語句,通過用戶關鍵詞查詢所述索引表,得到表名和列名信息寫入SQL語句,SQL語句的查詢條件通過數據庫全文索引使用Contains法實現。與現有技術相比,本發明的有益效果在于I.對電力業務數據庫和關鍵詞查詢加以整合,將傳統搜索引擎的關鍵詞檢索應用于電力關系數據庫的數據查詢范疇,用戶無需了解數據庫查詢語言以及業務模式,僅通過給出所關心的關鍵詞集合,就可以查詢數據庫中的記錄和復雜的關聯關系;2.本發明以關鍵詞為中心的PMS關系據庫的關鍵字搜索方法,通過對PMS數據庫進行數據索引和模式分析,歸納出面向電力業務數據庫的業務詞典,并基于該業務詞典對數據查詢模式進行篩選,縮小搜索空間,同時在業務工作流程基礎上梳理出詳細的業務規貝U,實現業務規則指導下的查詢模式擴展,生成符合電力業務規范的查詢結果;3.該方法完全通過自主設計來實現電力業務數據庫的信息查詢,屏蔽了底層復雜的數據庫模式,克服了傳統結構化數據查詢在靈活性和實用性上的弊端,使得該方法能夠有效降低非專業人員查詢業務數據庫的技術門檻,更好地利用業務數據的價值。


圖I是面向電力生產管理系統關系數據庫的關鍵詞搜索方法的體系結構圖; 圖2是電力生產管理系統關系數據庫查詢樣例圖。
具體實施例方式下面結合附圖對本發明作進一步詳細說明。如圖I和圖2,一種面向電力生產管理系統關系數據庫的關鍵詞搜索方法,所述方法包括以下步驟步驟I :根據關鍵詞定位關系表;步驟2 :依據業務詞典規約查詢過程;步驟3 :以關鍵詞為中心查詢數據;步驟4 :依據業務規則擴展查詢模式;步驟5:返回查詢結果。所述步驟I中,用戶通過查詢節點索引表,在數據庫模式圖中找到至少包含一個搜索關鍵詞的節點,其中數據庫模式圖是無向圖G= (V,E),V為頂點的集合,每個頂點對應于一個關系表,E為邊的集合,每條邊對應于一個外鍵關系。如圖2所示的數據庫模式圖中,頂點集 V 和邊集 E 分別表述為V= (T1, T2,. . . , T5,. . . }, E = ((T11T2), (H),···}。所述節點索引表創建過程為將數據表關系表中的每列的各個字段拼接成文檔,對該文檔抽取關鍵詞,形成關鍵詞到表名、列名的倒排索引。所述步驟2中,篩選所述關鍵詞對應的節點,若關鍵詞不存在于節點對應的業務詞典,則去除該節點。所述業務詞典的創建過程為選取關系表中的關鍵屬性,如關系表“變電一次設備臺帳”中的“運行編號、“設備型號”等屬性,將表格中所有關鍵屬性列拼接成文檔,對該文檔抽取關鍵詞,形成該關系表對應的業務詞典。所述步驟3中,以生成的節點為中心進行擴展,生成候選的數據查詢模式,每個查詢模式是數據庫模式圖的子圖,且包含了所有的關鍵詞,即用戶輸入的關鍵詞均對應于子圖中的一個或多個節點。根據權利要求6所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于采用寬度遍歷方法生成所述數據查詢模式,過程如下
I)定義隊列Q、V,將所有產生的中心節點作為初始模式添加到隊列Q和V ;2)從Q中取出模式P,將P的關聯模式(P1, P2,…,P1J添加到隊列Q和V,其中關聯模式Pi(i=l,2,…,η)滿足如下條件a) IPi Hp 1+1,Pi SPi中包含節點的個數;b)Pi為連通圖且不存在于V ;3)依次遍歷Q中所有的模式,直到Q為空,選取符合如下條件的查詢模式作為輸出
結果a)輸出模式需要包含所有的關鍵詞; b)所有葉子節點均包含至少一個關鍵詞;c)輸出模式的大小(即包含的節點數)應小于預定的最大值。如圖2所示的數據庫模式圖,圖中的節點T1、T2、…T5對應了業務系統中變電設備包中的關系數據表,圖中的邊表示相鄰的數據表關系表間存在外鍵關系,其中關系表“Τ3:設備擴展屬性”包含關鍵詞Κ1,“Τ4 :一次設備附件”包含關鍵詞Κ2,“Τ5 :設備附件屬性”包含關鍵詞Κ3,且Τ3、Τ4、Τ5間存在外鍵關系,則“Τ3-Τ4-Τ5”為一個輸出子模式查詢模式。所述步驟4中,先引入業務規則形成先驗知識庫,再對生成的查詢模式進行擴展,將滿足如下條件的候選節點加入到該查詢模式I)查詢模式中存在節點與候選節點隸屬于同一條業務規則;2)查詢模式中不包含該候選節點。所述業務規則是業務流程上密切關聯的多個關系表的集合ITiIi=I, 2,…,N},其中Ti為表名,N為該規則的長度。所述步驟5中,對每個候選查詢模式均拼接SQL查詢語句,通過用戶關鍵詞查詢所述索引表,得到表名和列名信息寫入SQL語句,SQL語句的查詢條件通過數據庫全文索引使用Contains法實現,如圖2中關鍵詞Kl對應表Tl和列Cl,則查詢條件為WHERECONTAINS (Cl1Kl)。最后應當說明的是以上實施例僅用以說明本發明的技術方案而非對其限制,盡管參照上述實施例對本發明進行了詳細的說明,所屬領域的普通技術人員應當理解依然可以對本發明的具體實施方式
進行修改或者等同替換,而未脫離本發明精神和范圍的任何修改或者等同替換,其均應涵蓋在本發明的權利要求范圍當中。
權利要求
1.面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于所述方法包括以下步驟 步驟I :根據關鍵詞定位關系表; 步驟2 :依據業務詞典規約查詢過程; 步驟3 :以關鍵詞為中心查詢數據; 步驟4 :依據業務規則擴展查詢模式; 步驟5:返回查詢結果。
2.根據權利要求I所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于所述步驟I中,用戶通過查詢節點索引表,在數據庫模式圖中找到至少包含一個搜索關鍵詞的節點,其中數據庫模式圖是無向圖G= (V,E),V為頂點的集合,每個頂點對應于一個關系表,E為邊的集合,每條邊對應于一個外鍵關系。
3.根據權利要求2所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于所述節點索引表創建過程為將數據表關系表中的每列的各個字段拼接成文檔,對該文檔抽取關鍵詞,形成關鍵詞到表名、列名的倒排索引。
4.根據權利要求I所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于所述步驟2中,篩選所述關鍵詞對應的節點,若關鍵詞不存在于節點對應的業務詞典,則去除該節點。
5.根據權利要求4所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于所述業務詞典的創建過程為選取關系表中的關鍵屬性,將表格中所有關鍵屬性列拼接成文檔,對該文檔抽取關鍵詞,形成該關系表對應的業務詞典。
6.根據權利要求I所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于所述步驟3中,以生成的節點為中心進行擴展,生成候選的數據查詢模式,每個查詢模式是數據庫模式圖的子圖,且包含了所有的關鍵詞。
7.根據權利要求6所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于采用寬度遍歷方法生成所述數據查詢模式,過程如下 1)定義隊列Q、V,將所有產生的中心節點作為初始模式添加到隊列Q和V; 2)從Q中取出模式P,將P的關聯模式{P1;P2,…,PJ添加到隊列Q和V,其中關聯模SPiQ = Id, ···,!!)滿足如下條件 a)Ipi I = |p|+1,Pi為Pi中包含節點的個數; b)Pi為連通圖且不存在于V; 3)依次遍歷Q中所有的模式,直到Q為空,選取符合如下條件的查詢模式作為輸出結果 a)輸出模式需要包含所有的關鍵詞; b)所有葉子節點均包含至少一個關鍵詞; c)輸出模式的大小應小于預定的最大值。
8.根據權利要求I所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于所述步驟4中,先引入業務規則形成先驗知識庫,再對生成的查詢模式進行擴展,將密切相關的其它節點加入到該查詢模式。
9.根據權利要求8所述的面向電力生產管理系統關系數據庫的關鍵詞搜索方法,其特征在于所述業務規則是業務流程上密切關聯的多個關系表的集合ITiIi=IJ,…,N},其中Ti為表名,N為該規則的長度。
10.根據權利要求I所述的面向電カ生產管理系統關系數據庫的關鍵詞捜索方法,其特征在于所述步驟5中,對每個候選查詢模式均拼接SQL查詢語句,通過用戶關鍵詞查詢所述索引表,得到表名和列名信息寫入SQL語句,SQL語句的查詢條件通過數據庫全文索引使用Contains法實現。
全文摘要
本發明提供面向電力生產管理系統關系數據庫的關鍵詞搜索方法,包括以下步驟根據關鍵詞定位關系表;依據業務詞典規約查詢過程;以關鍵詞為中心查詢數據;依據業務規則擴展查詢模式;返回查詢結果。該方法能夠有效關聯業務數據庫的不同關系表,結合業務知識和流程規范實現全局化的數據查詢,降低業務數據查詢的復雜性,使得用戶可以快速、方便地獲取所需的搜索結果。
文檔編號G06Q10/06GK102819600SQ20121029127
公開日2012年12月12日 申請日期2012年8月15日 優先權日2012年8月15日
發明者丁杰, 胡斌, 朱力鵬, 楊佩, 汪超 申請人:中國電力科學研究院, 國家電網公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 嵊州市| 台江县| 昭通市| 加查县| 武冈市| 自治县| 布尔津县| 敦化市| 太谷县| 盈江县| 高青县| 屯门区| 章丘市| 兴海县| 宜丰县| 福泉市| 东丰县| 岳池县| 陈巴尔虎旗| 沛县| 拉孜县| 门头沟区| 保德县| 京山县| 安宁市| 武安市| 上栗县| 边坝县| 伊金霍洛旗| 衡南县| 河源市| 葵青区| 伊宁县| 综艺| 五莲县| 翁源县| 台东市| 永登县| 宣化县| 莱芜市| 武义县|