天然氣與管道技術標準體例庫的建立方法
【專利摘要】本發明是一種天然氣與管道技術標準體例庫的建立方法,涉及數字數據處理裝置和管道系統【技術領域】。其建立步驟如下:(1)標準專業分類;(2)分析每類標準體例特征,并參與進化;(3)提煉體例元素;提煉體例元素時,補充同義詞;(4)建立體例結構表;同時補充同義詞;(5)進化,進化后重新參與分析每類標準體例特征分析;(6)體例庫建立完成。本發明所建立的系統能夠實現從“基本字段信息”到“重要技術指標”的高效的標準信息檢索。
【專利說明】天然氣與管道技術標準體例庫的建立方法
【技術領域】
[0001]本發明是一種天然氣與管道技術標準體例庫的建立方法,涉及數字數據處理裝置和管道系統【技術領域】。
【背景技術】
[0002]隨著信息技術與網絡技術的發展,信息共享系統已經在各個行業廣泛應用,大大提高了各行業工作勞動效率與便捷性,天然氣與管道行業在信息化技術應用方面一直走在行業前列,隨著業務、技術的進一步發展,僅僅提供文獻級別的檢索、瀏覽等功能已經不能滿足用戶的需求,必須進行更深一步的挖掘與服務,以滿足用戶需求。目前常用的標準檢索方式為“基本字段信息”檢索,一般僅能提供對標準名稱、主題詞進行檢索,不能實現對技術指標的精確定位與檢索、不同標準中同一技術指標的對比。概括起來,傳統檢索方式對技術標準的使用效果有以下幾方面的局限性。
[0003](I)不能對技術標準內容進行精確檢索
[0004]傳統數據庫檢索方式是通過分類、標題、摘要及敘詞等手段對標準文獻進行題錄數據加工,來實現對技術標準與技術法規的檢索。但是技術指標一般會分散在不同技術標準與技術法規中,傳統的檢索方式只能通過題錄數據庫檢索到相關標準,逐一閱讀原文技術指標的內容。但是這樣的方法很浪費時間,并且難以保障查全率。
[0005](2)不能同時檢索到不同標準的技術指標,并實現不同標準的同一技術指標的對比。
[0006]在檢索過程中,經常會出現同一產品的技術指標同時存在國際標準、國家標準、行業標準、地方標準和企業標準等不同的標準中,用戶經常需要對不同標準中的相同產品的技術指標進行對比研究,這是傳統檢索方式所不能滿足的。
[0007]標準內容提取與展示系統是標準信息檢索的最新發展方向。這種新型的檢索方式通過對標準技術指標的系統提取和有效組織,能夠實現從“基本字段信息”到“重要技術指標”的高效的標準信息檢索。對于負責油氣管道工程建設的工程項目管理人員、實施人員,可以實現利用關鍵指標控制管道設計和施工建設;對于油氣管道運行操作人員、管理人員,可以實現查詢、對比操作參數、方法;對于科研人員,可以實現國內外標準關鍵指標差異分析、判斷技術差異,分析體系內各標準間的協調性。
[0008]CN102591878A公開了一種技術標準內容提取與展示系統的建立方法,《石油規劃設計》2011年第22卷第6期“天然氣與管道標準信息管理系統開發方案研究”公開了一種天然氣與管道標準信息管理系統的開發方案,但該系統僅能進行標準全文檢索,無法實現標準內容的提取與展示,也并未公開建立天然氣與管道標準體例庫的方法,其技術并不完
盡
口 ο
[0009]標準內容提取與展示技術是一種新的標準檢索技術,目前國外未見以此技術開發的商業數據庫。在國內,只有中國標準化研究院將標準內容提取與展示技術初步應用在食品、農產品的國家標準、行業標準中,并建設了相應的提取與展示系統平臺,實現對標準內容指標的提取與展示。目前國內外尚未見到天然氣與管道技術標準內容提取與展示系統的建立方法。
[0010]要實現天然氣與管道標準內容提取與展示,必須使不同標準相關內容在同一檢索詞下能夠被同時檢索到,進而實現內容展示和對比。一種可行的方法就是對具有相同結構的標準文獻進行標準結構分析,并依據油氣管道標準文獻的規范條款或技術指標,建立起來能夠涵蓋天然氣與管道標準中出現的所有有效檢索指標和屬性的重要架構,作為標準內容提取與展示以及各標準內容具有可比性的架構載體。然而目前尚沒有這樣的方法,需要研究開發相應的方法用以作為實現天然氣與管道標準內容提取與展示技術的基礎。
【發明內容】
[0011]本發明的目的是發明一種將相同的結構提取并重新組織形成體例庫作為標準內容具有可比性的架構、實現從多個標準中提取與展示相同內容或指標、實現從“基本字段信息”到“重要技術指標”的高效的標準信息檢索的天然氣與管道技術標準體例庫的構建方法。
[0012]本發明是天然氣與管道技術標準內容提取與展示系統中體例庫的建立方法,天然氣與管道技術標準內容提取與展示系統的建立方法如圖1所示,主要包括以下步驟:
[0013](I)使用光學字符識別(OCR)工具對天然氣與管道標準文獻全文進行數字化加工,使標準文獻數字化;
[0014](2)建立天然氣與管道標準本體庫、體例庫、題錄數據庫;
[0015](3)建立天然氣與管道標準內容數據庫;
[0016](4)開發天然氣與管道標準內容提取與展示系統平臺,用于標準內容提取、展示與對比。
[0017]天然氣與管道技術標準體例庫的建立方法如圖2所示,建立步驟如下:
[0018](I)標準專業分類;
[0019](2)分析每類標準體例特征,并參與進化;
[0020](3)提煉體例元素;提煉體例元素時,補充同義詞;
[0021](4)建立體例結構表;同時補充同義詞;
[0022](5)進化,進化后重新參與分析每類標準體例特征分析;
[0023]( 6 )體例庫建立完成。
[0024]所述天然氣與管道標準體例庫建立具體方法為:
[0025]( I)對現有天然氣與管道標準按照專業主題范疇分布進行標準專業分類;
[0026](2)分析每類標準體例特征:分析同一主題范疇標準的體例特征,根據專業特點以及體例的結構相似度大小判斷是否需要將同一主題范疇的標準繼續細分為不同類;
[0027](3)提煉體例元素:分析同一類中所有標準的體例特征,提煉出每項標準的體例元素,將此類中不同標準的相似體例元素合并或集成,賦予具有精確性和唯一性的術語名稱,即體例元數據名稱;
[0028]體例元素建立的原則為:每一類標準的一級體例元素要涵蓋此類標準的所有內容,要保證標準知識的完整性;二級、三級以及其他級體例元素要具有共同性,即對于含有相同一級體例元素的標準,應該均能提煉出此一級體例元素下的二級、三級以及其他級體例元素;
[0029](4)建立體例結構表:根據標準類別劃分體例元素屬性歸屬,包括行業歸屬、主體歸屬、結構歸屬,分別賦予體例元數據行業名稱、體例元數據主體名稱、體例元數據結構名稱,并分別賦予體例元數據行業代碼、體例元數據主體代碼、體例元數據結構代碼;對于有同義詞的體例元素,應補充每一項體例元素據的同義詞,增加用戶的檢索入口,建立體例結構表;
[0030](5)進化:對不能滿足要求的體力元素重新進行體例特征分析、提煉體例元素、補充同義詞、建立體例結構表;
[0031](6)完成體例庫的建立:整合集成體例結構表,建立體例庫。
[0032]本發明取得了以下有益效果:
[0033](I)有效的對天然氣與管道標準進行結構分解,將相同的結構提取并重新組織形成體例庫;可以有效的對標準結構進行分解,提取結構相同;
[0034](2)本發明構建的體例庫應用于天然氣與管道標準內容提取與展示系統,可作為標準內容具有可比性的架構,作為能夠實現從多個標準中提取與展示相同內容或指標的基礎,最終實現從“基本字段信息”到“重要技術指標”的高效的標準信息檢索。
【專利附圖】
【附圖說明】
[0035]圖1天然氣與管道標準內容提取與展示系統建立流程圖
[0036]圖2體例庫構建流程圖
【具體實施方式】
[0037]實施例.以本例來說明本發明的【具體實施方式】并對本發明作進一步的說明。本例是一實驗方法,其流程如圖2所示。
[0038]本天然氣與管道標準體例庫建立具體方法為:
[0039]( I)對現有天然氣與管道標準按照專業主題范疇分布進行標準專業分類;
[0040](2)分析每類標準體例特征:分析同一主題范疇標準的體例特征,根據專業特點以及體例的結構相似度大小判斷是否需要將同一主題范疇的標準繼續細分為不同類;
[0041 ] (3)提煉體例元素:分析同一類中所有標準的體例特征,提煉出每項標準的體例元素,將此類中不同標準的相似體例元素合并或集成,賦予具有精確性和唯一性的術語名稱,即體例元數據名稱;
[0042]體例元素建立的原則為:每一類標準的一級體例元素要涵蓋此類標準的所有內容,要保證標準知識的完整性;二級、三級以及其他級體例元素要具有共同性,即對于含有相同一級體例元素的標準,應該均能提煉出此一級體例元素下的二級、三級以及其他級體例元素;
[0043](4)建立體例結構表:根據標準類別劃分體例元素屬性歸屬,包括行業歸屬、主體歸屬、結構歸屬,分別賦予體例元數據行業名稱、體例元數據主體名稱、體例元數據結構名稱,并分別賦予體例元數據行業代碼、體例元數據主體代碼、體例元數據結構代碼;對于有同義詞的體例元素,應補充每一項體例元素據的同義詞,增加用戶的檢索入口,建立體例結構表;[0044](5)進化:對不能滿足要求的體力元素重新進行體例特征分析、提煉體例元素、補充同義詞、建立體例結構表;
[0045](6)完成體例庫的建立:整合集成體例結構表,建立體例庫。
[0046]本例的體例元素如表I所示。
[0047]本例的體例表如表2所示。
[0048]表I天然氣與管道運行類體例元素
【權利要求】
1.一種天然氣與管道技術標準體例庫的建立方法,其特征是建立步驟如下: (1)標準專業分類; (2)分析每類標準體例特征,并參與進化; (3)提煉體例元素;提煉體例元素時,補充同義詞; (4)建立體例結構表;同時補充同義詞; (5)進化,進化后重新參與分析每類標準體例特征分析; (6)體例庫建立完成。
2.根據權利要求1所述的天然氣與管道技術標準體例庫的建立方法,其特征是體例庫建立具體方法為: (1)對現有天然氣與管道標準按照專業主題范疇分布進行標準專業分類; (2)分析每類標準體例特征:分析同一主題范疇標準的體例特征,根據專業特點以及體例的結構相似度大小判斷是否需要將同一主題范疇的標準繼續細分為不同類; (3)提煉體例元素:分析同一類中所有標準的體例特征,提煉出每項標準的體例元素,將此類中不同標準的相似體例元素合并或集成,賦予具有精確性和唯一性的術語名稱,即體例元數據名稱; 體例元素建立的原則為:每一類標準的一級體例元素要涵蓋此類標準的所有內容,要保證標準知識的完整性;二級、三級以及其他級體例元素要具有共同性,即對于含有相同一級體例元素的標準,應該均能提煉出此一級體例元素下的二級、三級以及其他級體例元素; (4)建立體例結構表:根據標準類別劃分體例元素屬性歸屬,包括行業歸屬、主體歸屬、結構歸屬,分別賦予體例元數據行業名稱、體例元數據主體名稱、體例元數據結構名稱,并分別賦予體例元數據行業代碼、體例元數據主體代碼、體例元數據結構代碼;對于有同義詞的體例元素,應補充每一項體例元素據的同義詞,增加用戶的檢索入口,建立體例結構表; (5)進化:對不能滿足要求的體力元素重新進行體例特征分析、提煉體例元素、補充同義詞、建立體例結構表; (6)完成體例庫的建立:整合集成體例結構表,建立體例庫。
【文檔編號】G06F17/30GK103699539SQ201210366592
【公開日】2014年4月2日 申請日期:2012年9月28日 優先權日:2012年9月28日
【發明者】劉冰, 稅碧垣, 劉艷雙, 鄭娟, 姚學軍, 李云杰, 張欣 申請人:中國石油天然氣股份有限公司