本發明涉及一種發電機組技術領域,特別是一種發電機組跳閘監測方法及其監測裝置。
背景技術:
目前,雖然目前的發電機組運行技術已經相當完備,但是由于火力發電機組運行較為復雜且涉及電氣、汽水、燃燒等多個子系統,由于缺陷發展引起的跳閘事件很難避免,給發電企業造成了很大的經濟損失。
發電機組運行過程中,如果出現異?,F象或是一般缺陷,一般不會停機,但是需要向調度部分匯報,因此調度部門會在日志和技術文件中對機組的缺陷進行記錄,從而形成了大量的歷史數據。這些數據中不乏一些典型事件,通過人工分析甚至可以實現一些跳閘事件的原因回溯。多年以來,由于記錄的數據多采用自然語言,人工分析十分繁瑣,因此很多有用信息被埋沒在浩如煙海的日常記錄中。
專利文獻CN102737350 A公開的一種基于機器學習算法的輸變電設備缺陷數據機器自主聚類工具由數據分解器(1)、聚類器(2)、結果處理器(3)依序連接組成;其中:在數據分解器(1)內分別設置有缺陷數據讀取模塊、缺陷數據分解模塊、缺陷數據獲取模塊、缺陷數據過濾模塊、聚類環境初始化模塊;在聚類器(2)內分別設置有識別判斷方法模塊、記憶方法及結果模塊、問題分析模塊、分類處理模塊;在結果處理器(3)內分別設置有數據庫信息配置模塊、結果結構配置模塊、結果文件分發模塊、新知識入庫模塊、老知識更新模塊。該專利能自主分類處理輸變電設備缺陷數據,但該專利無法利用運行記錄進行歸類,無法建立運行記錄和機組跳閘事件間的聯系,無法利用實時的運行信息以監測跳閘。
專利文獻CN103514183 A公開的一種基于交互式文檔聚類的信息檢索方法的步驟包括:1)按時間段對存儲的文檔集進行水平劃分和預處理;2)對預處理后的文檔進行詞頻統計,并將高頻詞組成特證詞集合;3)根據所述特證詞集合生成文檔的向量空間表示,進而計算文檔間的距離并生成相似度矩陣;4)根據所述相似度矩陣生成拉普拉斯矩陣,并計算其特征值和特征向量;5)根據特征值間隔確定聚類數及表示矩陣,并對所述聚類數及表示矩陣進行二次聚類;6)用戶對所述二次聚類的結果進行交互操作,使用卡方統計量挖掘新的特證詞并添加至所述特證詞集合,然后重復所述步驟3)至所述步驟5);7)將聚類結果展示給用戶,供用戶進行選擇并獲得不同類別的檢索結果。該專利可支持海量文本數據自動聚類、整理和歸納相似文本,用戶可參與挖掘過程的數據挖掘與知識發現,但該專利無法利用調度日志得到表征向量,無法利用運行記錄進行歸類,無法建立運行記錄和機組跳閘事件間的聯系,無法利用實時的運行信息以監測跳閘。
專利文獻CN105550365 A公開的一種基于文本主題模型的可視化分析系統包括互聯網文本數據采集模塊、語料庫模塊、主題分析模塊、主題聚類模塊、數據可視化模塊;互聯網文本數據采集模塊用于從互聯網采集網頁文本數據,并對所采集到的各篇文本數據進行清洗;語料庫模塊用于存儲互聯網文本數據采集模塊清洗后的文本數據,并對存儲的網頁文本數據進行中文分詞和詞頻統計,生成包含單詞與所存儲的網頁文本數據之間的映射關系和詞頻統計數據的詞頻數據;主題分析模塊用于依據語料庫模塊生成的詞頻數據建立主題模型,利用Gibbs抽樣方法對所建立主題模型進行計算,存儲并輸出計算得到的文檔-主題向量集和主題-單詞向量集;主題聚類模塊對主題分析模塊輸出的文檔-主題向量集進行聚類分析,存儲并輸出聚類數據;數據可視化模塊將主題分析模塊和主題聚類模塊輸出的數據以圖形的顯示出來;數據可視化模塊還用于顯示和調整語料庫模塊、主題分析模塊、主題聚類模塊中可變參數。該專利可以通過交互式主題可視化模型實現對于網絡文本信息主題分析和主題聚類的圖形化直觀展現、可變參數動態調整,但該專利無法利用調度日志得到表征向量,無法利用運行記錄進行歸類,無法建立運行記錄和機組跳閘事件間的聯系,無法利用實時的運行信息以監測跳閘。
在背景技術部分中公開的上述信息僅僅用于增強對本發明背景的理解,因此可能包含不構成在本國中本領域普通技術人員公知的現有技術的信息。
技術實現要素:
鑒于上述問題,本發明解決的技術問題主要包括三個方面,第一調度日志中對自然語言歸納總結,提取規律的技術;第二發電機組跳閘的典型過程分類技術;第三是通過規律進行跳閘預測的技術,本發明基于發電機組運行的特點,通過對調度日志、技術文件等非結構化數據進行深度挖掘,總結歸納內在聯系和規律,進而形成發電機組跳閘事件監測一整套方法。
本發明的目的是通過以下技術方案予以實現。
本發明的一個方面,一種發電機組跳閘監測方法的步驟包括:
第一步驟中:篩選調度日志中的技術詞匯,對技術詞匯進行詞頻統計分析以建立關鍵詞匯集合,從而構成N維表征向量。
第二步驟中:按照汽水、燃料和電氣三個分類根據運行記錄建立跳閘的歸類數據庫。
第三步驟中:在所述歸類數據庫中利用所述N維表征向量進行聚類分析。
第四步驟中:經由模式識別建立運行記錄與跳閘之間的聯系以監測發電機組跳閘。
優選地,第一步驟中:采用正則表達式對對不同字數組成的技術詞匯在調度日志中進行遍歷,再根據技術詞匯出現的頻率確定是否是關鍵詞匯,從而建立構成N維表征向量。
優選地,第一步驟中:對所述調度日志進行分詞,并分別計算通過分詞獲得的技術詞匯的詞頻作為其權重,所述N維表征向量的每個元素分別與所述關鍵詞匯相對應,每個元素的值分別為相對應的關鍵詞匯的權重。
優選地,第二步驟中:歸類數據庫采用大數據分布式存儲結構。
優選地,第二步驟中:在所述歸類數據庫的基礎上建立數據類型數據庫和知識類型的數據庫。
優選地,第三步驟中:所述N維表征向量進行聚類計算,經由“二小值判斷法”劃分類簇,實現將不同關鍵詞匯分組,在所述歸類數據庫中查找與所述N維表征向量相對應的類簇。
優選地,第三步驟中:聚類分析采用基于劃分的聚類算法、基于層次的聚類算法、基于密度的聚類算法、基于網格的聚類算法或基于神經網絡的聚類算法。
優選地,第三步驟中:聚類分析采用K-Means算法、凝聚算法或DBSCAN算法。
優選地,第四步驟中:模式識別包括支撐向量機、神經網絡或遺傳算法。
本發明的另一個方面,一種實施所述的發電機組跳閘監測方法的監測裝置包括用于詞頻統計分析的數據分解器、用于構建歸類數據庫的歸類器、用于聚類分析的聚類器和用于模式識別的處理器,所述數據分解器包括對技術詞匯分詞的分詞單元和生成N維表征向量的向量生成單元,所述歸類器包括大數據分布式存儲結構,所述聚類器包括識別判斷單元和分類處理單元,所述處理器包括模式識別單元和存儲單元。
上述說明僅是本發明技術方案的概述,為了能夠使得本發明的技術手段更加清楚明白,達到本領域技術人員可依照說明書的內容予以實施的程度,并且為了能夠讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,下面以本發明的具體實施方式進行舉例說明。
附圖說明
通過閱讀下文優選的具體實施方式中的詳細描述,本發明各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。說明書附圖僅用于示出優選實施方式的目的,而并不認為是對本發明的限制。顯而易見地,下面描述的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。而且在整個附圖中,用相同的附圖標記表示相同的部件。
在附圖中:
圖1是根據本發明一個實施例的發電機組跳閘監測方法的步驟示意圖;
圖2是根據本發明一個實施例的發電機組跳閘監測方法的流程示意圖;
圖3是根據本發明一個實施例的實施發電機組跳閘監測方法的監測裝置的結構示意圖。
以下結合附圖和實施例對本發明作進一步的解釋。
具體實施方式
下面將參照附圖更詳細地描述本發明的具體實施例。雖然附圖中顯示了本發明的具體實施例,然而應當理解,可以以各種形式實現本發明而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本發明,并且能夠將本發明的范圍完整的傳達給本領域的技術人員。
需要說明的是,在說明書及權利要求當中使用了某些詞匯來指稱特定組件。本領域技術人員應可以理解,技術人員可能會用不同名詞來稱呼同一個組件。本說明書及權利要求并不以名詞的差異來作為區分組件的方式,而是以組件在功能上的差異來作為區分的準則。如在通篇說明書及權利要求當中所提及的“包含”或“包括”為一開放式用語,故應解釋成“包含但不限定于”。說明書后續描述為實施本發明的較佳實施方式,然所述描述乃以說明書的一般原則為目的,并非用以限定本發明的范圍。本發明的保護范圍當視所附權利要求所界定者為準。
為便于對本發明實施例的理解,下面將結合附圖以具體實施例為例做進一步的解釋說明,且各個附圖并不構成對本發明實施例的限定。
為了更好地理解,圖1是根據本發明一個實施例的發電機組跳閘監測方法的步驟示意圖,如圖1所示,一種發電機組跳閘監測方法的步驟包括:
第一步驟S1中:篩選調度日志中的技術詞匯,對技術詞匯進行詞頻統計分析以建立關鍵詞匯集合,從而構成N維表征向量。
第二步驟S2中:按照汽水、燃料和電氣三個分類根據運行記錄建立跳閘的歸類數據庫。
第三步驟S3中:在所述歸類數據庫中利用所述N維表征向量進行聚類分析。
第四步驟S4中:經由模式識別建立運行記錄與跳閘之間的聯系以監測發電機組跳閘。
本發明的發電機組跳閘監測方法可以從電力調度的需求出發,基于大量的日常運行記錄和相關文件,利用自然語言分析的技術,自動從提取發電機組缺陷相關的描述,結合發電機組運行的規律,對發電機的缺陷進行聚類分析,抽取其中的有效信息,構建跳閘風險分析模型,實現機組跳閘事件的監測和風險預警功能。
在一個實施例中,第一步驟S1中:采用正則表達式對對不同字數組成的技術詞匯在調度日志中進行遍歷,再根據技術詞匯出現的頻率確定是否是關鍵詞匯,從而建立構成N維表征向量。每一個針對特定原因跳閘故障的詞匯集合就能夠構成一個N維表征向量,N就是詞匯集合的元素數量。
在一個實施例中,第一步驟S1中:對所述調度日志進行分詞,并分別計算通過分詞獲得的技術詞匯的詞頻作為其權重,所述N維表征向量的每個元素分別與所述關鍵詞匯相對應,每個元素的值分別為相對應的關鍵詞匯的權重。
在一個實施例中,第二步驟S2中:歸類數據庫采用大數據分布式存儲結構。
在一個實施例中,第二步驟S2中:在所述歸類數據庫的基礎上建立數據類型數據庫和知識類型的數據庫。根據運行記錄整理整個跳閘過程,厘清原因和關鍵環節,以跳閘原因和缺陷特點構建案例數據庫,數據可以建立在傳統的關系型數據庫基礎上,也可以采用典型的大數據分布式存儲結構,以便于數據庫的增量更新。在數據庫基礎上可以建立數據倉庫和知識倉庫。
在一個實施例中,第三步驟S3中:所述N維表征向量進行聚類計算,經由“二小值判斷法”劃分類簇,實現將不同關鍵詞匯分組,在所述歸類數據庫中查找與所述N維表征向量相對應的類簇。
在一個實施例中,第三步驟S3中:聚類分析采用基于劃分的聚類算法、基于層次的聚類算法、基于密度的聚類算法、基于網格的聚類算法或基于神經網絡的聚類算法。
在一個實施例中,第三步驟S3中:聚類分析采用K-Means算法、凝聚算法或DBSCAN算法。
在一個實施例中,第四步驟S4中:模式識別包括支撐向量機、神經網絡或遺傳算法。
圖2是根據本發明一個實施例的發電機組跳閘監測方法的流程示意圖,如圖2所示,首先,對發電機組的調度日志進行數據挖掘,通過語言分析篩選調度日志中的技術詞匯;詞頻的統計以及構建表征向量,對技術詞匯進行詞頻統計分析以建立關鍵詞匯集合,從而構成N維表征向量;然后,基于發電機組的運行記錄進行運行分析,跳閘分析中,按照汽水、燃料和電氣三個分類,對跳閘過程進行總結,然后根據運行記錄建立跳閘的歸類數據庫;聚類分析,在所述歸類數據庫中利用所述N維表征向量進行聚類分析;建立聯系以及開展監測,經由模式識別建立運行記錄與跳閘之間的聯系以監測發電機組跳閘。
如圖3所示的實施發電機組跳閘監測方法的監測裝置的結構示意圖,一種實施所述的發電機組跳閘監測方法的監測裝置包括用于詞頻統計分析的數據分解器1、用于構建歸類數據庫的歸類器2、用于聚類分析的聚類器3和用于模式識別的處理器4,其特征在于:所述數據分解器1包括對技術詞匯分詞的分詞單元5和生成N維表征向量的向量生成單元6,所述歸類器2包括大數據分布式存儲結構,所述聚類器3包括判斷單元7和分類處理單元8,所述處理器4包括模式識別單元9和存儲單元10。
在一個實施例中,處理器4是通用處理器、數字信號處理器、專用集成電路ASIC,現場可編程門陣列FPGA、模擬電路、數字電路及其組合。
在一個實施例中,所述存儲單元10是電子可擦除可編程只讀存儲器EEPROM。
使用了本發明的調度部門或發電企業,可以實現根據機組缺陷性質分析跳閘風險的能力,進而采取有效的防范措施,降低機組跳閘風險,減少經濟損失,提高發電機組,特別是火力發電機組的經濟和社會效益,為電網穩定運行提供支撐。
盡管以上結合附圖對本發明的實施方案進行了描述,但本發明并不局限于上述的具體實施方案和應用領域,上述的具體實施方案僅僅是示意性的、指導性的,而不是限制性的。本領域的普通技術人員在本說明書的啟示下和在不脫離本發明權利要求所保護的范圍的情況下,還可以做出很多種的形式,這些均屬于本發明保護之列。