本發明涉及電力系統可靠性分析領域,特別涉及一種用于配電網可靠性計算的設備故障率評估方法。
背景技術:
1、電力設備的健康狀態對電網的安全運行至關重要,設備的可靠性評估一直是電力行業的重要課題?,F有的評估方法主要集中在設備當前狀態的評價,常通過量化設備運行狀況的直接現象或試驗手段得到的間接參量,結合專家經驗和標準規范進行評估。然而,這些方法存在若干不足,包括扣分值表征設備狀態不夠細致準確、診斷閾值基于專家經驗缺乏數據統計支持、以及基于扣分值的狀態評價結果等效性不足。近年來,研究者們嘗試引入更多的現場數據、狀態參數和故障因素來提高故障率評估的準確性,尤其是通過統計模型和概率模型對設備故障率進行更科學的量化分析。然而,傳統模型往往不能準確描述設備的異質性和動態風險。
2、在現有針對配電網故障率的判別相關研究專利中,盡管方法在一定程度上改進了傳統評估模型,但仍存在一些技術上的缺點:
3、(1)結構復雜:某些專利方法涉及多步驟的計算和模型調整,使得實現過程復雜,難以在實際應用中快速部署和操作。
4、(2)成本高:由于需要大量的傳感器數據采集和實時監控設備,實施和維護成本較高,尤其是在大規模電網環境中。
5、(3)壽命短:某些方法依賴于特定的硬件設備或傳感器,隨著技術進步和設備更新,相關硬件的適用壽命較短,需頻繁更換和升級。
6、(4)數據依賴性強:部分專利過于依賴歷史數據和現場數據,對于數據量不足或數據質量不高的情況下,評估結果的準確性大打折扣。
7、(5)響應不及時:現有的許多方法缺乏實時動態更新機制,導致無法及時反映設備狀態的變化,延誤了故障預警和處理時機。
技術實現思路
1、為了克服現有技術中的不足,本發明提供一種用于配電網可靠性計算的設備故障率評估方法,解決現有技術中存在的結構復雜、成本高、壽命短、數據依賴性強、響應不及時的問題。
2、為了達到上述發明目的,解決其技術問題所采用的技術方案如下:
3、一種用于配電網可靠性計算的設備故障率評估方法,包括以下步驟:
4、步驟s1:收集設備參數,并構建模型識別設備老化、環境因素和維護情況對故障率的影響,分類故障因素;
5、步驟s2:構建設備故障率評估模型,計算設備綜合故障率;
6、步驟s3:構建權重分解模型,按特征進行權重分解,量化各因素對故障率的影響;
7、步驟s4:統計各地區的故障率,基于網絡權重系數,將地區故障率分解到各網格,基于饋線權重系數,將網格故障率分解到各饋線。
8、進一步的,步驟s1中,收集地區設備臺賬數據及設備運行數據,分析故障因素類型并進行分類,所收集的數據包括設備類型、歷史故障記錄、投運年限、生產廠家、以及地理區域信息,并通過統計分析和數據挖掘技術識別出影響設備故障率的主要因素,此步驟主要過程為數據預處理、故障因素識別、故障因素分類及分類結果統計,針對數據預處理的主要內容包括:
9、全面收集與中壓配電網設備相關的各類數據,確保數據的完整性和準確性;然后進行數據預處理,以確保后續分析的有效性和準確性;
10、剔除重復記錄,填補或刪除缺失值,修正數據中的錯誤和異常值;
11、對不同類型的數據進行統一的標準化處理,確保各變量在同一量綱下進行比較和分析。
12、進一步的,步驟s1中,針對收集的數據進行故障因素識別,主要內容包括:
13、在收集數據的基礎上,識別并分類影響設備故障率的主要因素,主要基于相關性分析和回歸分析,分析結果作為后續分類的基礎:
14、相關性分析:利用皮爾遜相關系數衡量各因素與故障率之間的線性相關性,通過計算各因素與故障率的相關系數,初步篩選出與故障率顯著相關的因素:
15、
16、其中,x、y分別代表研究變量;rxy為兩變量之間的相關系數,范圍為-1~1;
17、回歸分析:采用多元線性回歸或邏輯回歸模型,進一步分析多個因素對故障率的綜合影響,確定各因素對故障率的影響程度和顯著性:
18、y=β0+β1x1+β2x2+···+βnxn+∈
19、其中,y為故障率,x1,x2,···,xn為影響因素,β0為常數項,β1,β2,···,βn為回歸系數;∈為誤差項,服從正態分布。
20、進一步的,步驟s1中,針對收集的數據進行故障因素分類與聚類分析,主要內容包括:
21、在識別出主要故障因素后,按照不同的維度對其進行分類,以便于后續模型的構建和故障率的計算;
22、頻次分析:統計各類故障因素在歷史數據中的出現頻次,識別出高頻故障因素,優先考慮出現頻率較高的故障因素,作為主要影響因素;
23、
24、其中,fi為第i個故障因素的頻率,ni為第i個故障因素出現的次數,ntotal為所有故障因素出現的總次數;
25、設備類型:針對中壓配電網,主要涉及的設備包括配電變壓器、架空線、電纜線、上級電源、斷路器、負荷開關、隔離開關等,這些設備的可靠性直接影響配電網的整體性能;
26、投運年限:指各類設備自投運至今的使用時間,將投運年限分為四個時間段:0-5年、5-10年、10-15年、15年以上,不同時間段的設備具有不同的故障風險;
27、生產廠家:設備的生產廠家是影響故障率的另一個重要因素,如果某一地區的生產廠家過多,將主要考慮數量占比超過10%的廠家,其他較為分散的廠家則歸為“其他”類;
28、地理區域:設備的地理分布是指每類設備在地區內的分布情況,地理區域分為饋線、網格和地區三個層級,若干條饋線組成一個網格,若干個網格組成一個地區,因此,通過統計設備在饋線中的分布情況,即可推導出設備在網格和地區的分布情況;
29、聚類分析:分類完成后,使用聚類分析對已分類的設備進行細化,采用k-means聚類將具有相似特征的故障因素歸為同一類,以便于后續的分類和分析。
30、進一步的,所述聚類分析包括以下內容:
31、(1)初始化:選擇k個初始聚類中心;
32、(2)分配:將每個數據點分配到距離最近的聚類中心所屬的簇;
33、(3)更新:重新計算每個簇的聚類中心;
34、(4)迭代:重復步驟(2)和(3),直到聚類中心不再發生顯著變化或達到預設的迭代次數。
35、進一步的,步驟s2中,基于貝葉斯神經網絡,構建設備故障率預測模型,對各類設備的故障率進行初步預測,包括以下內容;
36、貝葉斯神經網絡的結構由輸入層、隱藏層與輸出層組成,貝葉斯神經網絡中的隱藏層為概率層,通過從第i層的貝葉斯層的分布中進行取樣,進而第i+1層貝葉斯層權重上引入不確定性;
37、貝葉斯神經網絡在參數采樣過程中,對權重計算公式為:
38、
39、對偏置計算的公式為:
40、
41、其中,對應于具有n個樣本的第i層的貝葉斯層線性變換的權重及其偏置,其中ρi為樣本采樣的標準差,μi為樣本采樣的平均值,為標準;
42、通過構建不同的貝葉斯線性層,推斷訓練集數據y和x的模型參數ω上的后驗分布p(ω|x,y),其公式為:
43、
44、完成擬合訓練集后的后驗分布p(ω|x,y),存在新的數據點xpre時,輸入模型通過對在ω上積分,即可得到的xpre的預測分布,其公式如下:
45、p(ypre|xpre,x,y)=∫p(ypre|xpre,ω)p(ω|x,y)dω
46、在預測過程中,每次從后驗分布p(ω|x,y)中抽取一個樣本n,并獲得給定n的新數據點xpre上的點估計ypre,上述操作被重復多次,由此可以獲得新數據點xpre的分布估計。
47、進一步的,步驟s2中,對貝葉斯神經網絡,通過設置損失函數與優化器進行訓練及參數優化,包括以下內容:
48、bnn的損失函數不僅需要衡量預測故障率與實際故障的差異,還需要考慮貝葉斯推理中對參數不確定性的建模,使用負對數似然損失函數:
49、l(θ)=-∑logp(y|x,θ)
50、其中,y是實際的故障標簽(0或1);x是設備的輸入特征;θ是網絡的參數權重和偏置;p(y|x,θ)是給定參數θ下,模型預測的概率分布;
51、為了最小化損失函數,使用adam優化器,其作為梯度下降類的優化方法,能夠自適應地調整學習率,適合處理貝葉斯神經網絡的復雜性,adam的權重更新公式為:
52、mt=β1mt-1+(1-β1)gt
53、
54、
55、其中,gt為損失函數l(θ)在當前權重下的梯度;β1為動量因子,用來更新平滑梯度,防止梯度過于波動,常見的默認值是β1=0.9,即90%的新梯度信息與10%的過去信息進行加權平均;mt為當前時刻梯度的一階動量,類似于加權平均;vt為二階矩估計,類似于一階矩,adam使用梯度的平方來計算二階矩,即梯度平方的移動平均,平衡梯度更新中的大小不均勻現象;是對mt和vt的偏差修正;adam結合修正過的梯度動量和梯度方差估計值來更新權重wt;η是學習率,決定每次更新時權重調整的大?。弧适且粋€極小的常數,用于避免除零錯誤。
56、進一步的,步驟s3中,利用貝葉斯神經網絡將設備故障率分解為不同故障因素的權重,通過對各類設備故障因素的權重分解,能夠精準地識別每種因素對設備故障率的影響;
57、將故障因素納入考慮的設備故障率可表示為:
58、r=∑wi·fi
59、其中,wi為對應故障因素fi的權重;
60、針對權重w,則以故障因素為輸入,以每個故障因素的權重分布為輸出,構建bnn權重分解模型,此時模型的簡單結構為:輸入層-貝葉斯層-輸出層。
61、進一步的,步驟s3中,利用貝葉斯神經網絡將設備故障率分解為不同故障因素的權重,所述bnn權重分解模型的訓練步驟如下:
62、(1)確定似然函數,給定訓練數據定義似然函數p(d|ω):
63、
64、其中,xi是輸入特征向量,包括設備投運年限、設備所屬區域、設備生產廠家,yi是輸出故障率,ω是網絡權重;
65、(2)確定后驗分布,計算后驗分布p(ω|d):
66、
67、由于p(d)是常數,可以忽略,簡化為:
68、p(ω|d)∝p(d|ω)p(ω)
69、變分推斷,將后驗分布p(ω|d)近似為一個易處理的分布q(ω),并通過最小化兩個分布之間的差異來找到最優的近似解,具體步驟為:
70、選擇近似分布:選擇一個易于處理的分布q(ω)來近似后驗分布p(ω|d),使用高斯分布:
71、q(ω)=n(μ,σ2)
72、其中,μ為均值,σ2為方差;
73、定義變分目標:使用證據下界(elbo,evidence?lower?bound)來近似優化目標;
74、elbo=eq(ω)[logp(d|ω)]-kl(q(ω)||p(ω))
75、其中,第一個項為期望似然函數,即期望模型對觀測數據的擬合程度;第二項為kullback-leibler散度,用于衡量近似分布q(ω)與先驗分布p(ω)之間的差異;
76、梯度優化:使用梯度下降方法來更新q(ω)的參數,以最大化elbo;
77、當elbo收斂或優化達到預設的迭代次數時,變分推斷結束,此時的q(ω)被認為是后驗分布的最優近似;
78、迭代預測,輸出權重結果wi。
79、進一步的,步驟s4中,將bnn模型得到的權重分布應用于實際故障率數據中,逐層分解故障率,計算公式如下:
80、ri=wage·fage+wreg·freg+wmaf·fmaf
81、其中,ri為i類設備的故障率,wage為設備投運年限的權重,wreg為設備所屬區域的權重,wmaf為設備生產廠家的權重;fage為設備投運年限的故障率水平,freg為設備所屬區域的故障率水平,fmaf為設備生產廠家的故障率水平,fage,freg,fmaf基于步驟s2計算得到,wage,wreg,wmaf基于步驟s3計算得到;
82、基于網格權重系數,將地區故障率分解到各網格:
83、λgrid=λregion·wgrid
84、其中,wgrid為網格權重系數:
85、
86、上式中,ngrid為網格內的設備數量,fbnn是權重分解模型,xi是網格內設備的特征向量;
87、基于饋線權重系數,將網格故障率分解到各饋線:
88、λfreeder=λgrid·wfreeder
89、其中,wfreeder為網格權重系數計算方法為:
90、
91、上式中,nfreeder為饋線內的設備數量,fbnn是權重分解模型,xi是饋線內設備的特征向量。
92、本發明由于采用以上技術方案,使之與現有技術相比,具有以下的優點和積極效果:
93、1.本發明利用機器學習的自適應學習能力,簡化了傳統模型中的復雜計算步驟,降低了實現難度和操作復雜性。
94、2.本發明通過優化數據采集和處理流程,減少對大量傳感器和實時監控設備的依賴,降低了實施和維護成本。
95、3.本發明采用更通用的軟件算法減少對特定硬件設備的依賴,提升了方法的適應性和可持續性,延長了整體解決方案的適用壽命。
96、4.本發明對設備故障率進行動態更新和優化,提高了評估結果的準確性,特別是在數據量不足或質量不高的情況下。
97、5.本發明引入實時數據動態更新機制,使得模型能夠及時反映設備狀態的變化,增強了故障預警和處理的及時性。