基于自適應動態規劃的單區域電力系統頻率復合控制方法與流程

文檔序號：12131358閱讀：420來源：國知局

本發明涉及電力系統頻率控制技術領域，尤其是涉及一種基于自適應動態規劃的單區域電力系統頻率復合控制方法。

背景技術：

大型電力系統通常由多個區域組成，每個區域通過聯絡線與相鄰區域相互連接。隨著電能需求的增長和可再生能源發電技術的日益成熟，現代電力系統逐步發展為融入分布式發電和隨機負荷的智能電網，負荷需求和發電量變得越來越隨機，電氣元件也越來越豐富。

當電力系統規模較小時，可以將整個電力系統看作一個區域，即單區域電力系統。單區域電力系統遇到多個隨機負荷變化時，系統的頻率可能會發生嚴重振蕩，這時采用有效的電力系統頻率控制方法，維持電力系統頻率穩定變得尤其重要。結合單區域電力系統的特點，一些控制方法逐漸引起了人們的關注。例如，圍繞比例積分微分(Proportion-integration-differentiation,PID)控制、內模控制、滑模控制、模糊邏輯控制等方法，已經開展了一些電力系統負荷頻率控制的研究。這些方法的應用，從不同程度上提高了電力系統頻率控制的性能，但仍然可以提高，因為這些方法缺乏在線學習和自適應能力。

因此，在隨機負荷變化情況下，保證電力系統的安全和頻率穩定，已經成為智能電網發展的一個主要挑戰。

技術實現要素：

為了解決現有技術中的上述問題，即為了解決單區域電力系統在隨機負荷變化情況下，系統實際頻率偏離標稱值的技術問題而提供一種基于自適應動態規劃的單區域電力系統頻率復合控制方法。

為了實現上述目的，提供了以下技術方案：

一種基于自適應動態規劃的單區域電力系統頻率復合控制方法，所述方法包括：

獲取如下測量信號：單區域電力系統調速器時間常數、發電機時間常數、區域負荷時間常數、區域負荷增益、單區域電力系統頻率偏差；

利用比例積分控制器和自適應動態規劃控制器，根據所述測量信號生成比例積分控制信號和自適應動態規劃控制信號，并將二者疊加，得到復合控制信號；

將所述復合控制信號應用到所述單區域電力系統中，進行頻率控制。

優選地，所述生成比例積分控制信號具體包括：

根據下式分別確定調速器等效模型、發電機等效模型和當地負荷等效模型的傳遞函數模型：

其中，所述G_g(s)表示所述調速器等效模型的所述傳遞函數模型；所述s表示拉普拉斯變換中的復數變量；所述T_g表示調速器時間常數；所述G_t(s)表示所述發電機等效模型的所述傳遞函數模型；所述T_t表示發電機時間常數；所述G_p(s)表示所述當地負荷等效模型的所述傳遞函數模型；所述k_p表示區域負荷增益；所述T_p表示區域負荷時間常數；

基于所述調速器、所述發電機和所述當地負荷的所述等效模型，建立單區域電力系統仿真模型；

根據所述單區域電力系統仿真模型，使用湊試法獲得比例積分控制器的參數；

基于所述單區域電力系統仿真模型及所述比例積分控制器的參數，以所述單區域電力系統頻率偏差為調節變量，根據下式計算所述比例積分控制信號：

其中，所述u₁(t)表示所述比例積分控制信號；所述K_p表示比例系數；所述Δf(t)表示所述單區域電力系統頻率偏差；所述K_i表示積分系數；所述τ表示積分變量；所述t表示時間變量。

優選地，所述自適應動態規劃控制信號具體包括：

根據下式確定行為網絡的輸入信號：

m_f＝max{|Δf(t)|，|Δf(t-Δt)|}

其中，所述x_a(t)表示所述行為網絡的輸入信號；所述t表示當前時刻；所述t-Δt表示當前時刻的一步延遲；所述m_f表示歸一化系數；所述|Δf(t)|表示所述Δf(t)的絕對值；所述Δf(t)表示t時刻對應的單區域電力系統頻率偏差；所述|Δf(t-Δt)|表示所述Δf(t-Δt)的絕對值；所述Δf(t-Δt)表示所述t-Δt時刻對應的單區域電力系統頻率偏差；

根據下式計算得到所述自適應動態規劃控制信號：

其中，p_aj(t)表示行為網絡第j個隱層神經元的輸入；x_ai(t)表示行為網絡第i個輸入神經元的輸入，w_a1,ij(t)表示行為網絡第i個輸入神經元到第j個隱層神經元的權值，表示隱層神經元數目；表示行為網絡輸入層神經元數目；q_aj(t)表示行為網絡第j個隱層神經元的輸出；σ_a表示行為網絡的激活函數；v_ak(t)表示行為網絡第k個輸出神經元的輸入，表示輸出層神經元數目；w_a2,jk(t)表示行為網絡第j個隱層神經元到第k個輸出神經元的權值；u_2k(t)表示行為網絡第k個輸出神經元的輸出。

優選地，所述自適應動態規劃控制信號具體還包括：

采用評價網絡確定所述自適應動態規劃控制器的最小代價；

更新所述行為網絡的權值；

更新所述評價網絡的權值。

優選地，所述采用評價網絡確定所述自適應動態規劃控制器的最小代價，具體包括：

根據下式確定所述評價網絡的輸入信號：

其中，所述c_i(t)表示所述評價網絡的所述輸入信號；所述表示所述行為網絡輸入信號的轉置；所述表示所述自適應動態規劃控制信號的轉置；

根據所述評價網絡的輸入信號計算所述最小代價：

其中，所述p_cj(t)表示所述評價網絡第j個隱層神經元的輸入，所述所述表示隱層神經元數目；所述x_ai(t)表示所述行為網絡第i個輸入神經元的輸入，所述所述表示評判網絡輸入層神經元數目，所述w_c1，ij(t)表示所述評價網絡第i個輸入神經元到第j個隱層神經元的權值；所述q_cj(t)表示所述評價網絡第j個隱層神經元的輸出；所述σ_c表示所述評價網絡的激活函數；所述表示t時刻的最小代價；所述w_c2,j(t)表示所述評價網絡第j個隱層神經元到輸出神經元的權值。

優選地，所述更新所述行為網絡的權值具體包括：

根據下式確定行為網絡誤差：

其中，所述E_at(l)表示所述行為網絡誤差；所述l表示所述行為網絡權值在t時刻的內部迭代次數；所述表示t時刻的最小代價；

設置權值訓練許可誤差和最大迭代次數，并根據下式進行內部迭代，更新所述行為網絡權值：

其中，所述所述所述和所述分別表示t時刻行為網絡隱層神經元和輸入層神經元第l次迭代的權值梯度；所述和所述分別表示t時刻行為網絡隱層神經元和輸入層神經元第l+1次迭代的權值；λ_a表示行為網絡的學習率；

當所述行為網絡誤差滿足第一誤差閾值或所述行為網絡內部迭代次數達到第一次數閾值時，停止所述行為網絡內部迭代，得到行為網絡隱層神經元和輸入層神經元權值。

優選地，所述更新所述評價網絡的權值具體包括：

根據下式計算效用函數：

其中，所述R(t)表示所述效用函數；所述Q＝diag(1,0.5)；所述x_a(t)表示所述行為網絡的所述輸入信號；表示所述行為網絡輸入信號的轉置；

基于所述效用函數，設置評價網絡權值訓練許可誤差和最大迭代次數，根據下式確定評價網絡誤差：

其中，所述表示對第次迭代的評價網絡誤差；所述表示所述評價網絡權值在t時刻的內部迭代次數；所述表示t時刻的最小代價；所述表示t-Δt時刻的最小代價；所述γ表示折扣因子；所述Δt表示采樣時間；

采用梯度下降法，根據下式進行內部迭代，更新所述評價網絡權值：

其中，所述所述所述和所述分別表示t時刻評價網絡隱層神經元和輸入層神經元第次迭代的權值梯度；所述和所述表示t時刻評價網絡隱層神經元和輸入層神經元第次迭代的權值；所述λ_c表示評價網絡的學習率；

當所述評價網絡誤差滿足第二誤差閾值或評價網絡內部迭代次數達到第二次數閾值時，停止所述評價網絡內部迭代，得到評價網絡隱層神經元和輸入層神經元權值。

優選地，所述將所述復合控制信號應用到所述單區域電力系統中，進行頻率控制，具體包括：

步驟1：在初始時刻t₀，單區域電力系統管理和控制單元SMMC收到頻率偏差Δf(t₀)，計算出所述t₀時刻的所述比例積分控制信號，并確定出行為網絡的輸入其中，所述m_f＝1.2|Δf(t₀)|，計算出所述t₀時刻的所述自適應動態規劃控制信號，再將所述比例積分控制信號和所述自適應動態規劃控制信號發送至所述單區域電力系統中的各參與單元；

步驟2：在[0,1]區間上隨機初始化行為網絡權值w_a2，jk(t₀)和w_a1,ij(t₀)以及評價網絡權值w_c2,jk(t₀)和w_c1，ij(t₀)；

步驟3：初始化自適應動態規劃參數：代價函數目標值，行為網絡的輸入層神經元數目、隱層神經元數目、輸出層神經元數目，評判網絡的輸入層神經元數目、隱層神經元數目、輸出層神經元數目，行為網絡學習率，評判網絡學習率，行為網絡權值訓練許可誤差，權值訓練最大迭代次數，評判網絡權值訓練許可誤差及最大迭代次數；

步驟4：在時刻t，所述SMMC收到所述頻率偏差Δf(t)，計算出所述比例積分控制信號；經過數據預處理后，得到所述行為網絡的輸入x_a(t)，使用所述行為網絡權值w_a2，jk(t)和w_a1,ij(t)，計算得到所述自適應動態規劃控制信號；使用所述評價網絡權值w_c2，jk(t)和w_c1，ij(t)輸出最小代價；

步驟5：計算行為網絡誤差、效用函數和評價網絡誤差，分別更新所述行為網絡權值w_a2,jk(t+Δt)和w_a1,ij(t+Δt)以及所述評價網絡權值w_c2，jk(t+Δt)和w_c1,ij(t+Δt)，并在下一個時間步長時使用新的權值；

步驟6：將所述比例積分控制信號和所述自適應動態規劃控制信號進行疊加，得到復合控制信號并由所述SMMC發送給所述單區域電力系統中的所述各參與單元，并進入下一個時間步長t+Δt，重復步驟4至步驟6。

本發明所構思的技術方案與現有技術相比，具有以下有益效果：

本發明提供一種基于自適應動態規劃的單區域電力系統頻率復合控制方法。其中，該方法包括：獲取如下測量信號：單區域電力系統調速器時間常數、發電機時間常數、區域負荷時間常數、區域負荷增益、單區域電力系統頻率偏差；利用比例積分控制器和自適應動態規劃控制器，然后，根據測量信號生成比例積分控制信號和自適應動態規劃控制信號，并將二者疊加，得到復合控制信號；再將復合控制信號應用到單區域電力系統中，進行頻率控制。本發明通過將PI控制量與自適應動態規劃控制量相加，構成復合控制量，解決了包含調速器、發電機和當地負荷的單區域電力系統在隨機負荷變化情況下，系統實際頻率偏離標稱值的技術問題，實現了快速有效的單區域電力系統頻率調節，實現了自適應頻率控制，消除了頻率偏差(頻率波動)，是符合智能電網技術的應用需求和發展趨勢的。

附圖說明

圖1是根據本發明實施例的基于自適應動態規劃的單區域電力系統頻率復合控制方法的流程示意圖；

圖2是根據本發明實施例的單區域電力系統等效模型的結構和信號傳輸示意圖；

圖3是根據本發明實施例的自適應動態規劃控制器原理示意圖；

圖4是根據本發明實施例的將基于自適應動態規劃的單區域電力系統頻率復合控制方法應用于單區域電力系統中進行頻率控制的示意圖；

圖5是根據本發明實施例的單區域電力系統的隨機負荷變化信號示意圖；

圖6是根據本發明實施例的單區域電力系統在隨機負荷變化下，采用比例積分控制器和本發明實施例所提的復合控制器的頻率偏差的控制效果比較示意圖；

圖7是根據本發明實施例的單區域電力系統在隨機負荷變化下頻率偏差的復合控制量和PI控制量比較示意圖；

圖8是根據本發明實施例的在10s、30s、50s、70s時的隨機負荷干擾下，復合控制器中的自適應動態規劃控制量的示意圖。

具體實施方式

為了使本發明的目的、技術方案及優點更加清楚明白，下面參照附圖來描述本發明的優選實施方式。應當理解，此處所描述的具體實施例僅僅用以解釋本發明，并不用于限定本發明。此外，下面所描述的本發明實施方式中所涉及到的技術特征只要彼此之間未構成沖突就可以相互組合。

隨著智能控制技術的出現，自適應動態規劃(Adaptive dynamic programming，ADP)方法已經在多個工業領域得以應用，如機器人、飛行器、化工過程和智能電網。這種方法的主要的優點是它的在線學習能力，使被控對象在受擾情況下具有自適應能力。將這種自適應控制技術應用于電力系統的負荷頻率控制(Load frequency control，LFC)中，解決現代電網隨機負荷變化等問題，具有十分重要的意義。

本發明實施例的基本思想是基于單區域電力系統頻率控制問題，以比例積分控制器為基礎控制器，對于多個隨機負荷變化，保持PI控制器參數不變，以自適應動態規劃控制器為上層控制器的復合控制策略，對于多個隨機負荷變化，根據電力系統當前頻率偏差進行在線自適應調整，在線進行自適應動態規劃控制器權值更新，獲得相應的自適應動態規劃控制量，使電力系統頻率回到規定值。

為此，本發明實施例提供一種基于自適應動態規劃的單區域電力系統頻率復合控制方法。如圖1所示，該方法可以通過步驟S100至步驟S120來實現。其中：

S100：獲取如下測量信號：單區域電力系統調速器時間常數、發電機時間常數、區域負荷時間常數、區域負荷增益、單區域電力系統頻率偏差。

本步驟可以通過分布式傳感器來測量單區域電力系統的所有信號，再由通信信道傳輸到微電網管理和控制系統(Smart Micro-Grid Management and Control,SMMC)。然后，由SMMC處理，產生控制信號，再通過通信信道送至單區域電力系統中每個參與單元中。

單區域電力系統包括發電機、調速器和單區域當地負荷。其中，發電機提供電能供給；調速器控制發電機的速度,防止發電機損壞；當地負荷是該電力系統的需求側，消耗電能。

S110：利用比例積分控制器和自適應動態規劃控制器，根據上述測量信號生成比例積分控制信號和自適應動態規劃控制信號，并將二者疊加，得到復合控制信號。

本步驟以比例積分控制器(PI控制器)為基礎控制器，以自適應動態規劃控制器為上層控制器。

其中，生成PI(比例積分)控制信號的步驟具體可以包括：

S111：根據下式分別確定調速器、發電機和當地負荷等效模型的傳遞函數模型：

其中，G_g(s)表示調速器等效模型的傳遞函數模型；s表示拉普拉斯變換中的復數變量；T_g表示調速器時間常數；G_t(s)表示發電機等效模型的傳遞函數模型；T_t表示發電機時間常數；G_p(s)表示當地負荷等效模型的傳遞函數模型；k_p表示區域負荷增益；T_p表示區域負荷時間常數。

S112：基于調速器、發電機和當地負荷的等效模型，建立單區域電力系統仿真模型。

具體地，本步驟進一步可以包括：

SA1：根據單區域電力系統頻率偏差及其積分參數，確定狀態向量。

作為示例，單區域電力系統的狀態向量x＝[Δf(t),ΔP_t(t),ΔX_g(t),ΔE(t)]^T。

SA2：基于狀態向量，根據下式建立單區域電力系統仿真模型：

其中，表示Δf(t)對時間的一階微分，即表示單區域電力系統頻率偏差；Δd(t)表示單區域電力系統隨機負荷變化產生的負荷干擾；ΔP_t(t)表示單區域電力系統發電機輸出功率變化量；表示ΔP_t(t)對時間的一階微分，即ΔX_g(t)表示單區域電力系統調節器位置偏差值；表示ΔX_g(t)對時間的一階微分，即r表示單區域電力系統的等效阻抗；ΔE(t)表示區域控制偏差，即單區域電力系統頻率偏差的積分，表示ΔE(t)對時間的一階微分，即u(t)表示控制信號；k_e表示積分增益系數。

其中，當Δd(t)＞0時相當于消耗電能增加；當Δd(t)＜0時相當于向電網輸入電能。

圖2示例性地示出了單區域電力系統等效模型的結構和信號傳輸圖。

S113：根據單區域電力系統仿真模型，使用湊試法獲得比例積分控制器的參數。

具體地，本步驟可以包括：

步驟a1：確定調節器的比例系數和積分系數的值。

步驟a2：通過改變給定值對系統加一個擾動，觀察曲線形狀。

步驟a3：通過改變比例系數或積分系數的值，反復湊試直到被控量符合動態過程品質要求為止。

步驟a4：保留步驟a3最終得到的比例系數和積分系數為PI控制器的參數。

S114：基于單區域電力系統仿真模型及比例積分控制器的參數，以單區域電力系統頻率偏差為調節變量，根據下式計算比例積分控制信號：

其中，u₁(t)表示比例積分控制信號；K_p表示比例系數；Δf(t)表示單區域電力系統頻率偏差；K_i表示積分系數；τ表示積分變量；t表示時間變量，例如時刻。

其中，生成自適應動態規劃控制信號的步驟具體可以包括：

S115：根據下式確定行為網絡的輸入信號：

其中，x_a(t)表示行為網絡的輸入信號；t表示當前時刻；t-Δt表示當前時刻的一步延遲；m_f表示歸一化系數，m_f＝max{|Δf(t)|，|Δf(t-Δt)|}；|Δf(t)|表示Δf(t)的絕對值；Δf(t)表示t時刻對應的單區域電力系統頻率偏差；|Δf(t-Δt)|表示Δf(t-Δt)的絕對值；Δf(t-Δt)表示t-Δt時刻對應的單區域電力系統頻率偏差。

優選地，行為網絡采用多層感知機神經網絡來實現。

可以對行為網絡的參數進行如下初始：設置為代價函數目標值U_C＝0、行為網絡輸入層神經元數目、隱層神經元數目、輸出層神經元數目、行為網絡學習率、行為網絡權值訓練許可誤差及權值訓練最大迭代次數。

S116：根據下式計算得到自適應動態規劃控制信號：

由于單區域電力系統的自適應動態規劃控制器輸出是一維的，即行為網絡輸出神經元數目為1，即k＝1。因此，自適應動態規劃控制信號u₂(t)＝u₂₁(t)。采用行為網絡輸出自適應動態規劃控制信號。

在上述實施例的基礎上，本發明實施例提供的方法還可以包括：

S117：采用評價網絡確定自適應動態規劃控制器的最小代價。

優選地，評價網絡采用多層感知機神經網絡來實現。

圖3示例性地示出了自適應動態規劃控制器原理圖。

可以對評價網絡進行如下初始化：設置評判網絡輸入層神經元數目、隱層神經元數目、輸出層神經元數目、評判網絡學習率、評判網絡權值訓練許可誤差和最大迭代次數。

具體地，本步驟可以包括：

SB1：根據下式確定評價網絡的輸入信號：

其中，c_i(t)表示評價網絡的輸入信號；表示行為網絡輸入信號的轉置；表示自適應動態規劃控制信號的轉置。

上述評價網絡的輸入為和組成的向量。

SB2：根據評價網絡的輸入信號計算最小代價：

其中，p_cj(t)表示評價網絡第j個隱層神經元的輸入，表示隱層神經元數目；x_ai(t)表示行為網絡第i個輸入神經元的輸入，表示評判網絡輸入層神經元數目，w_c1，ij(t)表示評價網絡第i個輸入神經元到第j個隱層神經元的權值；q_cj(t)表示評價網絡第j個隱層神經元的輸出；σ_c表示評價網絡的激活函數；表示t時刻的最小代價，該最小代價可以為評價網絡在t時刻的輸出值；w_c2,j(t)表示評價網絡第j個隱層神經元到輸出神經元的權值。

對于多個隨機負荷變化，保持PI控制器參數不變。以自適應動態規劃控制器為上層控制器，對于多個隨機負荷變化，根據系統頻率偏差，在線進行自適應動態規劃控制器權值更新，獲得相應的自適應動態規劃控制量。

S118：更新行為網絡的權值w_a1,ij(t)和w_a2,jk(t)。

步驟b1：根據下式確定行為網絡誤差：

其中，E_at(l)表示行為網絡誤差；l表示行為網絡權值在t時刻的內部迭代次數；表示t時刻的最小代價。

步驟b2：設置權值訓練許可誤差和最大迭代次數，并根據下式進行內部迭代，更新行為網絡權值：

其中，和分別表示t時刻行為網絡隱層神經元和輸入層神經元第l次迭代的權值梯度；和分別表示t時刻行為網絡隱層神經元和輸入層神經元第l+1次迭代的權值；λ_a表示行為網絡的學習率，優選地，λ_a＞0。

其中，和也表示進行內部迭代的行為網絡權值w_a1,ij(t)和w_a2,jk(t)。

步驟b3：當行為網絡誤差滿足第一誤差閾值或行為網絡內部迭代次數達到第一次數閾值時，停止行為網絡內部迭代，得到行為網絡隱層神經元和輸入層神經元權值。

舉例來說，當獲得的權值和使行為網絡誤差E_at(l)滿足E_at(l)≤ε_a時，停止行為網絡內部迭代，輸出權值和為t+1時刻行為網絡隱層神經元和輸入層神經元權值，即：

或者當獲得的權值和使行為網絡內部迭代次數l滿足l＝M_a時，停止行為網絡內部迭代，輸出權值和為t+1時刻行為網絡隱層神經元和輸入層神經元權值，同樣地，有和

S119：更新評價網絡的權值。

具體地，本步驟可以包括：

步驟c1：根據下式計算效用函數：

其中，R(t)表示效用函數；Q＝diag(1,0.5)；x_a(t)表示行為網絡的輸入信號；表示行為網絡輸入信號的轉置。

步驟c2：基于效用函數，設置評價網絡權值訓練許可誤差和最大迭代次數，根據下式確定評價網絡誤差：

其中，表示對第次迭代的評價網絡誤差；表示評價網絡權值在t時刻的內部迭代次數；表示t時刻的最小代價；表示t-Δt時刻的最小代價；γ表示折扣因子，優選地，0＜γ＜1；t表示時刻；Δt表示采樣時間。

步驟c3：采用梯度下降法，根據下式進行內部迭代，更新評價網絡權值：

其中，和分別表示t時刻評價網絡隱層神經元和輸入層神經元第次迭代的權值梯度；和表示t時刻評價網絡隱層神經元和輸入層神經元第次迭代的權值；λ_c表示評價網絡的學習率，優選地，λ_c＞0。

和也分別表示進行內部迭代的評價網絡權值w_c1,ij(t)和w_c2,j(t)。

步驟c4：當評價網絡誤差滿足第二誤差閾值或評價網絡內部迭代次數達到第二次數閾值時，停止評價網絡內部迭代，得到評價網絡隱層神經元和輸入層神經元權值。

舉例來說，當獲得的權值和使評價網絡誤差滿足時，停止評價網絡內部迭代，輸出權值和為t+1時刻評價網絡隱層神經元和輸入層神經元權值，即：

或者，當獲得的和使評價網絡內部迭代次數滿足時，停止評價網絡內部迭代，輸出權值和為t+1時刻評價網絡隱層神經元和輸入層神經元權值，同樣地，有和

S120：將上述復合控制信號應用到單區域電力系統中，進行頻率控制。

圖4示例性地示出了將本發明實施例提供的方法應用于單區域電力系統中進行頻率控制的示意圖。

下面結合圖4以一優選實施例來對將復合控制信號應用到單區域電力系統中，進行頻率控制的步驟進行詳細說明。其中，該步驟可以包括：

S121：在初始時刻t₀，單區域電力系統管理和控制單元SMMC收到頻率偏差Δf(t₀)，計算出t₀時刻的比例積分控制信號，并確定出行為網絡的輸入其中，m_f＝1.2|Δf(t₀)|，計算出t₀時刻的自適應動態規劃控制信號，再將比例積分控制信號和自適應動態規劃控制信號發送至單區域電力系統中的各參與單元。

S122：在[0,1]區間上隨機初始化行為網絡權值w_a2,jk(t₀)和w_a1,ij(t₀)，以及評價網絡權值w_c2,_jk(t₀)和w_c1，ij(t₀)。

S123：初始化自適應動態規劃參數：代價函數目標值U_C＝0，行為網絡的輸入層神經元數目隱層神經元數目輸出層神經元數目評判網絡的輸入層神經元數目隱層神經元數目輸出層神經元數目行為網絡學習率λ_a，評判網絡學習率λ_c，行為網絡權值訓練許可誤差ε_a，權值訓練最大迭代次數M_a，評判網絡權值訓練許可誤差ε_c及最大迭代次數M_c。

S124：在時刻t，SMMC收到頻率偏差Δf(t)，計算出u₁(t)；經過數據預處理后，得到行為網絡的輸入x_a(t)，使用行為網絡權值w_a2,jk(t)和w_a1,ij(t)，計算得到自適應動態規劃控制信號u₂(t)；使用評價網絡權值w_c2,jk(t)和w_c1,ij(t)輸出最小代價

S125：計算行為網絡誤差E_at(l)、效用函數R(t)和評價網絡誤差分別更新行為網絡權值w_a2,jk(t+Δt)和w_a1,ij(t+Δt)以及評價網絡權值w_c2，jk(t+Δt)和w_c1,ij(t+Δt)，并在下一個時間步長時使用新的權值。

S126：將比例積分控制信號和自適應動態規劃控制信號進行疊加，得到復合控制信號并由SMMC發送給單區域電力系統中的各參與單元，并進入下一個時間步長t+Δt，重復步驟S204至步驟S206。

為使本領域技術人員更好地理解本發明，下面再結合具體實施例，對單區域電力系統頻率復合控制方法進行詳細說明。

S301：針對單區域電力系統，進行如下設置：調速器時間常數T_g＝0.1、發電機時間常數T_t＝0.3、區域負荷的時間常數T_p＝10、區域負荷增益k_p＝1、電路阻抗r＝0.05、積分增益系數k_e＝0.4。

S302：針對單區域電力系統，分別在10s、30s、50s、70s時加入幅值為+0.15、-0.3、+0.25、-0.1的隨機階躍信號作為隨機負荷變化信號。

本步驟也就是在10s、30s、50s、70s時的隨機負荷干擾分別是Δd＝0.15、Δd＝-0.15、Δd＝0.1、Δd＝0。

圖5示例性地示出了單區域電力系統的隨機負荷變化信號圖。

S303：使用的比例系數K_p＝10和積分系數K_i＝50設計自適應動態規劃控制器。

S304：隨機初始化行為網絡權值w_a2,jk(0)和w_a1,ij(0)以及評價網絡權值w_c2,j(0)和w_c1,ij(0)，t₀＝0。

S305：設置自適應動態規劃控制器的參數：采樣時間Δt＝0.05s，代價函數目標值U_C＝0、行為網絡輸入層神經元數目隱層神經元數目輸出層神經元數目評判網絡輸入層神經元數目評判網絡隱層神經元數目評判網絡輸出層神經元數目行為網絡學習率λ_a＝0.05、評判網絡學習率λ_c＝0.05、行為網絡權值訓練許可誤差ε_a＝10^-6、權值訓練最大迭代次數M_a＝80、評判網絡權值訓練許可誤差ε_c＝10^-7及最大迭代次數M_c＝50。

圖6示例性地示出了單區域電力系統在隨機負荷變化下，采用比例積分控制器和本發明實施例所提的復合控制器(比例積分控制器和自適應動態規劃控制器)的頻率偏差的控制效果比較示意圖。其中虛線是采用比例積分控制器的頻率偏差的控制效果；實線是采用復合控制器的頻率偏差的控制效果。可見，采用復合控制器，頻率偏差調節具有更小的超調，頻率偏差到0的速度也更快。

圖7示例性地示出了單區域電力系統在隨機負荷變化下頻率偏差的復合控制量(PI控制信號和自適應動態規劃控制信號)和PI控制量比較示意圖。該圖說明了復合控制器相比于PI控制器，能夠提供更好的控制性能。當頻率偏差發生時，在復合控制器的作用下，頻率偏差減小較快，超調也較小。

圖8示例性地示出了在10s、30s、50s、70s時的隨機負荷干擾下，復合控制器中的自適應動態規劃控制量的示意圖。該控制量依據頻率偏差的變化，自適應地給出控制量，使得復合控制器具有更好的控制性能。

S306：分別確定調速器、發電機和當地負荷等效模型的傳遞函數模型。

S307：基于調速器、發電機和當地負荷的等效模型，建立單區域電力系統仿真模型。

S308：根據單區域電力系統仿真模型，使用湊試法獲得PI控制器的參數。

S309：基于單區域電力系統仿真模型及PI控制器的參數，以單區域電力系統頻率偏差為調節變量，生成PI控制信號。

S310：確定行為網絡的輸入信號。

S311：計算出自適應動態規劃控制信號。

S312：采用評價網絡確定自適應動態規劃控制器的最小代。

S313：更新行為網絡的權值。

S314：更新評價網絡的權值。

S315：采用行為網絡輸出自適應動態規劃控制信號。

S316：將PI控制信號和自適應動態規劃控制信號，并將二者疊加，得到復合控制信號。

S317：將復合控制信號應用到單區域電力系統中，進行頻率控制。

單區域電力系統的隨機負荷變化，導致負荷干擾Δd(t)的出現，從而使得系統頻率出現偏差Δf(t)。由于負荷干擾Δd(t)的不確定性，本發明實施例使用PI控制器為基礎控制器，使用自適應動態規劃控制器作為上層控制器，生成自適應動態規劃控制信號u₂(t)和PI控制信號u₁(t)，并將二者在單區域電力系統管理和控制單元SMMC中相加產生控制信號，再通過通信信道將該控制信號送至單區域電力系統中每個參與單元中。解決了包含調速器、發電機和當地負荷的單區域電力系統在隨機負荷變化情況下，系統實際頻率偏離標稱值的技術問題，實現快速有效的單區域電力系統頻率調節，實現了自適應頻率控制，消除了頻率偏差，保證了電力系統的安全，是符合智能電網技術的應用需求和發展趨勢的。

上述實施例中雖然將各個步驟按照上述先后次序的方式進行了描述，但是本領域技術人員可以理解，為了實現本實施例的效果，不同的步驟之間可以不必按照這樣的次序執行，其可以同時(并行)執行或以顛倒的次序執行，這些簡單的變化都在本發明的保護范圍之內。

至此，已經結合附圖所示的優選實施方式描述了本發明的技術方案，但是，本領域技術人員容易理解的是，本發明的保護范圍顯然不局限于這些具體實施方式。凡在本發明的精神和原則之內所作的任何修改、等同替換和改進等，均應包含在本發明的保護范圍之內。

完整全部詳細技術資料下載

當前第1頁1 2 3