本發明涉及電力系統調度優化,具體為基于深度強化學習的新能源電力系統低碳調度優化方法。
背景技術:
1、
2、碳捕集與封存(ccs?carbon?capture?and?storage)技術因其能夠顯著降低電力行業co2排放,成為了實現減排目標的關鍵技術之一。然而,碳捕集過程會對機組出力特性產生影響,使得機組輸出功率與碳捕集能耗同步變化,這無疑增加了電力系統調度的復雜性與難度。與此同時,新能源發電,尤其是風電和光電,雖然具有清潔環保、無碳排放的優勢,但其出力具有較強的波動性,對電力系統的穩定運行和電能質量產生不利影響。
3、為了應對這一挑戰,電力需求響應(demand?response?dr)作為一種有效的負荷調整手段逐漸受到業界的廣泛關注。通過引導用戶根據電價信號或激勵機制調整用電行為,dr能夠促進風電等可再生能源的消納,同時實現節能減排的目標。在面向風電不確定性調度的優化方法中,雖然基于模型的隨機優化、魯棒優化等方法取得了一定的成效,但仍然存在對環境不確定性建模困難等問題。而基于數據驅動的深度強化學習算法則避免了環境的不確定性建模,對可再生能源的隨機波動性具有較強的適應性,為電力系統調度優化提供了新的思路。
技術實現思路
1、針對上述問題,本發明的目的在于提供一種基于深度強化學習的新能源電力系統低碳調度優化方法,從源荷兩側挖掘調度優化潛力,通過智能調度策略提升風光消納能力,增強系統的低碳性能,并降低運營成本。技術方案如下:
2、步驟1:構建碳捕集機組模型和荷側需求響應資源模型,所述荷側需求響應資源模型包括激勵型需求響應模型和價格型需求響應模型;
3、步驟2:根據所述碳捕集機組模型和荷側需求響應資源模型,以新能源電力系統綜合成本最優為目標函數,并確定系統不平衡約束和系統平衡約束,從而構建需求響應與碳捕集協同的新能源電力系統低碳調度模型;
4、步驟3:基于所述新能源電力系統低碳調度模型,在強化學習框架下,用馬爾可夫決策過程表示智能體與環境交互方式,確定智能體的狀態空間、動作空間和獎勵函數;再應用基于深度確定性策略梯度的深度強化學習方法進行最優日前調度策略求解。
5、本發明的有益效果是:本發明在源側綜合考慮碳捕集機組、可調度資源光熱電站、儲能電池與風電協調配合,同時在荷側考慮dr資源的特性;從源荷兩側挖掘調度優化潛力,通過智能調度策略提升風光消納能力,增強系統的低碳性能,并降低運營成本;且使用基于數據的強化學習方法,可以更好的面對調度過程中的不確定性因素。
1.一種基于深度強化學習的新能源電力系統低碳調度優化方法,其特征在于,包括以下步驟:
2.根據權利要求1所述的基于深度強化學習的新能源電力系統低碳調度優化方法,其特征在于,所述步驟1具體為:
3.根據權利要求2所述的基于深度強化學習的新能源電力系統低碳調度優化方法,其特征在于,步驟2具體為:
4.根據權利要求3所述的基于深度強化學習的新能源電力系統低碳調度優化方法,其特征在于,所述步驟3具體為: