技術特征:1.一種基于強化學習的城市污染源動態分布調控方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的一種基于強化學習的城市污染源動態分布調控方法,其特征在于,所述源數據包括空氣污染物濃度數據和氣象數據。
3.根據權利要求1所述的一種基于強化學習的城市污染源動態分布調控方法,其特征在于,所述s2具體包括:
4.根據權利要求1所述的一種基于強化學習的城市污染源動態分布調控方法,其特征在于,所述s4具體包括:
5.根據權利要求1所述的一種基于強化學習的城市污染源動態分布調控方法,其特征在于,所述s5具體包括:
技術總結本發明公開了一種基于強化學習的城市污染源動態分布調控方法,包括如下步驟:S1、采集空氣污染的源數據,并進行預處理,構建污染數據集;S2、利用改進的Informer網絡對污染數據集進行時間序列預測;S3、計算不同污染源對空氣質量的影響程度,并構建污染源調控任務數據集;S4、建立博弈論多智能體強化學習環境,利用納什均衡優化污染源智能體的調控策略,基于污染歷史數據優化獎勵機制,動態調整污染源調控策略;S5、計算污染源調整方案,優化污染調控參數;S6、執行污染調控策略,并進行迭代優化。本發明結合改進的Informer網絡和博弈論多智能體強化學習,實現污染物濃度精準預測與污染源智能調控,具備高精度、自適應性強和全局優化能力優點。
技術研發人員:單化理,沈新,洪源,張楠,李棒棒,郭鵬
受保護的技術使用者:安徽配隆天環保科技有限公司
技術研發日:技術公布日:2025/4/28