本發(fā)明涉及配電網(wǎng)調(diào)控,具體涉及基于人機(jī)混合增強(qiáng)智能的配電網(wǎng)調(diào)控方法、系統(tǒng)和設(shè)備。
背景技術(shù):
1、新型配電網(wǎng)(new?distribution?network,ndn)是一種采用先進(jìn)網(wǎng)絡(luò)架構(gòu)、信息化技術(shù)和智能化技術(shù),實(shí)現(xiàn)安全、高效、智能運(yùn)行的配電網(wǎng)絡(luò),是新型電力系統(tǒng)建設(shè)的關(guān)鍵和基礎(chǔ)。隨著新型配電網(wǎng)的逐步升級與新能源高比例接入,新型配電網(wǎng)運(yùn)行方式的復(fù)雜性不斷增加,使得新型配電網(wǎng)運(yùn)行的脆弱性、不確定性也日益凸顯,配網(wǎng)調(diào)控將面臨海量數(shù)據(jù)分析、多維運(yùn)行方式的挑戰(zhàn)。現(xiàn)有的新型配電網(wǎng)調(diào)控主要以人工監(jiān)控為主,難以滿足新型配電網(wǎng)面臨的智能化調(diào)控與安全運(yùn)行的要求。
2、以深度學(xué)習(xí)為主的人工智能技術(shù)與新型配電網(wǎng)的不斷融合,為提升新型配電網(wǎng)的智能調(diào)控提供了重要的支撐;當(dāng)前的深度學(xué)習(xí)人工智能技術(shù)主要應(yīng)用在新型配電網(wǎng)的負(fù)荷預(yù)測、故障診斷、配電網(wǎng)暫態(tài)分析和調(diào)度優(yōu)化決策等方面。如基于雙向長短期記憶網(wǎng)(bidirectional?long?short-term?memory,bilstm)對新型配電網(wǎng)的負(fù)荷進(jìn)行預(yù)測,基于時序卷積殘差網(wǎng)絡(luò)對新型配電網(wǎng)的短路故障進(jìn)行識別,以及基于transformer編碼器對新型配電網(wǎng)暫態(tài)穩(wěn)定性進(jìn)行評估,基于交替方向乘子法與圖計算進(jìn)行新型配電網(wǎng)調(diào)度優(yōu)化決策等。然而,上述方法的業(yè)務(wù)場景較局限,人工智能僅執(zhí)行簡單的辨別任務(wù)。面對復(fù)雜新型配電網(wǎng)的感知、認(rèn)知和決策任務(wù),傳統(tǒng)的人工智能存在可解釋性差、可信度低等問題,制約了人工智能在新型配電網(wǎng)的應(yīng)用。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題是:現(xiàn)有的新型配電網(wǎng)調(diào)控方法,難以滿足新型配電網(wǎng)面臨的智能化調(diào)控與安全運(yùn)行的要求,且傳統(tǒng)的人工智能調(diào)控技術(shù)存在可解釋性差、可信度低等問題,制約了人工智能在新型配電網(wǎng)的應(yīng)用;本發(fā)明目的在于提供基于人機(jī)混合增強(qiáng)智能的配電網(wǎng)調(diào)控方法、系統(tǒng)和設(shè)備,在傳統(tǒng)的人工智能調(diào)控技術(shù)的基礎(chǔ)上進(jìn)行改進(jìn),將人機(jī)混合增強(qiáng)智能技術(shù)應(yīng)用到數(shù)據(jù)感知、數(shù)據(jù)預(yù)處理、調(diào)控計算和調(diào)控執(zhí)行中,使得配電網(wǎng)調(diào)控過程既有配電網(wǎng)調(diào)度專家的人類智能認(rèn)知與決策能力,又有機(jī)器智能的強(qiáng)大計算和推理能力,有效提高新型配電網(wǎng)調(diào)度過程的安全性與可行性;同時,本方案還結(jié)合人機(jī)混合增強(qiáng)智能和決策智能體應(yīng)用在調(diào)控策略執(zhí)行過程中的運(yùn)行參數(shù)感知、狀態(tài)評估和調(diào)控策略優(yōu)化等方面,大幅降低配電網(wǎng)調(diào)度員的工作量,并提升對復(fù)雜新型配電網(wǎng)的控制能力。
2、本發(fā)明通過下述技術(shù)方案實(shí)現(xiàn):
3、本方案提供基于人機(jī)混合增強(qiáng)智能的配電網(wǎng)調(diào)控方法,包括:
4、采集新型配電網(wǎng)的歷史調(diào)控數(shù)據(jù),并結(jié)合機(jī)器學(xué)習(xí)數(shù)據(jù)與配電網(wǎng)調(diào)度專家經(jīng)驗(yàn)數(shù)據(jù)對所述歷史調(diào)控數(shù)據(jù)進(jìn)行預(yù)處理;
5、構(gòu)建新型配電網(wǎng)的調(diào)控模型,并基于預(yù)處理后的歷史調(diào)控數(shù)據(jù)訓(xùn)練所述調(diào)控模型;
6、基于智能決策體感知新型配電網(wǎng)的實(shí)時數(shù)據(jù),并將實(shí)時數(shù)據(jù)輸入已訓(xùn)練好的調(diào)控模型中生成調(diào)控策略;基于配電網(wǎng)調(diào)度專家反饋的調(diào)控策略來優(yōu)化智能決策體生成的調(diào)控策略,得到最優(yōu)調(diào)控策略;執(zhí)行所述最優(yōu)調(diào)控策略。
7、進(jìn)一步優(yōu)化方案為,所述采集新型配電網(wǎng)的歷史調(diào)控數(shù)據(jù),并結(jié)合機(jī)器學(xué)習(xí)數(shù)據(jù)與配電網(wǎng)調(diào)度專家經(jīng)驗(yàn)數(shù)據(jù)對所述歷史調(diào)控數(shù)據(jù)進(jìn)行預(yù)處理;包括方法:
8、采集新型配電網(wǎng)的歷史調(diào)控數(shù)據(jù),所述歷史調(diào)控數(shù)據(jù)包括動態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù);所述動態(tài)數(shù)據(jù)包括:運(yùn)行數(shù)據(jù)、應(yīng)用數(shù)據(jù)和部分環(huán)境數(shù)據(jù);所述靜態(tài)數(shù)據(jù)包括;基礎(chǔ)數(shù)據(jù)和部分環(huán)境數(shù)據(jù);
9、對所述歷史調(diào)控數(shù)據(jù)進(jìn)行場景檢測處理:構(gòu)建新型配電網(wǎng)調(diào)控場景,判斷所述歷史調(diào)控數(shù)據(jù)是否覆蓋新型配電網(wǎng)調(diào)控場景范圍;對于未覆蓋新型配電網(wǎng)調(diào)控場景范圍的歷史調(diào)控數(shù)據(jù),結(jié)合機(jī)器學(xué)習(xí)數(shù)據(jù)與配電網(wǎng)調(diào)度專家經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行缺失補(bǔ)充;
10、對場景檢測處理后的歷史調(diào)控數(shù)據(jù)進(jìn)行人機(jī)混合智能標(biāo)注后生成調(diào)控數(shù)據(jù)集。
11、進(jìn)一步優(yōu)化方案為,所述對于未覆蓋新型配電網(wǎng)調(diào)控場景范圍的歷史調(diào)控數(shù)據(jù),結(jié)合機(jī)器學(xué)習(xí)數(shù)據(jù)與配電網(wǎng)調(diào)度專家經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行缺失補(bǔ)充;包括方法:
12、構(gòu)建用于對歷史調(diào)控數(shù)據(jù)進(jìn)行缺失補(bǔ)充的機(jī)器學(xué)習(xí)網(wǎng)絡(luò);所述機(jī)器學(xué)習(xí)網(wǎng)絡(luò)包括策略生成器,所述策略生成器進(jìn)行策略更新的幅度限制在預(yù)設(shè)幅度范圍以內(nèi);
13、所述機(jī)器學(xué)習(xí)網(wǎng)絡(luò)以策略生成器輸出的機(jī)器學(xué)習(xí)數(shù)據(jù)與配電網(wǎng)調(diào)度專家經(jīng)驗(yàn)數(shù)據(jù)之間的差異,作為獎勵函數(shù)迭代訓(xùn)練所述策略生成器;直至策略生成器輸出的機(jī)器學(xué)習(xí)數(shù)據(jù)與配電網(wǎng)調(diào)度專家經(jīng)驗(yàn)數(shù)據(jù)之間的差異滿足第一閾值時,以策略生成器輸出的機(jī)器學(xué)習(xí)數(shù)據(jù)作為缺失補(bǔ)充數(shù)據(jù)。
14、進(jìn)一步優(yōu)化方案為,所述機(jī)器學(xué)習(xí)網(wǎng)絡(luò)為對抗式生成模仿學(xué)習(xí)網(wǎng)絡(luò);所述策略生成器基于置信域策略梯度優(yōu)化算法進(jìn)行策略更新;
15、所述對抗式生成模仿學(xué)習(xí)網(wǎng)絡(luò)還包括判別器,所述判別器用于識別策略生成器輸出的機(jī)器學(xué)習(xí)數(shù)據(jù)與配電網(wǎng)調(diào)度專家經(jīng)驗(yàn)數(shù)據(jù)之間的差異。
16、進(jìn)一步優(yōu)化方案為,所述對抗式生成模仿學(xué)習(xí)網(wǎng)絡(luò)的目標(biāo)函數(shù)為:
17、;
18、式中:表示對抗式生成模仿學(xué)習(xí)網(wǎng)絡(luò)的目標(biāo)函數(shù);log()表示對數(shù)函數(shù); δsme表示專家經(jīng)驗(yàn)數(shù)據(jù); δgan表示策略生成器輸出的機(jī)器學(xué)習(xí)數(shù)據(jù);表示策略生成器輸出 δgan為 δsme的概率;表示對抗式生成模仿學(xué)習(xí)網(wǎng)絡(luò)中關(guān)于輸入配電網(wǎng)調(diào)度專家經(jīng)驗(yàn)數(shù)據(jù)的函數(shù);表示對抗式生成模仿學(xué)習(xí)網(wǎng)絡(luò)中關(guān)于輸出機(jī)器學(xué)習(xí)數(shù)據(jù)的函數(shù);表示先驗(yàn)概率;b表示后驗(yàn)概率。
19、進(jìn)一步優(yōu)化方案為,所述對場景檢測處理后的歷史調(diào)控數(shù)據(jù)進(jìn)行人機(jī)混合智能標(biāo)注后生成調(diào)控數(shù)據(jù)集;包括方法:
20、對場景檢測處理后的歷史調(diào)控數(shù)據(jù)進(jìn)行人機(jī)混合標(biāo)注:先進(jìn)行機(jī)器自動樣本標(biāo)注,再篩選出關(guān)鍵歷史調(diào)控數(shù)據(jù)由配電調(diào)度專家進(jìn)行人工標(biāo)注;
21、校驗(yàn)所有人機(jī)混合標(biāo)注后的歷史調(diào)控數(shù)據(jù),對未通過校驗(yàn)的歷史調(diào)控數(shù)據(jù)重新進(jìn)行人機(jī)混合標(biāo)注,直至通過校驗(yàn)。
22、進(jìn)一步優(yōu)化方案為,所述構(gòu)建新型配電網(wǎng)的調(diào)控模型,并基于預(yù)處理后的歷史調(diào)控數(shù)據(jù)訓(xùn)練所述調(diào)控模型;包括方法:
23、構(gòu)建新型配電網(wǎng)的任務(wù)調(diào)控模型庫,專家配電網(wǎng)調(diào)度員根據(jù)新型配電網(wǎng)調(diào)控場景確定出調(diào)控目標(biāo);
24、將調(diào)控目標(biāo)的設(shè)備調(diào)控任務(wù)分解成多個子任務(wù),篩選出當(dāng)前子任務(wù),并從任務(wù)調(diào)控模型庫中調(diào)取出當(dāng)前子任務(wù)的任務(wù)調(diào)控模型;
25、基于預(yù)處理后的歷史調(diào)控數(shù)據(jù)訓(xùn)練所述任務(wù)調(diào)控模型,在訓(xùn)練任務(wù)調(diào)控模型的過程中,由配電網(wǎng)調(diào)度專家基于人類智能技術(shù)引導(dǎo)調(diào)整任務(wù)調(diào)控模型的參數(shù),并修正任務(wù)調(diào)控模型輸出的調(diào)控策略。
26、進(jìn)一步優(yōu)化方案為,所述基于智能決策體感知新型配電網(wǎng)的實(shí)時數(shù)據(jù),并將實(shí)時數(shù)據(jù)輸入已訓(xùn)練好的調(diào)控模型中生成調(diào)控策略;基于配電網(wǎng)調(diào)度專家反饋的調(diào)控策略來優(yōu)化智能決策體生成的調(diào)控策略,得到最優(yōu)調(diào)控策略;包括方法:
27、由智能決策體基于實(shí)時數(shù)據(jù)對新型配電網(wǎng)進(jìn)行狀態(tài)分析,并將實(shí)時數(shù)據(jù)和狀態(tài)分析結(jié)果輸入新型配電網(wǎng)調(diào)控模型中生成調(diào)控策略;
28、由智能決策體將當(dāng)前調(diào)控策略放入仿真環(huán)境中驗(yàn)證是否為最優(yōu)策略,若當(dāng)前調(diào)控策略不是最優(yōu)策略,則智能決策體結(jié)合配電網(wǎng)調(diào)度專家反饋的調(diào)控策略調(diào)整當(dāng)前調(diào)控策略,直至當(dāng)前調(diào)控策略是最優(yōu)策略。
29、進(jìn)一步優(yōu)化方案為,所述最優(yōu)策略 rhtl根據(jù)下式得到:
30、;
31、式中: rai表示智能決策體生成的調(diào)控策略; rp表示配電網(wǎng)調(diào)度專家反饋的調(diào)控策略;表示智能決策體的置信度;表示新型配電網(wǎng)的最優(yōu)調(diào)控閾值。
32、本方案還提供基于人機(jī)混合增強(qiáng)智能的配電網(wǎng)調(diào)控系統(tǒng),用于實(shí)現(xiàn)上述的基于人機(jī)混合增強(qiáng)智能的配電網(wǎng)調(diào)控方法;所述系統(tǒng)包括:
33、數(shù)據(jù)處理模塊,用于采集新型配電網(wǎng)的歷史調(diào)控數(shù)據(jù),并結(jié)合機(jī)器學(xué)習(xí)數(shù)據(jù)與配電網(wǎng)調(diào)度專家經(jīng)驗(yàn)數(shù)據(jù)對所述歷史調(diào)控數(shù)據(jù)進(jìn)行預(yù)處理;
34、調(diào)控模型搭建模塊,用于構(gòu)建新型配電網(wǎng)的調(diào)控模型,并基于預(yù)處理后的歷史調(diào)控數(shù)據(jù)訓(xùn)練所述調(diào)控模型;
35、執(zhí)行模塊,用于基于智能決策體感知新型配電網(wǎng)的實(shí)時數(shù)據(jù),并將實(shí)時數(shù)據(jù)輸入已訓(xùn)練好的調(diào)控模型中生成調(diào)控策略;基于配電網(wǎng)調(diào)度專家反饋的調(diào)控策略來優(yōu)化智能決策體生成的調(diào)控策略,得到最優(yōu)調(diào)控策略;執(zhí)行所述最優(yōu)調(diào)控策略。
36、本方案還提供一種計算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實(shí)現(xiàn)所述基于人機(jī)混合增強(qiáng)智能的配電網(wǎng)調(diào)控方法的步驟。
37、本發(fā)明與現(xiàn)有技術(shù)相比,具有如下的優(yōu)點(diǎn)和有益效果:
38、1、本發(fā)明提供的基于人機(jī)混合增強(qiáng)智能的配電網(wǎng)調(diào)控方法、系統(tǒng)和設(shè)備;在傳統(tǒng)的人工智能調(diào)控技術(shù)的基礎(chǔ)上進(jìn)行改進(jìn),將人機(jī)混合增強(qiáng)智能技術(shù)應(yīng)用到數(shù)據(jù)感知、數(shù)據(jù)預(yù)處理、調(diào)控計算和調(diào)控執(zhí)行中,使得配電網(wǎng)調(diào)控過程既有配電網(wǎng)調(diào)度專家的人類智能認(rèn)知與決策能力,又有機(jī)器智能的強(qiáng)大計算和推理能力,有效提高新型配電網(wǎng)調(diào)度過程的安全性與可行性;
39、2、本發(fā)明提供的基于人機(jī)混合增強(qiáng)智能的配電網(wǎng)調(diào)控方法、系統(tǒng)和設(shè)備;本方案還結(jié)合人機(jī)混合增強(qiáng)智能和決策智能體應(yīng)用在調(diào)控策略執(zhí)行過程中的運(yùn)行參數(shù)感知、狀態(tài)評估和調(diào)控策略優(yōu)化等方面,大幅降低配電網(wǎng)調(diào)度員的工作量,并提升對復(fù)雜新型配電網(wǎng)的控制能力。