本發明涉及電力負荷預測技術領域,特別是涉及一種基于大數據簡約的短期電力負荷預測方法。
背景技術:
電力負荷預測是供電部門的重要工作之一,是保證電力系統可靠供電和安全運行的前提。準確的負荷預測可以經濟合理地安排電網內部發電機組的啟停,做到提高經濟效益和社會效益。面對如今智能電網的快速發展,電力負荷影響因素增加,數據呈指數級增長,逐步構成了大數據多維化的特點,傳統的數據分析模式已無法滿足需求。如何做到高效準確的預測此特點的電力負荷成為現在解決的關鍵問題。目前的短期電力負荷預測模型中,應用較廣泛的BP神經網絡是利用靜態前饋網絡對動態網絡進行辨識,將動態時間建模問題變為靜態空間建模問題從而使得預測精度較低,而且訓練時需要大量的樣本數據,使得預測速度也較慢,這都將導致電力的運行成本大幅增加,即面對電力負荷的大數據特點,當前的短期負荷預測方法已不能完全滿足智能電網的需求。因此,我們提出了一種基于大數據簡約的短期電力負荷預測方法。
技術實現要素:
本發明目的在于提供一種智能電網下明顯提高短期電力負荷的預測精度和速度的基于大數據簡約的短期電力負荷預測方法。
為實現上述目的,采用了以下技術方案,本發明方法包括以下步驟:
步驟1,選擇預測日之前的n個同類型日期的采樣點負荷序列,每個日期的采樣點為48點,即每30min采樣一次;
步驟2,獲取選擇n個同類型日期及預測日的影響負荷相關天氣因素數據;
步驟3,利用最小絕對值收縮(Lasso)原理將獲取的原始電力負荷及相關天氣因素大數據進行高維數據簡約,剔除壞數據,獲得有用的負荷序列;
步驟4,通過主成分分析(PCA)對天氣環境因素變量進行降維及特征提取,獲取環境特征因子;
步驟5,建立Elman動態神經網絡短期電力負荷預測模型,將提取的特征向量以及歷史負荷數據共同作為Elman神經網絡的輸入進行訓練預測,通過Elman方法預測第n+1天的各時刻的負荷值。
所述步驟2中的相關天氣因素負荷數據包括:晴天(X1)、陰天(X2)、雨天(X3)、最高氣溫(X4)、最低氣溫(X5)、氣壓(X6)、濕度(X7)、輻射(X8)、風速(X9)、云量(X10)等10個,這10個相關的天氣因素數據將作為仿真數據輸入;
所述步驟3)中的最小絕對值收縮(Lasso)原理如下:
利用Lasso算法對負荷大數據進行數據挖掘,剔除冗余數據,從而為負荷預測算法提供簡約而有效的特征數據;Lasso方法是一種壓縮估計,通過構造一個罰函數得到一個較為精煉的模型,使得它壓縮一些系數,同時設定一些系數為零,因此保留了子集收縮的特點;
設有線性回歸模型:
y=α+β1x1+β2x2+…+βpxp+ε (1)
式中,α為常數項;β1,β2,…βp為回歸系數;ε是隨機擾動項;(xi1,xi2,...,xip;yi),i=1,2,...,n是變量的n組觀測值,需滿足其中j=1,2,...,p;
常數項和回歸系數的Lasso估計定義為:
數據降維的具體過程如下:
(a)約束條件:s為懲罰函數;
(b)令表示βj的最小二乘估計,則有
(c)當s值不斷增大,進入回歸模型的數據就會增多,當達到某個值時,所有數據都會進入回歸模型;當s值減小到一定程度,某些回歸系數的估計值為0,模型提出系數為0的變量,從而達到降維的目的。
步驟4中,主成分分析主要目的是對電力負荷預測中氣象數據降維處理,提取多天氣因素特征指標,與歷史負荷數據共同作為建模對象,使建立的特征量既全面表征各因素對電力負荷的影響,又能簡化預測模型;
假定有n個樣本,每個樣本共有p個變量,構成一個n×p階的數據矩陣
具體過程如下:
(a)數據標準化——將原始數據指標標準化為[0,1]之間的有效數據;
(b)計算相關系數矩陣
式中,rij(i,j=1,2,…,p)為原變量xi與xj之間的相關系數,其計算公式為:
因為R是實對稱矩陣(即rij=rji),所以只需計算上三角元素或下三角元素;
(c)計算特征值與特征向量
首先解特征方程|λI-R|=0,通常用雅可比法求出特征值λi(i=1,2,…,p),并使其按大小順序排列,即λ1≥λ2≥…,≥λp≥0;然后分別求出對應于特征值λi的特征向量ai(i=1,2,…,p);
(d)計算主成分貢獻率及累計貢獻率
對m個主成分進行綜合評價及加權求和
f=w1z1+w2z2+…+wmzm (7)
式中,wi為主成分的貢獻率,計算公式為:
貢獻率所代表的是第i個主成分所占原始指標信息量的百分比,所以第一主成分應該所占比重最大,然后逐次遞減。前m個主成分累計方差貢獻率為:
為了達到降維的目的,當前m個主成分的累計貢獻率達到85%以上,就可以用前m個主成分來替代原來的p個評價指標;
(e)新樣本矩陣的構造:定義:記x1,x2,…,xP為原變量指標,z1,z2,…,zm(m≤p)為新變量指標,根據式(12)和式(13)計算每一個主成分的各樣本值;
步驟5中,具體預測方法如下:
Elman神經網絡是在BP的前饋網絡隱含層中增加一個承接層,作為一步延時算子,以達到記憶的目的,通過存儲內部狀態,使其具備動態特性的功能,從而使得系統具有適應突變事件的特性;
Elman網絡的非線性狀態空間表達式為:
式中,k為神經網絡訓練的次數;y為n維輸出向量;x為隱層神經元輸出向量;u為輸入向量;xc為反饋狀態向量;w3為中間層到輸出層連接權值;w2為輸入層到中間層連接權值;w1為承接層到中間層的連接權值。g為輸出神經元的傳遞函數,是中間層輸出的線性組合;f為隱層神經元的傳遞函數,常采用s函數;
Elman網絡也采用BP算法進行權值修正,學習指標函數采用誤差平方和函數:
式中,為目標輸入向量。
與現有技術相比,本發明方法具有如下優點:
1、利用Lasso原理可以將智能電網大數據中冗余數據和壞數據進行剔除,使其數據更有效簡約;
2、引入Lasso-PCA對電力負荷預測中的氣象數據進行降維處理,提取多天氣因素特征量,與歷史負荷數據共同作為建模對象,使建立的特征量既全面表征各因素對電力負荷的影響,又能簡化預測輸入數據,同時采用動態Elman神經網絡預測模型,明顯提高電力負荷預測的精確度和速度。
附圖說明
圖1是本發明方法的流程示意圖。
圖2是本發明方法的Elman神經網絡結構圖。
圖3是本發明方法對10個環境變量因子進行主成分分析的結果圖。
圖4是不同方法下的預測負荷曲線與實際負荷曲線的對比圖。
圖5是不同方法下的預測誤差對比圖。
具體實施方式
下面結合附圖對本發明做進一步說明:
如圖1所示,本發明提供一種基于大數據簡約的短期電力負荷預測方法,包括以下步驟:
1)選擇預測日前n個同類型日期的48點(每30min采樣一次)的負荷序列;
2)獲取選擇n個同類型日期及預測日的影響負荷因素數據;
3)利用最小絕對值收縮(Lasso)原理將獲取的原始電力負荷及相關天氣因素大數據進行高維數據簡約,剔除壞數據,獲得有用數據集;
4)通過主成分分析(PCA)對環境因素變量進行降維及特征提取,獲取環境特征因子;
5)建立Elman動態神經網絡短期電力負荷預測模型,將提取的特征向量以及歷史負荷數據共同作為Elman神經網絡的輸入進行訓練預測。
如圖2所示,Elman神經網絡一般分為4層:輸入層,中間層(隱含層),承接層和輸出層。輸入層、隱含層和輸出層的連接類似于前饋網絡,輸入層的單元僅起信號傳輸作用,輸出層單元起線性加權作用。隱含層單元的傳遞函數可采用線性或非線性函數,承接層用于記憶隱層的過去態,并在下一時刻聯同網絡輸入一起作為隱含層單元的輸入,使得網絡具有動態記憶功能,從而達到了動態建模的目的。
應用實例:
以某省的電力負荷數據為依據建立PCA-Elman預測模型對這一地區的日負荷進行預測,選擇這一地區2004年3月1日~3月8日的電力負荷數據(y)及晴天(X1)、陰天(X2)、雨天(X3)、最高氣溫(X4)、最低氣溫(X5)、氣壓(X6)、濕度(X7)、輻射(X8)、風速(X9)、云量(X10)等10個相關的環境因素數據作為仿真數據。預測時,將前7天的數據作為訓練樣本,每前3天的負荷序列作為輸入向量,第4天的負荷序列作為目標向量,依此規律共得到4組訓練樣本對本模型進行樣本訓練,最后將第8天的數據作為網絡的測試樣本,驗證網絡模型的準確性。
預測過程按照圖1所述流程圖進行。對輸入負荷序列利用Lasso原理進行不良數據處理,使輸入數據達到準確簡約,然后利用PCA對電力負荷預測中的氣象數據進行降維處理,提取多天氣因素特征量,與簡約后的歷史負荷數據共同作為建模對象,輸入到Elman神經網絡模型中從而進行負荷預測。Elman神經網絡結構圖如圖2所示。
如圖3是對10個環境變量因子進行主成分分析的結果圖,按主成分特征值由大到小排列,得到前3個主成分累計方差貢獻率可達到85%以上,說明了前3個主成分幾乎包含了全部影響因素所具有的信息,根據貢獻率大于85%(特征值大于1)的原則選取新因子,選擇前3個特征值并計算相應的特征向量,作為動態神經網絡的輸入。
如圖4、圖5所示分別為不同方法下的預測負荷曲線與實際負荷曲線的對比圖和各方法下的預測誤差對比圖,通過此方法較其他預測方法對短期電力負荷進行預測時更具準確性。
如上所述,該方法首先利用Lasso原理將大數據中冗余數據和壞數據進行剔除,然后通過主成分分析PCA對環境因素變量進行降維及特征提取。提取的特征向量以及簡約處理后的歷史負荷數據共同作為Elman神經網絡的輸入進行訓練預測,最終得到與之前預測方法相比較為準確的預測結果。該方法的提出為智能電網下的電力系統短期負荷預測提供了一種新思路。
以上所述的實施例僅僅是對本發明的優選實施方式進行描述,并非對本發明的范圍進行限定,在不脫離本發明設計精神的前提下,本領域普通技術人員對本發明的技術方案做出的各種變形和改進,均應落入本發明權利要求書確定的保護范圍內。