本發明涉及電力企業數據診斷分析技術領域,特別是關于一種基于電力企業大數據技術的配電網差異特征診斷分析方法。
背景技術:
配電網具有點多面廣、直接面向用戶、設備類型繁多等特點,其發展的差異特征十分明顯。配電網的差異性不但會受到地區經濟、社會、人口、環境等外部條件影響,而且也會受到電力企業在規劃、建設、運行、營銷以及財務、人資等領域的內部業務管理方面的影響。因此,客觀地認識配電網發展的差異規律,把握外部條件和內部業務管理對配電網發展的推動作用,精確辨識配電網發展存在的薄弱環節,對指導配電網建設至關重要。
配電網所涉數據總量多、信息大、關系深,差異特征的診斷分析高度依賴數據資源,信息密度和技術手段對提高診斷分析質量具有決定性作用。電力系統大數據技術能夠將配電網海量信息快速、有效整合,通過數據挖掘技術提煉形成基于數據聯系的新認識,輔助開展電網發展的分析決策。合理運用電力系統大數據技術,能夠更加準確、全面地預警薄弱問題,提升電網精準投資水平和企業發展質量。
傳統的配電網差異特征的診斷分析大多基于指標分析,評價指標一般是源于專家討論或經驗認識,分析方法主要是對單個指標進行統計分析或應用綜合評價進行打分判斷,但對以下方面均考慮不夠:(1)分析角度多從電網建設和運行入手,沒有統籌考慮影響配電網發展的外部因素和輔助管理要素,導致診斷結論的全面性不足;(2)診斷指標囿于經驗認識或主觀判斷,缺乏對相關數據內在關系的定量判斷,導致診斷結論的客觀性不足;(3)總是假定認為不同地區的配電網是可比的,忽略了導致發展差異的決定因素,導致診斷結論的公正性不足;(4)診斷對象的顆粒度沒有深入到電力企業經營配電網的最小單位,多以省、市為單位研究,導致診斷結論的精細度不足。
技術實現要素:
針對上述問題,本發明的目的是提供一種基于電力企業大數據技術的配電網差異特征診斷分析方法,整合了與配電網發展相關的外部影響因素和內部管理因素,通過對相關因素進行海量數據挖掘獲取診斷分析評價指標,形成基于指標特征的配電網分析診斷結論,可以解決現有技術中存在的全面性、客觀性、公正性和精細度不足等問題。
為實現上述目的,本發明采取以下技術方案:一種基于電力企業大數據技術的配電網差異特征診斷分析方法,其特征在于包括以下步驟:1)信息融合:構造含電力企業業務內部管理數據和經濟社會外部數據的配電網數據資源平臺;2)指標提取:采用數據挖掘技術從配電網數據資源平臺中提取配電網診斷的關鍵指標,構建診斷指標集;3)樣本篩選:將得到的診斷指標集中的診斷指標作為診斷參數,對多個電力企業的電網發展狀態作聚類合并,篩出所得簇對象內僅含孤立點的電力企業,其他簇作為種子樣本;4)分類診斷:以種子樣本的類中心作為診斷參數,采用系統聚類法對種子樣本再作聚類合并,按所得分類系統圖將種子樣本聚合為有限個群,對有限個群進行分類診斷,得到各群的差異特點,也即配電網中不同電力企業的差異特征。
所述步驟1)中,構建的配電網數據資源平臺包括經濟社會、電網規模、電網經營和電網運行四大類數據。
所述經濟社會類數據包括經濟發展指標、土地資源指標、人口資源指標和用電客戶指標;所述電網規模類數據包括變壓器數量、線路條數和線路長度指標;所述電網經營類數據包括售電量、電力損耗、購售電費、電費管理、電網投入、供電質量、業擴報裝、資產利潤和人力資源指標;所述電網運行類數據包括安全水平、輕載運行、重載運行和高損運行指標。
所述步驟2)中,采用數據挖掘技術中的主成分分析技術分別對四類數據進行關鍵指標提取的方法包括以下步驟:①根據各樣本數據中相關系數矩陣的特征多項式,計算得到各樣本數據中相關系數矩陣的特征值;②根據得到的相關系數矩陣的特征值大小,確定各樣本數據中的主成分個數;③計算步驟②中確定的各主成分指標中不同元素的載荷系數;④選取各主成分指標中載荷系數絕對值最大者為該主成分指標的關鍵指標;⑤將得到的各類樣本數據中的所有關鍵指標作為診斷分析配電網差異特征的診斷指標集。
所述步驟②中,確定主成分個數的計算公式為:
式中,k為主成分指標個數,ki為計數器,且當λi>1時取1,否則取0;p為樣本數據的指標個數;λi為第i個指標的特征值。
所述步驟③中,各主成分指標中不同元素的載荷系數的計算公式為:
式中:aij為特征值λi對應特征向量的第j個元素;sij為載荷系數。
本發明由于采取以上技術方案,其具有以下優點:1、本發明由于將影響配電網發展的內部因素和外部因素有效融合,對配電網的發展差異,既考慮經濟社會等外部影響,也考慮企業內部管理驅動,并將兩者結合起來,分析角度更加全面。2、本發明由于所得診斷指標全部建立在對海量數據關聯關系深入挖掘的基礎上,更加注重數據特征所表現的規律價值,完全不依賴經驗判斷,從根本上克服了指標的主觀性問題。3、本發明由于對配電網按照診斷指標所表現出的相似度作分類合并,使發展相近的配電網之間可相互比較,并引導劃入同一類別內的配電網發展方向指向其中的先進者,而不同類別的配電網則可比較發現其差異特點。4、本發明由于立足于經營配電網的任何電力企業,由于依托大數據處理技術,診斷對象可以深入到縣層面的電力企業,顆粒度更加精細。本發明可以廣泛應用于配電網數據的分析診斷中。
附圖說明
圖1為本發明基于電力企業大數據技術的配電網差異特征診斷分析方法的流程圖;
圖2為本發明基于數據挖掘技術提取得到的診斷分析關鍵指標集;
圖3為本發明實施例的配電網差異特征診斷雷達圖。
具體實施方式
下面結合附圖和實施例對本發明進行詳細的描述。
如圖1所示,本發明提供的基于電力企業大數據技術的配電網差異特征診斷分析方法,具體包括如下步驟:
1)信息融合:構造含電力企業業務內部管理數據和經濟社會外部數據的配電網數據資源平臺,并將與配電網差異特征診斷分析的相關數據劃分為經濟社會、電網規模、電網運營和電網運行四類。
具體的,根據企業內電網規劃、建設、運行、營銷以及財務、人資等專業的信息化系統或報表,結合企業所在地區的經濟、人口、土地等信息,整合數據資源并將其分為經濟社會、電網規模、電網經營和電網運行4大類。其中:
①經濟社會類數據
經濟社會類數據用于反映經濟、人口、土地及與之相關的電力用戶,主要指標包括經濟發展指標、土地資源指標、人口資源指標、用電客戶指標,具體清單如表1所示。
表1經濟社會類指標清單
②電網規模類數據
電網規模類數據用于反映配電網110(66)kv、35kv、10kv及以下各電壓等級電網存量規模,主要包括變壓器數量、線路條數、線路長度等指標,具體清單如表2所示。
表2電網規模類指標清單
③電網經營類數據
電網經營類數據用于反映企業在配電網經營管理方面的績效,主要包括售電量、電力損耗、購售電費、電費管理、電網投入、供電質量、業擴報裝、資產利潤和人力資源等方面指標,具體清單如表3所示。
表3電網經營類指標清單
④電網運行類數據
電網運行類數據用于反映配電網的運行質量和效率,主要包括安全水平、輕載運行、重載運行、高損運行等方面指標,具體清單如表4所示。
表4電網運行類指標清單
2)指標提取:采用數據挖掘技術從步驟1)中整合的四類數據中,提取配電網診斷的關鍵指標,構建診斷指標集。
如圖2所示,采用數據挖掘技術中的主成分分析技術分別對四類數據進行關鍵指標提取,構建診斷指標集。提取方法包括以下步驟:
①根據各樣本數據中相關系數矩陣的特征多項式,計算得到各樣本數據中相關系數矩陣的特征值。
對含有p個指標的樣本數據進行計算,假設其相關系數矩陣為a,即存在ax=λx,按照特征多項式計算,得到其相關系數矩陣的特征值為λ1、λ2、…、λp。
②根據得到的相關系數矩陣的特征值大小,確定各樣本數據中的主成分個數k。
根據p個特征根大小確定關鍵指標個數為k,作為樣本數據的主成分個數,其計算公式為:
式中:ki為計數器,當λi>1時取1,否則取0。
③計算步驟②中確定的k個主成分指標中不同元素的載荷系數。
對所確定的k個主成分指標,計算其載荷系數:
式中:aij為特征值λi對應特征向量的第j個元素;sij為載荷系數。
④選取各主成分指標中載荷系數絕對值最大者為該主成分指標的關鍵指標。
⑤將得到的各類樣本數據中的所有關鍵指標分別作為診斷分析配電網差異特征的診斷指標集。
3)樣本篩選:將得到的診斷指標集作為診斷參數,對多個電力企業的電網發展狀態作聚類合并,篩出所得簇對象內僅含孤立點的電力企業,其他簇作為種子樣本。
具體的,以步驟2)中提取的關鍵指標對應的全部數據為基礎,采用系統聚類法(如平均連接法、組平均連接法或離差平方和法等)生成分類系統圖。分類系統圖中,相似程度大的樣本首先聚合,相似程度較小的樣本則在最后才參與聚合,將聚合過程中較多輪次仍為孤立點的樣本標記篩出。系統聚類法為已有技術,本發明不再贅述。
4)分類診斷:以種子樣本的類中心作為診斷參數,采用系統聚類法對種子樣本再作聚類合并,按所得分類系統圖將種子樣本聚合為有限個群,對有限個群進行分類診斷,得到各群的差異特點,也即配電網中不同電力企業的差異特征。
具體的,在樣本篩選后所得種子樣本的基礎上,根據其系統聚類所得的分類系統圖,將樣本分為若干個群,將每個群診斷指標對應的類中心繪制為雷達圖,分類診斷各群的差異特點。
下面以某年度國內1548個縣電力公司為對象,對本發明做進一步描述。
如圖2所示,為基于數據挖掘技術提取得到的診斷分析關鍵指標集。提取后,6個代表經濟社會的關鍵指標分別為:用電客戶數量、地區生產總值、人均gdp、城鎮化率、供電面積、供電人口;3個代表電網規模的關鍵指標分別為:10kv及以下線路長度、10kv配變總數、110(66)kv及以下線路總條數;11個代表電網經營的關鍵指標分別為:售電量、綜合線損率、低壓線損率、銷售均價、電費回收率、累計申請新裝/增容戶數與容量、累計完成減容/銷戶戶數與容量、職工平均人數、全員勞動生產率;8個代表電網發展的關鍵指標分別為:110(66)kv及以下線路n-1通過率、供電可靠率、綜合電壓合格率、110(66)kv及以下線路重損總數、10千伏配變重載比例、10千伏配變輕載比例、110(66)kv及以下線路重載比例、110(66)kv及以下線路輕載比例。
之后,對1548個縣電力公司進行篩選,共有16個單位在系統聚類的多數階段保持獨立。該16個單位主要特征為gdp總量和售電量名列前茅,體量遠高于其他縣,但其彼此之間也存在一定差距,因此無法形成一個簇。同時,得到12個種子樣本。
如圖3所示,最后,對樣本篩選出的12個種子樣本進一步聚類,將12個種子樣本聚合為3個群,繪制含28個診斷指標的雷達圖,并對各群配電網發展差異化的內外部因素作用分析,如下表5所示。
表5實施例所涉縣電力公司配電網差異化診斷效果
最后應說明的是:以上實施例僅用以說明本發明的技術方案,而非對其限制;盡管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換,而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的精神和范圍。