本發明涉及電壓數據處理領域,尤其是涉及一種基于互信息的戶相關系匹配方法、設備及介質。
背景技術:
1、智能電表可以根據用戶設定的時間間隔,實時傳輸多種測量信息內容,包含用電量、有功功率、無功能量、壓力、流量等,從而更好地滿足用戶的需求。隨著技術的進步,智能電表的抄讀成功率和效率大大提升,其數據具有極高的價值,能夠反應出供電系統網絡系統中各個節點的電能時間截面消息,而且也能夠揭示出供電系統網絡系統的拓撲構造、負載和線損等基本要素之間的關聯性。因此,通過對電表量測數據的分析,能夠更加準確地判斷供電系統網絡系統的拓撲構造。
2、近年來,基于同相用戶電壓波形相似性及同戶表內電壓集群特性的聚類方法已經取得較大發展,可以有效地識別出戶變關系。
3、但這類方法僅僅利用到節點的電壓波動特征,在量測數據質量不佳的場合中,其辨識能力會受到嚴重限制。
技術實現思路
1、本發明的目的就是為了克服上述現有技術存在的缺陷而提供了一種基于互信息的戶相關系匹配方法、設備及介質,可在低質量電壓量測數據情況下更加實現更加精準地戶相關系匹配。
2、本發明的目的可以通過以下技術方案來實現:
3、根據本發明的第一方面,提供了一種基于互信息的戶相關系匹配方法,該方法包括以下步驟:
4、步驟s1、對臺區關口表的三相電壓數據及臺區關口下屬居民用戶戶表的實測電壓數據進行連續時間采樣,得到電壓數據表;
5、步驟s2、采用奇異值閾值算法對所述電壓數據表中的缺失數據進行補全;
6、步驟s3、計算臺區各相電壓與用戶電壓之間的最大互信息系數;
7、步驟s4、選取三相中與用戶電壓之間的最大互信息系數最大的相作為用戶接入相,完成戶相關系匹配。
8、優選地,所述步驟s1中對臺區關口表的三相電壓數據及臺區關口下屬居民用戶戶表的實測電壓數據進行連續時間采樣,得到電壓數據表,具體為:在連續時間段每隔設定時長采樣一次三相電壓數據及臺區關口下屬居民用戶戶表的實測電壓數據,得到連續時間段中多個采樣時刻數據,形成電壓數據表。
9、優選地,所述步驟s2中采用奇異值閾值算法對所述電壓數據表中的缺失數據進行補全,具體包括:
10、對于電壓數據表矩陣a,初始化輔助變量z0=0和y0=0,設置收斂條件∈,最大迭代次數kmax,初始化迭代次數k=0,第k次迭代過程包括:
11、1)對已知元素部分的采樣矩陣aω進行奇異值分解為:
12、
13、式中:uk為左奇異矩陣,σk為奇異值向量,vk為右奇異矩陣,t為轉置;
14、2)對奇異值向量σk進行軟閾值處理,得到更新后的奇異值向量σk+1;
15、
16、式中:表示對奇異值向量σk中低于閾值的元素置為0,λ和ρ為均為設置的正則化參數;
17、3)采用更新后的奇異值向量sk、左奇異矩陣uk和奇異值向量σk重構采樣矩陣aω,得到更新后的數據ak+1:
18、
19、4)更新第k+1次的輔助變量zk+1和yk+1:
20、
21、yk+1=yk+ak+1-zk+1
22、5)如果滿足收斂條件|ak+1-ak|f≤∈或到達最大迭代次數kmax,|?|f為frobenius范數,則停止迭代,否則進行第k+1次迭代。
23、優選地,所述步驟s3中,臺區單相電壓與用戶電壓之間的最大互信息系數,計算過程具體包括:
24、1)對用戶電壓序列x和單相電壓序列y分別進行同一方向排序,得到排序后的用戶電壓序列u和排序后的單相電壓序列v;
25、2)交換排序后的用戶電壓序列u和排序后的單相電壓序列v中任意一對元素,得到新的排列;
26、3)計算新排列之間的互信息系數;
27、4)重復2)和3),直到得到所有排列的互信息系數;
28、5)取所有排列互信息系數的最大值作為用戶電壓序列x和單相電壓序列y的最大互信息系數。
29、優選地,所述互信息系數計算表達式為:
30、
31、其中,p(ui=x,vj=y)表示變量ui取值為x,變量vj取值為y的概率,p(ui=x)和p(vj=y)分別表示變量ui和vj取值為x和y的概率。
32、優選地,所述取所有排列互信息系數的最大值作為用戶電壓序列x和單相電壓序列y的最大互信息系數,計算表達式為:
33、
34、其中,i和j是u和v的索引;i(ui,vj)表示變量ui和vj之間的互信息,card(u)和card(v)分別表示u和v的長度。
35、優選地,所述步驟s3計算得到所有臺區各相電壓與用戶電壓之間的最大互信息系數之后,還包括對最大互信息系數進行歸一化處理。
36、優選地,所述歸一化處理采用z-score歸一化算法。
37、根據本發明的第二方面,提供了一種電子設備,包括存儲器和處理器,所述存儲器上存儲有計算機程序,所述處理器執行所述程序時實現任一項所述的方法。
38、根據本發明的第三方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,所述程序被處理器執行時實現任一項所述的方法。
39、與現有技術相比,本發明具有以下有益效果:
40、本發明采用奇異值閾值算法對電壓數據表中的缺失數據進行補全,進而采用最大互信息系數方法對補全缺失數據后的電壓表數據進行戶相關系匹配,可在低質量電壓量測數據情況下實現高精準地戶相關系匹配。
1.一種基于互信息的戶相關系匹配方法,其特征在于,該方法包括以下步驟:
2.根據權利要求1所述的一種基于互信息的戶相關系匹配方法,其特征在于,所述步驟s1中對臺區關口表的三相電壓數據及臺區關口下屬居民用戶戶表的實測電壓數據進行連續時間采樣,得到電壓數據表,具體為:在連續時間段每隔設定時長采樣一次三相電壓數據及臺區關口下屬居民用戶戶表的實測電壓數據,得到連續時間段中多個采樣時刻數據,形成電壓數據表。
3.根據權利要求1所述的一種基于互信息的戶相關系匹配方法,其特征在于,所述步驟s2中采用奇異值閾值算法對所述電壓數據表中的缺失數據進行補全,具體包括:
4.根據權利要求1所述的一種基于互信息的戶相關系匹配方法,其特征在于,所述步驟s3中,臺區單相電壓與用戶電壓之間的最大互信息系數,計算過程具體包括:
5.根據權利要求4所述的一種基于互信息的戶相關系匹配方法,其特征在于,所述互信息系數計算表達式為:
6.根據權利要求5所述的一種基于互信息的戶相關系匹配方法,其特征在于,所述取所有排列互信息系數的最大值作為用戶電壓序列x和單相電壓序列y的最大互信息系數,計算表達式為:
7.根據權利要求4所述的一種基于互信息的戶相關系匹配方法,其特征在于,所述步驟s3計算得到所有臺區各相電壓與用戶電壓之間的最大互信息系數之后,還包括對最大互信息系數進行歸一化處理。
8.根據權利要求7所述的一種基于互信息的戶相關系匹配方法,其特征在于,所述歸一化處理采用z-score歸一化算法。
9.一種電子設備,包括存儲器和處理器,所述存儲器上存儲有計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1~8任一項所述的方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行時實現如權利要求1~8中任一項所述的方法。