本發明屬于一種人工智能模型訓練方法,具體涉及一種多種氣象條件下空調負荷的基線評估方法。
背景技術:
1、近年來,物聯網技術的普及促使各地區氣象監測站和空調運行監測系統持續采集大量實時與歷史數據,數據內容涵蓋環境溫度、濕度、風速、氣壓以及空調能耗、電流、功率、室內溫度等多個維度。氣象條件的多樣性和區域特性使得不同監測站采集的數據在格式、屬性數量和時序關聯上存在顯著差異,加之數據采集過程中不可避免的噪聲、缺失及異常情況,給后續數據預處理、特征提取與模型訓練帶來諸多挑戰。尤其在面對氣象條件變化引起的空調負荷數據分布漂移時,傳統的數據處理與降維方法難以保證降維后特征的穩定性和空調負荷的準確預測,影響基線評估和異常負荷識別的準確性。針對上述問題,亟需建立一套從數據采集、預處理、特征提取到機器學習建模和負荷基線構建的整體技術方案,以實現對多種氣象條件下空調負荷變化的精準監測和評估,確保監測系統在面對數據異構、噪聲以及分布漂移等實際問題時,仍能保持較高的處理效率和預測準確率。
2、公開號為cn114636228a的中國發明專利提出一種基于機器學習算法的中央空調系統可調度負荷預測方法,借助中央空調系統歷史運行數據,利用機器學習算法構建中央空調系統可調度負荷預測模型。整個預測模型建立過程清楚簡單,具有很強的可操作性和較高的預測精度,便于中央空調系統參與需求側響應的落地實施。
3、公開號為cn115186965a的中國發明專利提出一種基于機器學習的光伏空調生命周期不確定性分析方法。方法包括如下步驟:1)對光伏空調設備進行選型;2)收集光伏空調在其全生命周期內的資源、能源消耗;3)確定環境影響類別和環境影響因子;4)計算不同的環境影響潛值;5)計算光伏空調的總環境負荷;6)對光伏空調進行環境影響評價;7)對光伏空調的環境影響指標進行不確定性分析;8)建立機器學習模型進行變量重要性分析。本方法可以準確的評估光伏空調對環境的影響,可為設計人員提供更為可靠的建議,同時對保護環境也具有一定的積極意義。
4、公開號為cn119227285a的中國發明專利提出一種空調負荷預測方法、裝置、計算機設備和介質,包括:獲取預設時段內空調區域的環境因素數據,環境因素數據包括:當前輻射強度、當前溫度和當前相對濕度;基于環境因素數據和初始負荷預測模型,確定預設時段內空調區域的負荷所屬類別,初始負荷預測模型用于通過環境因素數據對空調負荷進行初始預測;基于預設時段內空調區域的負荷所屬類別,確定預設時段內空調區域的負荷預測結果。從而,通過引入機器學習方法,為空調負荷預測提供了新的技術路徑,便于精準預測空調負荷。
5、現有技術存在以下不足:
6、1、本發明使用基于空調負荷數據分布漂移檢測的變分自編碼器模型,通過實時計算偏度和峰度監控數據分布變化,實現對氣象條件變化引起的數據漂移的自適應調整。
7、2、本發明采用梯度相位對齊機制,在變分自編碼器訓練過程中對梯度方向進行平衡,降低梯度更新波動,改善訓練過程穩定性。
8、3、本發明采用流形約束技術,對低維潛在空間中數據間局部幾何結構進行約束,確保降維后空調負荷數據關鍵特征得以保留。
9、4、本發明采用基于稀疏性的級聯-相關神經網絡分類算法,通過稀疏性掩碼和l1正則化約束,降低模型過擬合風險,確保空調負荷在低負荷、中負荷、高負荷劃分中的判別準確。
技術實現思路
1、針對現有技術中的技術問題,提供了一種多種氣象條件下空調負荷的基線評估方法,包括:
2、步驟s1:對空調負荷數據進行標注并以此構建數據集;
3、步驟s2:構建評價模型,模型包括自編碼器和分類器,導入空調負荷數據至自編碼器中,獲取自編碼特征;在此過程中,進行空調負荷數據分布漂移檢測與自適應調整,通過對輸入空調負荷數據進行實時統計分析,計算空調負荷數據的偏度和峰度從而實現空調負荷數據漂移的動態補償,從而動態調整自編器的分布假設;
4、步驟s3:導入自編碼特征至分類器中,獲取預測的負荷類型;在此過程中采用基于稀疏性約束的交叉熵損失函數控制分類器的稀疏性;
5、在步驟s2和步驟s3的過程中分別構建損失函數,最小化損失函數以優化評價模型。
6、進一步的,步驟s1中的空調負荷數據包括:低負荷、中負荷和高負荷。
7、進一步的,步驟s2中的導入空調負荷數據至自編碼器中,獲取自編碼特征,具體為:
8、步驟s21:初始化自編碼器的參數,具體為通過隨機初始化的方式對自編碼器的權重和偏置進行初始化,初始化的方式表示為:
9、;
10、?;
11、其中,和分別為自編碼器的編碼器和解碼器的權重矩陣;和分別為自編碼器的編碼器和解碼器的偏置向量;為自編碼器初始化的標準差,表示正態分布;
12、步驟s22:輸入空調負荷數據至自編碼器,進行空調負荷數據分布漂移檢測與自適應調整,接著通過對輸入空調負荷數據進行實時統計分析,計算空調負荷數據的偏度和峰度,從而捕捉空調負荷數據分布的變化,實現空調負荷數據漂移的動態補償,從而動態調整自編器的分布假設,獲取動態調整后的空調負荷數據;
13、步驟s23:輸入動態調整后的空調負荷數據通過編碼器映射到低維潛在空間表示,實現有效的降維處理,通過對動態調整后的空調負荷數據進行掩碼操作,以模擬部分空調負荷數據丟失的情況,潛在空間表示的計算方式為:
14、;
15、式中,為編碼器映射得到的第個潛在表示;表示元素乘積,表示激活函數;為第個自編碼器的動態調整后的空調負荷數據的掩碼,表示第個動態調整后空調負荷數據;
16、步驟s24:在潛在空間的表示學習完成后,通過解碼器對動態調整后的空調負荷數據進行重構,獲取重構空調負荷數據點的并計算重構誤差,通過重構誤差構造自編碼器損失函數,并在空調負荷數據分布漂移的條件下獲得穩定的訓練效果,自編碼器損失函數表示為:
17、;
18、其中,表示解碼器輸出的第個重構空調負荷數據,也即自編碼特征,表示重構空調負荷數據的總數,表示流形約束的正則化參數,表示流行約束損失函數,表示相位對齊損失函數;
19、步驟s25:采用梯度下降法對自編碼器的網絡參數進行優化,逐步減少自編碼器損失函數,通過迭代優化,獲取自編碼器的最佳參數,完成訓練過程,參數更新規則如下:
20、;
21、;
22、;
23、;
24、其中,表示自編碼器的學習率;表示參數更新操作;
25、步驟s26:重復迭代步驟s21~步驟s25,直至滿足預設的停止迭代條件。
26、進一步的,步驟s22中的偏度和峰度的計算方式表示為:
27、;
28、;
29、式中,為第個空調負荷數據的偏度,為第個空調負荷數據的峰度,和分別為空調負荷數據的均值和標準差;表示輸入到自編碼器的空調負荷數據維度;為輸入到自編碼器的第個空調負荷數據的第個特征。
30、進一步的,步驟s24中通過相位對齊損失函數,利用梯度相位對齊機制,通過對梯度方向進行對齊,減少梯度更新過程中方向上的不一致性,從而使得自編碼器進行平滑學習,在訓練過程中,通過最小化相位對齊損失函數,能夠有效地減少梯度更新過程中的震蕩,提高自編碼器訓練的穩定性,梯度相位對齊緩解由于空調負荷數據分布不一致引起的訓練震蕩,從而保證在降維過程中捕捉到的關鍵特征穩定且具有較高的魯棒性,為基線評估提供更準確的低維表示,相位對齊損失函數表示為:
31、;
32、其中,為相位對齊損失函數;和分別為自編碼器的編碼器和解碼器的梯度,表示梯度的內積;為自編碼器的損失函數關于編碼器權重的梯度;為自編碼器的損失函數關于解碼器權重的梯度;為當前批次輸入到自編碼器的空調負荷數據的數量。
33、進一步的,步驟s24采用流形約束對低維表示之間的幾何距離進行約束,保證空調負荷數據在潛在空間中的連貫性,通過最小化流形約束損失函數,能夠有效保持空調負荷數據在潛在空間中的局部結構和幾何特性,流形約束損失函數的計算公式表示為:
34、;
35、其中,和分別表示編碼器映射得到的第個潛在表示和第j個潛在表示;表示空調負荷數據的個最近鄰;為正整數;表示l2范數。
36、進一步的,步驟s3具體為:
37、步驟s31:初始化分類器的參數,參數包括分類器的權重和偏置項,采用小隨機數進行初始化以打破對稱性,具體的,分類器的權重和偏置的初始化方式表示為:
38、;
39、;
40、式中,和分別表示初始化的權重和偏置;和分別表示輸入和輸出的神經元數量;表示均值為0,方差為1的正態分布;
41、步驟s32:輸入經過降維后的空調負荷數據特征向量,分類器通過一系列級聯的神經網絡單元進行處理,每一單元都會進行稀疏性約束和相關性分析,具體的,在前向傳播過程中,基于稀疏性的神經元的激活表示為:
42、;
43、;
44、其中,表示分類器第l層的激活值;表示激活函數;和分別表示分類器第l層的權重和偏置;為稀疏性掩碼,表示隨機丟棄函數,表示保留概率;表示元素乘積;
45、步驟s33:根據分類器的輸出和真實標簽計算損失函數,采用基于稀疏性約束的交叉熵損失函數,計算方式表示為:
46、;
47、其中,為基于稀疏性約束的交叉熵損失函數;和分別表示真實標簽和預測標簽,是控制正則化強度的超參數,用于調節稀疏性的強度;為分類器的所有權重的絕對值之和;
48、步驟s34:通過反向傳播算法,計算l1正則化項對每個參數的梯度,并更新模型參數,采用帶動量的梯度下降方法來加速收斂并減少震蕩,具體的,對損失函數進行梯度下降優化,更新權重和偏置的方式表示為:
49、;
50、;
51、其中,和表示更新后的分類器的權重和偏置;為分類器的學習率;和分別表示損失函數對權重和偏置的偏導數;
52、步驟s35:重復迭代步驟s31~步驟s34,直至滿足預設的停止迭代條件。
53、進一步的,步驟s3?中l1正則化項對權重的計算方式表示為:
54、;
55、其中,表示分類器的隱藏層的神經元數量;和分別表示分類器的第個神經元的權重和偏置的絕對值。
56、本發明的積極進步效果在于:
57、1、本發明實現對氣象條件變化引起的空調負荷數據分布漂移的實時監控和自適應調整,確保降維后特征表達穩定。
58、2、降低訓練過程中梯度更新波動,縮短模型收斂時間,提升自編碼器訓練效率。
59、3、保持低維潛在空間中空調負荷數據的局部幾何結構,使降維后特征真實反映空調運行與氣象條件之間的關系。
60、4、提高空調負荷分類任務中各類別劃分準確率,為能耗監控和異常負荷識別提供量化標準。