本發明設計工業過程故障診斷方法,特別是一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法。
背景技術:
1、旋轉機械是現代工業中廣泛應用且不可或缺的核心設備。隨著工業技術的快速發展,旋轉機械正朝著高度自動化、結構復雜化和規模大型化的方向演進。然而,這種趨勢也對設備的運行安全性與穩定性提出了更為嚴苛的要求。旋轉機械部件通常在非穩態的時變工況下工作,其關鍵部件的失效可能導致巨大的經濟損失甚至災難性事故。通過狀態監測與故障診斷技術可以有效提高設備運行的可靠性,減少因為機械設備故障損壞造成的經濟損失。因此,在現代工業生產中,針對時變工況下設備的狀態監控與智能故障診斷具有重要意義。
2、在實際工業過程中,旋轉設備的運行狀態常受到實際生產需求和外界影響而不斷變化,工況的變化會直接影響監測數據,如振動信號的頻率和幅值等,從而影響數據在特征空間中的分布。機械系統運行狀態的變化會直接引起訓練數據和測試數據之間的分布差異,而這種數據分布的差異則對于數據驅動的故障診斷方法的泛化性能產生影響。在變工況條件下,故障診斷的目標是利用設備在當前工況下的故障信息,預測其在另一工況(如不同轉速或負載)下的故障類型。然而,現有的變工況故障診斷方法多依賴于目標域數據有標簽的假設,但這一假設在實際運行維護中往往難以滿足。
3、雖然目前故障檢測技術已經廣泛應用于旋轉設備的故障診斷,但仍存在以下問題:(1)現有的基于數據驅動的故障診斷方法,如支持向量機、卷積神經網絡、長短期記憶,這些方法在旋轉機械的故障診斷中表現出顯著的性能。但是通常是在穩態條件下訓練的,嚴格的假設訓練數據和測試數據具有相同的分布。然而,在實際的診斷場景中,設備通常在非穩態變工況條件下進行。(2)由于目標域中可能存在工況變化和未知故障類型,最初生成的偽標簽往往不準確,錯誤的偽標簽會導致模型在早期階段對目標域數據進行錯誤分類,進而引發負遷移。(3)當前基于域自適應的故障診斷方法是通過構建多個分類器并減少源域特征和目標域特征之間的偏差來實現的。然而很少考慮到不同域下的類別對應的特征分布,當工作條件發生巨大變化時,學習域不變的知識是困難的。
技術實現思路
1、為了解決上述問題,本發明提出了一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法。
2、為了實現上述目的,按照本發明的一個方面,提供了一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,該方法包括:
3、1.一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,其特征在于,包括以下步驟:
4、步驟1:通過傳感器采集工業生產過程中的數據,將采集的不同工況的工業數據劃分為源域和目標域,分別將源域訓練集和目標域測試集定義為其中,是源域訓練集中第i個樣本,是源域訓練集第i個樣本的標簽,是目標域測試集第j個樣本,ns和nt分別是源域和目標域樣本數;
5、步驟2:利用步驟1得到的數據輸入特征提取器得到特征,構建的特征提取器由三個相同的特征提取單元串聯而成,每個單元包括一維卷積層、激活層、池化層以及批量歸一化層;
6、步驟3:利用特征提取器提取的源域特征,訓練如圖1所示的全局分類器和局部分類器,全局分類器預測目標域樣本的故障標簽概率,局部分類器預測其在各源域類型下的概率,結合兩者的置信度排序生成偽標簽,通過目標域樣本的全局和局部的置信度分析,按照從高到低的序列排序,排名越高為已知類別的可能性越大,排名越低為未知類別的可能性越大;
7、步驟4:針對高可信度偽標簽,利用高信度偽標簽在最大平均差異中引入正則化項,從而實現源域與目標域的條件分布對齊和邊緣分布對齊,根據訓練階段動態調整分布對齊強度,避免負遷移,同時,通過中心損失函數拉近已知類別樣本中心,保持未知樣本與已知類別的距離;
8、步驟5:通過在分類器中添加未知類輸出,將檢測到的未知樣本統一分類,實現變工況下已知故障類別的診斷和未知故障類別的識別。
9、2.根據權利要求1所述的一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,其特征在于,所述的步驟2,具體步驟為:
10、步驟2.1:首先卷積層通過在滑動窗口中執行卷積核與相應信號段之間的點積操作來實現局部卷積特征提取;然后將提取的特征輸入到激活層中,通過其中的非線性激活函數relu(·)進行非線性變換操作,從而實現非線性特征提取,其相應公式如下:
11、
12、其中,是第l層的第h個輸出特征圖,作為下一層的輸入特征圖,是第l-1層的第g個輸入特征圖,輸入特征圖是原始信號和分別是第l層第h個卷積核的權重和偏置項,*是卷積操作,relu(·)是非線激活函數,p和q分別是第l-1層的輸入特征圖數量和第l層的輸出特征圖數量;
13、步驟2.2:隨后,將通過上述步驟操作得到的輸出傳送到最大池化層max?pooling減小特征維度,池化層對應的公式為:
14、
15、其中,是第l層第h個池化核中,第r個位置的輸出值,是第l-1層第h個輸入特征圖在池化區域rr內的值;
16、步驟2.3:最后將池化層的輸出輸入到批量范數層完成對源域以及目標域特征的提取,批量歸一化相應公式如下:
17、
18、其中,是池化層的輸出,μ和σ2分別是當前訓練批次內的均值和方差,用于歸一化和標準化,ε是為了防止分母為零,通常取10-5,是可以學習的縮放參數,用于調整歸一化特征的分布范圍,β是可學習的偏執參數,用于調整歸一化后的特征的偏移。
19、3.根據權利要求1所述的一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,其特征在于,所述的步驟3,具體步驟為:
20、步驟3.1:全局分類器對目標域樣本進行置信度評估,給定目標域樣本xt,全局分類器會cg輸出一個向量[cg(xt,1),cg(xt,2),...,cg(xt,k)],每個值表示樣本屬于相應類別的置信度,對應的公式為:
21、cg(xt,c)=g(xt)[c],c∈{1,2,...,k}
22、其中,g(xt)[c]是全局分類器對樣本xt的輸出中,樣本屬于類別c的置信度,k是源域已知類別的總數;
23、步驟3.2:局部分類器由源域下的每個類型訓練的二分類器組成,每個子二進制分類器為每個目標域樣本輸出一個概率,以衡量目標域樣本屬于每個已知類別的可能性,然后給定目標域樣本xt,對應的局部分類器cl的整體輸出是一個概率向量[p1(xt),p2(xt),...,pk(xt)],反映樣本屬于類c的概率值,對應的公式為:
24、pl(xt)=cl(xt,c),c∈{1,2,...,k}
25、其中,pl(xt)是局部分類器對目標域樣本xt的輸出中,樣本屬于類別c的可能性,cl是類別為c的局部二分類器;
26、步驟3.3:通過目標域樣本的全局和局部的置信度分析,得到目標域樣本xt的綜合置信度值ct(xt),對應的公式為:
27、
28、其中,α和β分別是權重參數,用于平衡全局分類器和局部分類器的貢獻度;
29、步驟3.4:按照從高到低的序列排序rank(xt),排名越高為已知類別的可能性越大,排名越低為未知類別的可能性越大,對應的公式為:
30、rank(xt)=argsort(ct(xt),descending)
31、其中,argsort(,descending)是對輸入值按照置信度ct(xt)從高到低的順序,并返回排序后的索引。
32、4.根據權利要求1所述的一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,其特征在于,所述步驟3中,全局分類器的損失函數的關系式表示為:
33、
34、其中,lcls是源域樣本訓練的全局分類器的交叉熵損失,ns是源域共包含n個樣本,k是故障類別總數,是源域樣本的真實標簽,是全局分類器對樣本屬于第k類的預測概率;
35、所述局部分類器的損失函數的關系式表示為:
36、
37、其中,llos是訓練的局部分類器的交叉熵損失,cs是源域類別的總數,是源域的類別c共包含n個樣本,是類別c的源域樣本的集合,是二分類的指示函數,是局部分類器預測樣本屬于類別c的概率。
38、5.根據權利要求1所述的一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,其特征在于,所述的步驟4中,條件分布對齊損失函數的關系式如下:
39、
40、其中,lcmmd是條件分布對齊損失函數,和分別代表類別c在源域和目標域的樣本數量,fis,c和分別表示類別c在源域和目標域樣本的特征,k(·,·)是核函數,λ||θ||2是正則化項;
41、所述邊緣分布對齊損失函數的關系式如下:
42、
43、其中,lmmmd是條件分布對齊損失函數,ns和nt分別表示源域和目標域的樣本數量,fis和分別表示源域和目標域樣本的特征,k(·,·)是核函數,λθ2是正則化項;
44、所述中心損失函數的關系式如下:
45、
46、其中,lcenter是中心損失函數,c是已知類別的總數,nr和ns分別是已知類別c和未知類別u的樣本數量,和是已知類別c中第r個樣本的特征,是未知類別u中第s個樣本的特征,μc是已知類別c在特征空間的中心點,μu是未知類別u在特征空間的中心點,γ是權重系數。
47、6.根據權利要求4或5所述的一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,其特征在于,所述總損失函數的關系式如下:
48、ltotal=lclc+lloc+lcmmd+lmmmd+lcenter
49、7.一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,其特征在于:
50、該系統包括執行器,該執行器用于執行權利要求1-6任一項所述的一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法。
51、按照本發明的另一個方面,提供了一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,其特征在于,該方法利用執行器執行上述所述的基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法。
52、總體而言,通過本發明所提出的技術方案與現有技術相比,具有下列有益效果:
53、1.本發明構建一種多分類器預測偽標簽機制,多分類器包括全局分類器和局部分類器,全局分類器預測目標域樣本的故障標簽概率,局部分類器預測其在各源域類型下的概率,結合兩者的置信度排序生成高可信度偽標簽;低置信度偽標簽標記為未知故障類型。
54、2.本發明通過構建多分類器預測高可信度偽標簽機制得到高可信度偽標簽,在邊緣分布和條件分布的對齊上引入正則化項,動態調整分布強度以避免負遷移的發生。
55、3.本發明構建一種中心函數,在特征空間中引入中心損失函數拉近已知故障類別樣本中心,保持未知故障樣本與已知故障類別的距離。通過在分類器中添加未知類輸出,將檢測到的未知樣本統一分類,實現了變工況下已知故障類別的診斷和未知故障類別的識別。
56、4.本發明提供的一種基于偽標簽學習的多分類器決策機制的變工況不可見類型下的故障診斷方法,通過多分類器預測偽標簽機制得到高可信度偽標簽,引入正則化項動態調整特征分布對齊程度,利用中心函數拉近已知故障類別中心,保持已知故障類別和未知故障類別的距離,實現了對變工況下已知故障類別的診斷和未知故障類別的識別。