本發明涉及數據挖掘,特別涉及一種多維度軌道數據關聯方法、裝置、設備及介質。
背景技術:
1、隨著軌道交通發展,運營產生的數據量龐大且類型復雜多樣,如線路條件、列車速度、載客量、氣候變化、軌道不平順的隨機分布、乘客行為的不確定性等,給處理與分析帶來極大挑戰。軌道關聯分析需整合多源數據,然而走行部趨勢數據、軌道振動沖擊趨勢數據及軌道設計參數等數據在格式、語義、時空尺度方面差異大,融合困難。
2、綜上,如何準確挖掘軌道交通數據的關聯關系,以獲取準確關聯分析結果是本領域有待解決的技術問題。
技術實現思路
1、有鑒于此,本發明的目的在于提供一種多維度軌道數據關聯方法、裝置、設備及介質,能夠準確挖掘軌道交通數據的關聯關系,以獲取準確關聯分析結果。其具體方案如下:
2、第一方面,本技術公開了一種多維度軌道數據關聯方法,包括:
3、對位于預設時間范圍內的多源數據子集中的各軌道數據進行極值變化方向的趨勢分析,以得到第一分析結果;
4、對所述多源數據子集中的各走行部數據之間的數據差值變化進行趨勢分析,以得到第二分析結果;
5、按照共有維度將所述第一分析結果、所述第二分析結果、所述多源數據子集中的所述軌道數據以及所述走行部數據進行整合和標記處理,以得到標記后數據集;
6、對所述標記后數據集進行逐層搜索和剪枝處理,以得到滿足預設支持度閾值條件的標記后數據項組成的頻繁項集;
7、基于所述頻繁項集的各非空子集信息生成若干關聯規則,并計算各所述關聯規則的置信度信息,并將置信度信息滿足預設置信度閾值條件的關聯規則作為有效軌道數據關聯規則。
8、可選的,所述對位于預設時間范圍內的多源數據子集中的各軌道數據進行極值變化方向的趨勢分析之前,還包括:
9、從包含軌道振動沖擊數據、走行部數據、軌道設計參數、軌道運維數據的多源數據集中篩選與軌道關聯目標相關的多源數據子集。
10、可選的,所述從包含軌道振動沖擊數據、走行部數據、軌道設計參數、軌道運維數據的多源數據集中篩選與軌道關聯目標相關的多源數據子集之后,還包括:
11、刪除所述多源數據子集中的異常數據,以得到清洗后多源數據子集;
12、按照預設數據填充規則對所述清洗后多源數據子集進行數據填充處理,以得到預處理后的多源數據子集;其中,所述預設數據填充規則包括利用中位數法對所述清洗后多源數據子集中的數值型缺失數據進行填充,和/或利用眾數法對所述清洗后多源數據子集中的離散類型缺失數據進行填充;
13、相應的,所述對位于預設時間范圍內的多源數據子集中的各軌道數據進行極值變化方向的趨勢分析,以得到第一分析結果;對所述多源數據子集中的各走行部數據之間的數據差值變化進行趨勢分析,以得到第二分析結果,包括:
14、對位于預設時間范圍內的預處理后的多源數據子集中的各軌道數據進行極值變化方向的趨勢分析,以得到第一分析結果;
15、對預處理后的多源數據子集中的各走行部數據之間的數據差值變化進行趨勢分析,以得到第二分析結果。
16、可選的,所述對位于預設時間范圍內的多源數據子集中的各軌道數據進行極值變化方向的趨勢分析,以得到第一分析結果,包括:
17、將各軌道數據的軌道振動值進行分解處理,以得到分解后的隨時間變化的目標振動趨勢、目標季節性成分和目標殘差信息,作為第一分析結果。
18、可選的,所述將各軌道數據的軌道振動值進行分解處理,以得到分解后的隨時間變化的目標振動趨勢、目標季節性成分和目標殘差信息,作為第一分析結果,包括:
19、根據各軌道數據的軌道振動值的周期性特征設置季節性成分的周期長度;
20、初始化振動趨勢和季節性成分為空,以設置所述軌道振動值為殘差信息;
21、對所述殘差信息按照預設平滑窗口大小進行loess平滑處理,以將平滑后結果作為當前振動趨勢;
22、從所述軌道振動值中去除所述當前振動趨勢,以得到去趨勢后數據;
23、對所述去趨勢后數據按照所述周期長度進行數據分段,以得到各去趨勢后數據段,并對各所述去趨勢后數據段進行loess平滑處理,以得到初步季節性成分;
24、對所述初步季節性成分進行周期內平均處理,以得到修正后季節性成分;
25、從所述軌道振動值中去除所述修正后季節性成分,以得到去季節后數據;
26、對所述去季節后數據按照預設平滑窗口大小進行loess平滑處理,以更新所述當前振動趨勢,得到新的當前振動趨勢,并跳轉執行所述從所述軌道振動值中去除所述當前振動趨勢的步驟,直至振動趨勢與季節性成分的變化信息小于預設變化閾值,輸出當前振動趨勢與修正后季節性成分作為目標振動趨勢和目標季節性成分;
27、利用所述軌道振動值、所述目標振動趨勢和所述目標季節性成分確定目標殘差信息,以得到第一分析結果。
28、可選的,所述利用所述軌道振動值、所述目標振動趨勢和所述目標季節性成分確定目標殘差信息,包括:
29、通過確定目標殘差信息;
30、其中,表示時刻的目標振動趨勢;表示時刻的目標季節性成分,表示時刻的目標殘差信息,表示時刻的軌道振動值。
31、可選的,所述對所述多源數據子集中的各走行部數據之間的數據差值變化進行趨勢分析,以得到第二分析結果,包括:
32、將各走行部數據進行配對處理,以得到若干走行部數據對;
33、對每一所述走行部數據對進行求差處理,以得到各所述走行部數據對的差值結果;所述差值結果包含正差值結果和負差值結果;
34、基于所述正差值結果的數量信息與所述負差值結果的數量信息確定所述走行部數據的第二分析結果。
35、可選的,所述基于所述正差值結果的數量信息與所述負差值結果的數量信息確定所述走行部數據的第二分析結果,包括:
36、基于所述正差值結果的數量與所述負差值結果的數量的總和作為總數據對數量;
37、利用所述總數據對數量、所述走行部數據對的正差值結果/負差值結果的成功概率、成功次數進行二項式分布處理,以得到成功概率值,以基于所述成功概率值計算顯著水平信息;
38、根據所述正差值結果的數量信息與所述負差值結果的數量信息的大小結果、所述顯著水平信息分析所述走行部數據的數據差值變化的趨勢,以得到第二分析結果。
39、可選的,所述根據所述正差值結果的數量信息與所述負差值結果的數量信息的大小結果、所述顯著水平信息分析所述走行部數據的數據差值變化的趨勢,以得到第二分析結果,包括:
40、當所述正差值結果的數量大于所述負差值結果的數量,且所述顯著水平信息小于預設顯著水平閾值,則確定所述走行部數據的數據差值變化為上升趨勢,以得到趨勢分析結果為上升趨勢的第二分析結果;
41、當所述正差值結果的數量小于所述負差值結果的數量,且所述顯著水平信息小于預設顯著水平閾值,則確定所述走行部數據的數據差值變化為下降趨勢,以得到趨勢分析結果為下降趨勢的第二分析結果。
42、可選的,所述按照共有維度將所述第一分析結果、所述第二分析結果、所述多源數據子集中的所述軌道數據以及所述走行部數據進行整合和標記處理,以得到標記后數據集,包括:
43、按照共有維度將所述軌道數據和所述走行部數據進行整合處理,以得到過程整合數據集;
44、將所述第一分析結果、所述第二分析結果以字段形式插入到所述過程整合數據集,以得到整合后數據集;
45、對所述整合后數據集中的數值類型的整合后數據進行區間劃分處理,并對劃分區間后的整合后數據按照離散標記方式進行離散標記,以得到標記后數據集。
46、可選的,所述對所述標記后數據集進行逐層搜索和剪枝處理,以得到滿足預設支持度閾值條件的標記后數據項組成的頻繁項集,包括:
47、對所述標記后數據集進行掃描,以統計各個標記后數據項在所述標記后數據集出現的次數信息;
48、計算各標記后數據項的次數信息占所述標記后數據集的數據記錄數量的支持度;
49、將支持度小于預設支持度閾值條件的標記后數據項進行剪枝處理,以得到更新后的標記后數據項;
50、按照預設連接規則對每一數據記錄中更新后的標記后數據項進行連接,并以連接后的標記后數據項作為新的標記后數據項,并跳轉執行所述統計各個標記后數據項在所述標記后數據集出現的次數信息的步驟,直至剪枝結束,輸出頻繁項集。
51、第二方面,本技術公開了一種多維度軌道數據關聯裝置,包括:
52、第一趨勢分析模塊,用于對位于預設時間范圍內的多源數據子集中的各軌道數據進行極值變化方向的趨勢分析,以得到第一分析結果;
53、第二趨勢分析模塊,用于對所述多源數據子集中的各走行部數據之間的數據差值變化進行趨勢分析,以得到第二分析結果;
54、整合標記模塊,用于按照共有維度將所述第一分析結果、所述第二分析結果、所述多源數據子集中的所述軌道數據以及所述走行部數據進行整合和標記處理,以得到標記后數據集;
55、搜索處理模塊,用于對所述標記后數據集進行逐層搜索和剪枝處理,以得到滿足預設支持度閾值條件的標記后數據項組成的頻繁項集;
56、關聯生成模塊,用于基于所述頻繁項集的各非空子集信息生成若干關聯規則,并計算各所述關聯規則的置信度信息,并將置信度信息滿足預設置信度閾值條件的關聯規則作為有效軌道數據關聯規則。
57、第三方面,本技術公開了一種電子設備,包括:
58、存儲器,用于保存計算機程序;
59、處理器,用于執行所述計算機程序,以實現前述公開的多維度軌道數據關聯方法的步驟。
60、第四方面,本技術公開了一種計算機可讀存儲介質,用于存儲計算機程序;其中,所述計算機程序被處理器執行時實現前述公開的多維度軌道數據關聯方法的步驟。
61、可見,本技術公開了一種多維度軌道數據關聯方法,包括:對位于預設時間范圍內的多源數據子集中的各軌道數據進行極值變化方向的趨勢分析,以得到第一分析結果;對所述多源數據子集中的各走行部數據之間的數據差值變化進行趨勢分析,以得到第二分析結果;按照共有維度將所述第一分析結果、所述第二分析結果、所述多源數據子集中的所述軌道數據以及所述走行部數據進行整合和標記處理,以得到標記后數據集;對所述標記后數據集進行逐層搜索和剪枝處理,以得到滿足預設支持度閾值條件的標記后數據項組成的頻繁項集;基于所述頻繁項集的各非空子集信息生成若干關聯規則,并計算各所述關聯規則的置信度信息,并將置信度信息滿足預設置信度閾值條件的關聯規則作為有效軌道數據關聯規則。由此可見,通過對軌道數據進行極值變化方向的趨勢分析以及對走行部數據進行差值變化趨勢分析,得到第一分析結果和第二分析結果,深度剖析軌道和走行部運行狀態的變化趨勢,及時發現軌道振動異常上升或走行部數據的異常波動,為預測潛在故障提供依據,按照共有維度將上述數據進行整合,打破數據壁壘,形成全面、系統的標記后數據集。解決了多源數據融合難題,為挖掘多維度關聯關系提供了豐富的數據基礎,確保分析結果更具準確性和全面性。采用逐層搜索和剪枝技術處理標記后數據集,能快速準確地獲取滿足預設支持度閾值的頻繁項集,大大提高挖掘效率,能夠精準定位關鍵標記后數據項,減少計算資源消耗。最后基于頻繁項集非空子集生成關聯規則,并嚴格計算和篩選置信度滿足閾值的規則,確保得到的有效軌道數據關聯規則真實可靠,能夠獲取軌道數據、走行部數據之間的內在聯系。