本發明涉及集群監控,特別是涉及一種集群監控方法及裝置、電子設備、存儲介質。
背景技術:
1、在高性能計算(hpc)領域,超級計算集群通常需要有效的監控系統來管理和優化計算資源。這些集群一般由多個計算節點組成,并運行不同的任務和應用程序。而為了高效地管理這些資源,監控系統需要實時收集和處理關于節點狀態、任務執行情況以及資源利用率的監控數據;以便用戶進行集群管理。
2、相關技術中的監控解決方案一般包括由集群提供者自建監控數據可視化面板,或直接使用開源軟件進行數據定制化展示等。具體來說,這涉及針對用戶的定制化數據需求開發定制化監控模塊,包括定制化的可視化面板和監控數據獲取程序等。這種方法的優勢在于定制化開發帶來的穩定性與專業性。
3、然而,由于許多用戶都有著各不相同的定制化數據需求,例如需要將數據存入指定數據庫等情況,導致需要針對不同用戶的定制化數據需求全量開發對應的集群監控服務程序,進而導致部署和維護的難度較大;無法實現一套代碼多端部署,難以實現統一的線上鏡像。
技術實現思路
1、鑒于上述問題,提出了以便提供克服上述問題或者至少部分地解決上述問題的一種集群監控方法及裝置、電子設備、存儲介質,包括:
2、一種集群監控方法,所述方法包括:
3、響應于集群監控服務的啟動需求,獲取預設配置文件,并根據所述預設配置文件啟動所述集群監控服務;其中,所述預設配置文件中至少包括集群特性配置項;
4、確定目標集群,并通過所述集群監控服務根據所述集群特性配置項,判斷所述目標集群是否為定制化集群;其中,所述定制化集群為具有用戶定制化數據需求的集群;
5、在所述目標集群為所述定制化集群的情況下,確定所述目標集群對應的目標數據庫,并通過所述集群監控服務對所述定制化集群進行數據采集,得到所述定制化集群的監控數據;
6、通過所述集群監控服務將所述定制化集群的監控數據傳輸至所述目標數據庫;
7、在所述目標集群不為所述定制化集群的情況下,通過所述集群監控服務對所述目標集群進行數據采集,得到所述目標集群的監控數據;
8、通過所述集群監控服務將所述目標集群的監控數據傳輸至默認數據庫。
9、可選的,所述預設配置文件中還包括調度器類型配置項,所述通過所述集群監控服務對所述定制化集群進行數據采集,包括:
10、通過所述集群監控服務根據所述調度器類型配置項,確定需采用的目標調度器;
11、通過所述集群監控服務根據所述目標調度器對所述定制化集群進行數據采集。
12、可選的,所述通過所述集群監控服務對所述目標集群進行數據采集,包括:
13、通過所述集群監控服務根據所述調度器類型配置項,確定需采用的目標調度器;
14、通過所述集群監控服務根據所述目標調度器對所述目標集群進行數據采集。
15、可選的,所述預設配置文件中還包括調度器版本配置項,所述通過所述集群監控服務根據所述調度器類型配置項,確定需采用的目標調度器,包括:
16、通過所述集群監控服務根據所述調度器類型配置項與所述調度器版本配置項,確定需采用的所述目標調度器。
17、可選的,所述預設配置文件中還包括數據庫配置項;所述通過所述集群監控服務將所述定制化集群的監控數據傳輸至所述目標數據庫,包括:
18、通過所述集群監控服務根據所述數據庫配置項建立所述集群監控服務與所述目標數據庫之間的數據連接;
19、在所述數據連接建立成功的情況下,通過所述集群監控服務將所述定制化集群的監控數據傳輸至所述目標數據庫。
20、可選的,所述通過所述集群監控服務將所述定制化集群的監控數據傳輸至所述目標數據庫或所述通過所述集群監控服務將所述目標集群的監控數據傳輸至默認數據庫之前,還包括:
21、通過所述集群監控服務對所述監控數據進行封裝映射處理,生成所述監控數據對應的可讀列表。
22、可選的,所述方法還包括:
23、對已完成所述封裝映射處理的所述監控數據進行打包處理。
24、一種集群監控裝置,所述裝置包括:
25、集群監控服務啟動模塊,用于響應于集群監控服務的啟動需求,獲取預設配置文件,并根據所述預設配置文件啟動所述集群監控服務;其中,所述預設配置文件中至少包括集群特性配置項;
26、定制化集群判斷模塊,用于確定目標集群,并通過所述集群監控服務根據所述集群特性配置項,判斷所述目標集群是否為定制化集群;其中,所述定制化集群為具有用戶定制化數據需求的集群;
27、第一數據采集模塊,用于在所述目標集群為所述定制化集群的情況下,確定所述目標集群對應的目標數據庫,并通過所述集群監控服務對所述定制化集群進行數據采集,得到所述定制化集群的監控數據;
28、第一數據傳輸模塊,用于通過所述集群監控服務將所述定制化集群的監控數據傳輸至所述目標數據庫;
29、第二數據采集模塊,用于在所述目標集群不為所述定制化集群的情況下,通過所述集群監控服務對所述目標集群進行數據采集,得到所述目標集群的監控數據;
30、第二數據傳輸模塊,用于通過所述集群監控服務將所述目標集群的監控數據傳輸至默認數據庫。
31、一種電子設備,包括處理器、存儲器及存儲在所述存儲器上并能夠在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執行時實現如上所述的集群監控方法。
32、一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲計算機程序,所述計算機程序被處理器執行時實現如上所述的集群監控方法。
33、一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行時實現如上所述的集群監控方法。
34、本發明實施例具有以下優點:
35、本發明提供了一種集群監控方法,通過響應于集群監控服務的啟動需求獲取預設配置文件,并根據預設配置文件啟動集群監控服務;其中,預設配置文件中至少包括集群特性配置項;從而在此基礎上確定目標集群,并通過集群監控服務根據集群特性配置項判斷目標集群是否為定制化集群;進而在目標集群為定制化集群的情況下確定目標集群對應的目標數據庫,并根據目標數據庫與集群監控服務對目標集群進行數據采集;而在目標集群不為定制化集群的情況下,則根據默認數據庫與集群監控服務對目標集群進行數據采集的方式。實現了通過統一的預置配置文件根據集群的定制化情況來進行集群監控數據采集,無需針對不同用戶的定制化數據需求全量開發對應的集群監控服務程序,降低了開發和維護的成本,提高了部署效率,增強了系統的可擴展性,提升了監控系統的靈活性。
1.一種集群監控方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述預設配置文件中還包括調度器類型配置項,所述通過所述集群監控服務對所述定制化集群進行數據采集,包括:
3.根據權利要求2所述的方法,其特征在于,所述通過所述集群監控服務對所述目標集群進行數據采集,包括:
4.根據權利要求2或3所述的方法,其特征在于,所述預設配置文件中還包括調度器版本配置項,所述通過所述集群監控服務根據所述調度器類型配置項,確定需采用的目標調度器,包括:
5.根據權利要求2所述的方法,其特征在于,所述預設配置文件中還包括數據庫配置項;所述通過所述集群監控服務將所述定制化集群的監控數據傳輸至所述目標數據庫,包括:
6.根據權利要求1所述的方法,其特征在于,所述通過所述集群監控服務將所述定制化集群的監控數據傳輸至所述目標數據庫或所述通過所述集群監控服務將所述目標集群的監控數據傳輸至默認數據庫之前,還包括:
7.根據權利要求6所述的方法,其特征在于,所述方法還包括:
8.一種集群監控裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,包括處理器、存儲器及存儲在所述存儲器上并能夠在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執行時實現如權利要求1至7中任一項所述的集群監控方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲計算機程序,所述計算機程序被處理器執行時實現如權利要求1至7中任一項所述的集群監控方法。