本發明屬于運維,具體涉及一種基于多云構建監控告警系統及管理方法。
背景技術:
1、運維,即it運維管理,是指對it系統、網絡和應用程序等進行持續的監控、管理和維護,以確保其高效、穩定和安全運行,在現代信息技術環境中,運維扮演著至關重要的角色。隨著企業數字化轉型加速,it系統越來越復雜,運維工作也變得更加重要。
2、現有技術存在的問題:
3、基于多云構建的監控運維系統中,接入多個云平臺,同時,單個云平臺會有多個不同的子賬號,云資源分布在不同的云賬號下,企業管理較為繁瑣,且針對多云平臺的統一性較差,特別是在未統一監控平臺時,云控制臺查看監控,切換不同賬號,操作繁瑣。
技術實現思路
1、本發明的目的是提供一種基于多云構建監控告警系統及管理方法,能夠實現對多云平臺及子賬戶的管理,且能夠實現平臺統一、簡化操作、優化展示、權限隔離、多云融合。
2、本發明采取的技術方案具體如下:
3、一種基于多云構建監控告警系統,包括:
4、多云端口,用于配置并連接多云平臺,并通過建立多個子賬戶,用于實現對多云平臺的訪問;
5、監控系統,監控系統,通過建立的子賬戶實現對云端及客戶端之間的數據連接以及監控;
6、告警系統,告警系統根據獲取的監控數據,設定告警規則實現告警提示,顯現于告警大盤中;
7、策略系統,用于設定告警系統的告警策略,以及實現告警策略的規劃、修改及運行;
8、其中,監控系統包括多個云端平臺接口及統一數據采集引擎,通過多個云端平臺接口實現對多云端口的連接,以及多個子賬戶對應多個云端平臺接口實現的數據訪問權限管理,使用統一數據采集引擎用于對跨多個云端平臺接口的數據收集、標準化并整合資源使用和性能數據;
9、告警系統與策略系統均集成于集成管理平臺,將運維信息顯現于告警大盤中,并通過內置的動態告警生成器實現對告警規則的設定,定義告警規則中的告警閾值,并檢測異常運行狀態觸發告警信息,并顯現于告警大盤中。
10、可選的,告警閾值為根據策略系統獲取的監控數據,及監控數據的歷史數據分析,獲取的告警閾值趨勢,結合告警閾值生成告警策略。
11、可選的,告警信息的數據反饋至監控系統,通過監控系統實現對產生預警模塊的定位,并通過策略系統調取產生預警模塊的歷史數據。
12、可選的,策略系統內還設置有策略運行測試模塊。
13、一種基于多云構建監控告警管理方法,包括如下步驟:
14、基于多云端口獲取的終端及云端數據反饋至告警系統;
15、基于告警策略獲取的監控數據設定告警規則;
16、將告警規則設定為多級告警數據包,通過將多級告警數據包實現關聯性連接;
17、多級告警數據包之間的關聯性數據為告警信息;
18、根據告警策略判定多級告警數據包關聯性告警信息的類型;
19、對告警信息類型進行對應模塊的關聯性比對,以獲取對應的告警策略及解決策略;
20、將告警策略反饋至告警系統以實現對應告警信息的測試以及告警策略數據的分發;
21、將解決策略反饋至策略系統以實現對應告警信息的策略規劃及告警系統測試。
22、可選的,還包括如下步驟:
23、將多個云端平臺,分別以對應功能模塊設定對應的網絡分區;
24、獲取其中一個網絡分區數據,根據大數據或人工設定針對一個網絡分區設定一個告警數據的解決策略;
25、將策略輸入至策略系統,通過策略系統根據告警提示匹配對應的修改策略,并通過策略系統運行策略,以實現對告警信提示的修復。
26、可選的,網絡分區方法,包括如下步驟:
27、基于多云平臺為基底,以多云監控系統為主干,構建以告警系統及策略系統為分支的網絡分區策略樹;
28、通過與告警系統及策略系統關聯的告警提示,以及與告警提示對應的告警策略構建樹狀關聯神經網絡;
29、并對樹狀關聯神經網絡實現對應分區,并顯現在告警大盤中,實現對應顏色的區別分區。
30、可選的,網絡分區修復方法,包括如下步驟:
31、設定針對任一區別分區的運維數據參數以及運維異常閾值參數;
32、通過多次驗證,并記錄是否符合設定值;
33、若不符合,則預警,獲取閾值趨向,以及根據預警信息,獲取區別分區中對應的告警策略;
34、若符合,則將預警信息記錄,并反饋,以實現對預警信息的進一步監測與分析;
35、分析兩種預警信息,獲取對應模塊數據異常信息,并定位對應的預警信息產生模塊;
36、以獲取對應模塊的當前異常信息,以及對應模塊的預測問題;
37、根據獲取的異常信息以及預測問題分析故障隱患;
38、或者對應模塊的缺陷,并提供一種修復方法。
39、根據本發明實施例的又一方面,還提供了一種計算機可讀存儲介質,存儲介質存儲有計算機程序,計算機程序被處理器執行時實現前述中任一項的方法。
40、根據本發明實施例的又一方面,還提供了一種計算機程序產品,包括計算機程序,計算機程序被處理器執行時實現前述中任一項的方法。
41、本發明取得的技術效果為:
42、本發明,通過多云構建的監控系統,接入多個云平臺,根據單個或多個云平臺對告警信息的獲取,再通過策略實現對對應問題的監測以及修復,通過對多云平臺資源的管理,實現管理的統一性,并通過對應告警信息的對應策略,使操作更加簡單,并通過告警大盤實現告警信息的展示。
43、本發明,通過且針對多云平臺的統一性管理,通過告警大盤實現查看監控信息,并通過多云端口實現多賬戶的切換,實現多云融合,以及數據隔離,使告警信息管理操作更加簡單。
44、本發明,監控大盤的展示可以實現統一和優化,實現告警信息加載速度快,告警信息的輸出更加簡潔、流暢,避免復雜信息的冗余,造成信息判斷的復雜性,簡化告警信息,提升人員或監控系統的判斷效率。
1.一種基于多云構建監控告警管理方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的一種基于多云構建監控告警管理方法,其特征在于,包括如下步驟:
3.根據權利要求1或2中任一所述的一種基于多云構建監控告警管理方法,其特征在于,所述網絡分區方法,包括如下步驟:
4.根據權利要求3所述的一種基于多云構建監控告警管理方法,其特征在于,所述網絡分區修復方法,包括如下步驟:
5.一種基于多云構建監控告警系統,使用如權利要求1至4中任一所述的方法,其特征在于,包括:
6.根據權利要求5所述的一種基于多云構建監控告警系統,其特征在于:所述告警閾值為根據策略系統獲取的監控數據,及監控數據的歷史數據分析,獲取的告警閾值趨勢,結合告警閾值生成告警策略。
7.根據權利要求6所述的一種基于多云構建監控告警系統,其特征在于:所述告警信息的數據反饋至監控系統,通過監控系統實現對產生預警模塊的定位,并通過策略系統調取產生預警模塊的歷史數據。
8.根據權利要求5所述的一種基于多云構建監控告警系統,其特征在于:所述策略系統內還設置有策略運行測試模塊。
9.一種計算機可讀存儲介質,所述存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至4中任一項所述的方法。
10.一種計算機程序產品,包括計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至4中任一項所述的方法。