本申請涉及監控運維,尤其涉及一種基于人工智能模型的監控運維系統、方法、設備及介質。
背景技術:
1、在監控運維系統中,一個技術困擾在于:(1)針對告警嵌套風暴的實時有效識別攔截;(2)并自動觸發運維流程對相應的根因問題進行及時有效地處理。在傳統的運維監控系統中,監控系統負責實時??睾A康南到y資源指標情況,其中包括針對任何異常情況發出警報。運維系統負責針對被監控的各類維度資源進行手動或自動化運維。所以針對同一批被監控資源的監控、運維兩個系統存在分離,需要運維人員人眼檢查以及手動操作觸發對應的告警查看、運維腳本觸發等功能。同時,被監控的資源指標存在因彼此嵌套而產生告警風暴的問題,需要智能化進行根因識別和冗余衍生告警攔截。還有,針對已經被篩查出來的根因告警,需要能夠實時處理(即觸發運維系統腳本解決問題)。否則,問題不及時處理可能會造成監控運行異常,還可能影響業務。
2、針對諸如以上問題,傳統問題可能大多只是處理單個問題、或者處理一個問題的局部現象。比如,針對告警風暴,已有方法如,手動指定、告警去重、告警分級、告警壓縮屬于靜態指定固定的規則,雖然在一定程度上能減少重復冗余告警,無法識別并處理抑制關聯嵌套的情況。假設即便能夠成功篩查井噴告警風暴根因,也可能因為系統運行分離而無法及時自動觸發運維系統的對應資源腳本。所以,現有技術的主要問題在于不能形成針對“告警風暴”進行及時“攔截+根因識別+自動處理”的智能化閉環,導致告警抑制難以及時處理。
技術實現思路
1、本申請實施例的目的在于提出一種基于人工智能模型的監控運維系統、方法、設備及介質,以實現告警抑制的閉環處理,提高告警抑制的及時性。
2、為了解決上述技術問題,本申請實施例提供一種基于人工智能模型的監控運維系統,包括:
3、數據抽取模塊,用于從數據庫中實時抽取告警信息;
4、告警預測模塊,用于通過目標告警抑制預測模型基于所述告警信息進行告警抑制預測處理,得到抑制預測結果;
5、分析報告生成模塊,用于基于所述抑制預測結果進行告警抑制處理,得到抑制結果,并根據抑制結果生成告警抑制分析報告;
6、知識圖譜調取模塊,用于抽取所述告警抑制分析報告中的告警處理信息,并根據所述告警處理信息調用運維系統知識圖譜,得到目標處理腳本。
7、為了解決上述技術問題,本申請實施例提供一種基于人工智能模型的監控運維方法,包括:
8、從數據庫中實時抽取告警信息;
9、通過目標告警抑制預測模型基于所述告警信息進行告警抑制預測處理,得到抑制預測結果;
10、基于所述抑制預測結果進行告警抑制處理,得到抑制結果,并根據抑制結果生成告警抑制分析報告;
11、抽取所述告警抑制分析報告中的告警處理信息,并根據所述告警處理信息調用運維系統知識圖譜,得到目標處理腳本。
12、本發明實施例提供了一種基于人工智能模型的監控運維系統、方法、設備及介質。其中,系統包括:數據抽取模塊,用于從數據庫中實時抽取告警信息;告警預測模塊,用于通過目標告警抑制預測模型基于所述告警信息進行告警抑制預測處理,得到抑制預測結果;分析報告生成模塊,用于基于所述抑制預測結果進行告警抑制處理,得到抑制結果,并根據抑制結果生成告警抑制分析報告;知識圖譜調取模塊,用于抽取所述告警抑制分析報告中的告警處理信息,并根據所述告警處理信息調用運維系統知識圖譜,得到目標處理腳本。本發明實施例通過數據抽取模塊能夠實時抽取告警信息,然后通過告警預測模塊實現對告警信息的及時預測處理,接著通過分析報告生成模塊對抑制預測結果實時生成告警抑制分析報告,最后通過知識圖譜調取模塊對告警抑制分析報告生成目標處理告警,從而對告警的處理,進而實現告警抑制的閉環處理,有利于提高告警抑制的及時性。
1.一種基于人工智能模型的監控運維系統,其特征在于,包括:
2.根據權利要求1所述的基于人工智能模型的監控運維系統,其特征在于,所述目標告警抑制預測模型包括第一告警抑制預測模型和第二告警抑制預測模型;所述告警預測模塊包括:
3.根據權利要求2所述的基于人工智能模型的監控運維系統,其特征在于,所述告警預測結果生成單元包括:
4.根據權利要求1所述的基于人工智能模型的監控運維系統,其特征在于,所述分析報告生成模塊包括:
5.根據權利要求4所述的基于人工智能模型的監控運維系統,其特征在于,所述知識圖譜調取模塊包括:
6.根據權利要求1至5任一項所述的基于人工智能模型的監控運維系統,其特征在于,所述數據抽取模塊包括:
7.一種基于人工智能模型的監控運維方法,其特征在于,包括:
8.根據權利要求7所述的基于人工智能模型的監控運維方法,其特征在于,所述目標告警抑制預測模型包括第一告警抑制預測模型和第二告警抑制預測模型;所述通過目標告警抑制預測模型基于所述告警信息進行告警抑制預測處理,得到抑制預測結果,包括:
9.一種計算機設備,其特征在于,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器執行所述計算機程序時實現如權利要求7至8中任一項所述的基于人工智能模型的監控運維方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求7至8中任一項所述的基于人工智能模型的監控運維方法。