
本發明涉及信息處理領域,尤其涉及一種故障監控方法及監控裝置。
背景技術:
:網絡監控平臺是一個開源的網絡監控框架,它可以通過一系列直觀的方式監控網絡的健康狀況,因此,網絡監控平臺對于維護網絡的正常運行發揮著十分重要的作用。然而,常常會由于各種各樣的原因造成網絡監控平臺運行停止。相關技術中,管理員需要實時關注網絡監控平臺的運行情況,并且當發現網絡監控平臺運行停止時,需要手動獲取網絡監控平臺的日志文件,然后根據日志文件查找導致網絡監控平臺運行停止的故障,進而進行處理,因此操作過程相當繁瑣,并且十分耗費人力成本。技術實現要素:為了解決上述技術問題,本發明提供一種故障監控方法及監控裝置,能夠簡單、快捷地實現對網絡監控平臺運行情況的監控以及對網絡監控平臺故障的處理。為了達到本發明目的,本發明提供了一種故障監控方法,包括:監控網絡監控平臺的運行情況;當監控到所述網絡監控平臺停止運行時,獲取所述網絡監控平臺的日志文件;根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障;其中,所述故障信息庫存儲有針對所述導致網絡監控平臺停止運行的故障的處理方法。所述監控網絡監控平臺的運行情況之前,還包括:創建所述網絡監控平臺的守護進程;相應的,所述監控網絡監控平臺的運行情況,包括:通過所述守護進程監控網絡監控平臺的運行情況;所述當監控到網絡監控平臺停止運行時,獲取所述網絡監控平臺的日志文件,包括:當監控到所述網絡監控平臺停止運行時,通過所述守護進程獲取所述網絡監控平臺的日志文件;所述根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障,包括:通過所述守護進程根據獲得的日志文件和所述故障信息庫處理所述導致網絡監控平臺停止運行的故障。所述監控網絡監控平臺的運行情況,包括:定時獲取所述網絡監控平臺的性能數據;根據所述網絡監控平臺的性能數據確定所述網絡監控平臺的運行情況。所述當監控到網絡監控平臺停止運行時,獲取網絡監控平臺的日志文件,包括:當監控到所述網絡監控平臺停止運行時,執行所述網絡監控平臺的重啟命令;若所述網絡監控平臺重啟失敗,獲取所述網絡監控平臺的日志文件。所述根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障之后,還包括:執行所述網絡監控平臺的重啟命令;若所述網絡監控平臺重啟成功,確定導致所述網絡監控平臺停止運行的故障被成功處理;若所述網絡監控平臺重啟失敗,獲取所述網絡監控平臺的日志文件;根據所述日志文件和故障信息庫處理導致所述網絡監控平臺停止運行的故障,直到所述網絡監控平臺重啟成功。所述根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障,包括:在所述日志文件中獲取包含預設關鍵字的信息;根據所述包含預設關鍵字的信息確定導致所述網絡監控平臺停止運行的故障;在所述故障信息庫中獲取處理導致所述網絡監控平臺停止運行的故障的目標處理方法;采用所述目標處理方法處理故障。本發明還提供了一種故障監控裝置,包括:監控模塊,用于監控網絡監控平臺的運行情況;獲取模塊,用于當監控到所述網絡監控平臺停止運行時,獲取所述網絡監控平臺的日志文件;處理模塊,用于根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障;其中,所述故障信息庫存儲有針對所述導致網絡監控平臺停止運行的故障的處理方法。還包括:創建模塊,用于創建所述網絡監控平臺的守護進程;所述監控模塊,具體用于通過所述守護進程監控網絡監控平臺的運行情況;所述獲取模塊,具體用于當監控到所述網絡監控平臺停止運行時,通過所述守護進程獲取所述網絡監控平臺的日志文件;所述處理模塊,具體用于通過所述守護根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障。還包括:執行模塊,用于執行所述網絡監控平臺的重啟命令;確定模塊,用于若所述網絡監控平臺重啟成功,確定導致所述網絡監控平臺停止運行的故障被成功處理;獲取模塊,還用于若所述網絡監控平臺重啟失敗,獲取所述網絡監控平臺的日志文件;處理模塊,還用于根據所述日志文件和故障信息庫處理導致所述網絡監控平臺停止運行的故障,直到所述網絡監控平臺重啟成功。所述處理模塊包括:獲取單元,用于在所述日志文件中獲取包含預設關鍵字的信息;確定單元,用于根據所述包含預設關鍵字的信息確定導致所述網絡監控平臺停止運行的故障;所述獲取單元,還用于在所述故障信息庫中獲取處理導致所述網絡監控平臺停止運行的故障的目標處理方法;處理單元,用于采用所述目標處理方法處理故障。與現有技術相比,本發明至少包括監控網絡監控平臺的運行情況;當監控到網絡監控平臺停止運行時,獲取網絡監控平臺的日志文件;根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障;其中,故障信息庫存儲有針對導致網絡監控平臺停止運行的故障的處理方法。從本發明提供的技術方案可見,由于對網絡監控平臺的運行情況實現了自動監控,并且在監控到網絡監控平臺停止運行時,自動獲取網絡平臺的日志文件并根據日志文件和預設故障信息庫處理故障,從而無需耗費人力成本,簡單、快捷地實現了對網絡監控平臺運行情況的監控以及對網絡監控平臺故障的處理。本發明的其它特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發明而了解。本發明的目的和其他優點可通過在說明書、權利要求書以及附圖中所特別指出的結構來實現和獲得。附圖說明附圖用來提供對本發明技術方案的進一步理解,并且構成說明書的一部分,與本申請的實施例一起用于解釋本發明的技術方案,并不構成對本發明技術方案的限制。圖1為本發明實施例提供的一種故障監控方法的流程示意圖;圖2為本發明實施例提供的另一種故障監控方法的流程示意圖;圖3為本發明實施例提供的又一種故障監控方法的流程示意圖;圖4為本發明實施例提供的一種故障監控裝置的結構示意圖;圖5為本發明實施例提供的另一種故障監控裝置的結構示意圖;圖6為本發明實施例提供的又一種故障監控裝置的結構示意圖。具體實施方式為使本發明的目的、技術方案和優點更加清楚明白,下文中將結合附圖對本發明的實施例進行詳細說明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。本發明實施例提供一種故障監控方法,如圖1所示,該方法包括:步驟101、監控網絡監控平臺的運行情況。具體的,網絡監控平臺可以是shinken。步驟102、當監控到網絡監控平臺停止運行時,獲取網絡監控平臺的日志文件。需要說明的是,網絡監控平臺的日志文件是網絡監控平臺產生的日志文件,記載著網絡監控平臺所有的處理記錄。步驟103、根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障。其中,故障信息庫存儲有針對導致網絡監控平臺停止運行的故障的處理方法。本發明實施例所提供的故障監控方法,監控網絡監控平臺的運行情況;當監控到網絡監控平臺停止運行時,獲取網絡監控平臺的日志文件;根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障;其中,故障信息庫存儲有針對導致網絡監控平臺停止運行的故障的處理方法。從本發明提供的技術方案可見,由于對網絡監控平臺的運行情況實現了自動監控,并且在監控到網絡監控平臺停止運行時,自動獲取網絡平臺的日志文件并根據日志文件和預設故障信息庫處理故障,從而無需耗費人力成本,簡單、快捷地實現了對網絡監控平臺運行情況的監控以及對網絡監控平臺故障的處理。本發明實施例提供另一種故障監控方法,如圖2所示,該方法包括:步驟201、創建網絡監控平臺的守護進程。具體的,守護進程daemon是一種運行在后臺的一種特殊的進程,它獨立于控制終端并且周期性的執行某種任務或等待處理某些發生的事件。由于在操作系統linux中,每個系統與用戶進行交流的界面成為終端,每一個從此終端開始運行的進程都會依附于這個終端,這個終端被稱為這些進程的控制終端,當控制終端被關閉的時候,相應的進程都會自動關閉。但是守護進程卻能突破這種限制,脫離于終端在后臺運行并且不被任何其他進程所打斷。它從被執行的時候開始運轉,直到整個系統關閉才退出。步驟202、通過守護進程監控網絡監控平臺的運行情況。具體的,可以通過守護進程執行命令/etc/init.d/shinkenstatus來監控網絡平臺的運行情況。步驟203、當監控到網絡監控平臺停止運行時,通過守護進程獲取網絡監控平臺的日志文件。步驟204、通過守護進程根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障。其中,故障信息庫存儲有針對導致網絡監控平臺停止運行的故障的處理方法。需要說明的是,本發明實施例提供的故障監控方法與圖1對應的實施例提供的故障監控方法的區別在于,本發明實施例提供的故障監控方法是圖1對應的實施例提供的故障監控方法的一種具體實現方式,本發明實施例提供的故障監控方法首先創建一個守護進程,以通過守護進程進行圖1對應的實施例提供的故障監控方法的所有步驟。本發明實施例所提供的故障監控方法,創建網絡監控平臺的守護進程;通過守護進程監控網絡監控平臺的運行情況;當監控到網絡監控平臺停止運行時,通過守護進程獲取網絡監控平臺的日志文件;通過守護進程根據日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障;其中,故障信息庫存儲有針對導致網絡監控平臺停止運行的故障的處理方法。從本發明提供的技術方案可見,由于創建了守護進程,進而控制守護進程就可以實現對網絡平臺的運行情況進行監控,并且在所控制的守護進程監控到網絡監控平臺停止運行時,控制守護進程就可以獲取網絡平臺的日志文件并根據日志文件和故障信息庫處理故障,從而無需耗費人力成本,簡單、快捷地實現了對網絡監控平臺運行情況的監控以及對網絡監控平臺故障的處理。本發明實施例提供又一種故障監控方法,如圖3所示,該方法包括:步驟301、定時獲取網絡監控平臺的性能數據。步驟302、根據網絡監控平臺的性能數據確定網絡監控平臺的運行情況。需要說明的是,定時獲取網絡監控平臺的性能數據、根據所獲取的性能數據進行分析以確定網絡監控平臺的運行情況。其中,網絡監控平臺的運行情況包括運行正常和運行停止兩種情況。步驟303、當網絡監控平臺停止運行時,執行網絡監控平臺的重啟命令。具體的,重啟命令可以是/etc/init.d/shinkenrestart。需要說明的是,網絡監控平臺可能存在偶然異常導致的停止運行情況,這種情況不屬于故障,因此需要執行網絡監控平臺的重啟命令以排除這種情況導致的網絡監控平臺停止運行。步驟304、若網絡監控平臺重啟失敗,獲取網絡監控平臺的日志文件。需要說明的是,若網絡監控平臺重啟成功,則說明網絡監控平臺的停止運行是因為偶然異常導致的,網絡監控平臺的成功重啟已經處理了偶然異常,因此不再執行其他任何操作,結束整個流程。步驟305、在日志文件中獲取包含預設關鍵字的信息。具體的,預設關鍵字是用來分析導致網絡監控平臺停止運行的故障的關鍵信息,他可以是“error”或“errorlog”或“configerror”等關鍵詞語。步驟306、根據包含預設關鍵字的信息確定導致網絡監控平臺停止運行的故障。具體的,由于日志文件中記錄的是一條一條的運行信息,而每條運行信息都清楚地表明了所運行的項目以及所運行的項目是否正常,因此獲取了包含預設關鍵字的信息,就能直接從信息中確定導致網絡監控平臺停止運行的故障。步驟307、在故障信息庫中獲取處理導致網絡監控平臺停止運行的故障的目標處理方法。其中,故障信息庫存儲有針對導致網絡監控平臺停止運行的故障的處理方法。具體的,導致網絡監控平臺停止運行的故障可以包括配置文件中參數錯誤、配置文件錯誤以及配置文件命令錯誤等。針對因配置文件中參數錯誤導致的網絡監控平臺停止運行的故障,處理方法可以是恢復默認參數;針對因配置文件錯誤導致的網絡監控平臺停止運行的故障,處理方法可以是刪除配置文件;針對因配置文件命令錯誤導致的網絡監控平臺停止運行的故障,處理方法可以是刪除配置文件命令,因此故障信息庫的建立可以如下表1所示,表1導致網絡監控平臺停止運行的故障對應的處理方法配置文件中參數錯誤恢復默認參數配置文件錯誤刪除配置文件配置文件命令錯誤刪除配置文件命令確定了導致網絡監控平臺停止運行的故障,就可以根據表1確定目標處理方法,即如果導致網絡監控平臺停止運行的故障是配置文件中參數錯誤,那么目標處理方法就是恢復默認參數;如果導致網絡監控平臺停止運行的故障是配置文件錯誤,那么目標處理方法就是刪除配置文件;如果導致網絡監控平臺停止運行的故障是配置文件命令錯誤,那么目標處理方法就是刪除配置文件命令。步驟308、采用目標處理方法處理故障。步驟309、執行網絡監控平臺的重啟命令。需要說明的是,采用目標處理方法處理故障后需要執行網絡監控平臺的重啟命令以查看故障是否已經處理,網絡監控平臺是否能夠重新運行。步驟310、若網絡監控平臺重啟成功,確定導致網絡監控平臺停止運行的故障被成功處理。步驟311、若網絡監控平臺重啟失敗,獲取網絡監控平臺的日志文件。需要說明的是,由于網絡監控平臺重啟失敗,會產生新的日志文件,因此需要再次獲取網絡監控平臺的日志文件以進行分析。步驟312、根據日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障,直到網絡監控平臺重啟成功。需要說明的是,再次根據日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障的具體過程如步驟305~308所示,直到網絡監控平臺重啟成功。還需要說明的是,還可以創建守護進程,以通過守護進程完成步驟301~312。本發明實施例所提供的故障監控方法,監控網絡監控平臺的運行情況;當監控到網絡監控平臺停止運行時,獲取網絡監控平臺的日志文件;根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障;其中,故障信息庫存儲有針對導致網絡監控平臺停止運行的故障的處理方法。從本發明提供的技術方案可見,由于對網絡監控平臺的運行情況實現了自動監控,并且在監控到網絡監控平臺停止運行時,自動獲取網絡平臺的日志文件并根據日志文件和預設故障信息庫處理故障,從而無需耗費人力成本,簡單、快捷地實現了對網絡監控平臺運行情況的監控以及對網絡監控平臺故障的處理。本發明實施例提供一種故障監控裝置,如圖4所示,該故障監控裝置4包括:監控模塊41,用于監控網絡監控平臺的運行情況。獲取模塊42,用于當監控到網絡監控平臺停止運行時,獲取網絡監控平臺的日志文件。處理模塊43,用于根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障;其中,故障信息庫存儲有針對導致網絡監控平臺停止運行的故障的處理方法。進一步,在圖4對應的實施例的基礎上,本發明實施例提供另一種故障監控裝置,如圖5所示,該故障監控裝置4還包括:創建模塊44,用于創建網絡監控平臺的守護進程。監控模塊41,具體用于通過守護進程監控網絡監控平臺的運行情況。獲取模塊42,具體用于當監控到網絡監控平臺停止運行時,通過守護進程獲取網絡監控平臺的日志文件。處理模塊43,具體用于通過守護根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障。進一步,在圖4對應的實施例的基礎上,本發明實施例提供又一種故障監控裝置,如圖6所示,監控模塊41具體用于:定時獲取網絡監控平臺的性能數據;根據網絡監控平臺的性能數據確定網絡監控平臺的運行情況。獲取模塊42具體用于:當監控到網絡監控平臺停止運行時,執行網絡監控平臺的重啟命令;若網絡監控平臺重啟失敗,獲取網絡監控平臺的日志文件。該故障監控裝置4還包括:執行模塊45,用于執行網絡監控平臺的重啟命令。確定模塊46,用于若網絡監控平臺重啟成功,確定導致網絡監控平臺停止運行的故障被成功處理。獲取模塊42,還用于若網絡監控平臺重啟失敗,獲取網絡監控平臺的日志文件。處理模塊43,還用于根據日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障,直到網絡監控平臺重啟成功。處理模塊43包括:獲取單元431,用于在日志文件中獲取包含預設關鍵字的信息。確定單元432,用于根據包含預設關鍵字的信息確定導致網絡監控平臺停止運行的故障。獲取單元431,還用于在故障信息庫中獲取處理導致網絡監控平臺停止運行的故障的目標處理方法。處理單元433,用于采用目標處理方法處理故障。本發明實施例所提供的故障監控裝置,監控網絡監控平臺的運行情況;當監控到網絡監控平臺停止運行時,獲取網絡監控平臺的日志文件;根據獲得的日志文件和故障信息庫處理導致網絡監控平臺停止運行的故障;其中,故障信息庫存儲有針對導致網絡監控平臺停止運行的故障的處理方法。從本發明提供的技術方案可見,由于對網絡監控平臺的運行情況實現了自動監控,并且在監控到網絡監控平臺停止運行時,自動獲取網絡平臺的日志文件并根據日志文件和預設故障信息庫處理故障,從而無需耗費人力成本,簡單、快捷地實現了對網絡監控平臺運行情況的監控以及對網絡監控平臺故障的處理。在實際應用中,所述監控模塊41、獲取模塊42、處理模塊43、獲取單元431、確定單元432、處理單元433、創建模塊44、執行模塊45、確定模塊46均可由位于故障監控裝置中的中央處理器(centralprocessingunit,cpu)、微處理器(microprocessorunit,mpu)、數字信號處理器(digitalsignalprocessor,dsp)或現場可編程門陣列(fieldprogrammablegatearray,fpga)等實現。雖然本發明所揭露的實施方式如上,但所述的內容僅為便于理解本發明而采用的實施方式,并非用以限定本發明。任何本發明所屬領域內的技術人員,在不脫離本發明所揭露的精神和范圍的前提下,可以在實施的形式及細節上進行任何的修改與變化,但本發明的專利保護范圍,仍須以所附的權利要求書所界定的范圍為準。當前第1頁12