麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

網管系統中進程的恢復方法及裝置與流程

文檔序號:12363349閱讀:236來源:國知局
網管系統中進程的恢復方法及裝置與流程

本發明涉及通信領域,具體而言,涉及一種網管系統中進程的恢復方法及裝置。



背景技術:

隨著網管系統越來越龐大,功能越來越多,管理的設備種類和數量也越來越多,進而出現了需要多個進程協作管理的需求,比如一個網絡管理器(Manager)進程協同多個子網管理器(Subnet Manager)進程工作,每個子網管理器管理若干的網元,網絡管理器負責把消息轉發到子網管理器以及收集來自每個子網管理器的消息匯總上報。工程中經常出現一些故障,比如某個子網管理器出現故障進程退出了,或者進程資源耗盡不能正常工作了,需要有一個管理機制來重啟發生故障的進程來確保整個網管系統的正常工作。

目前的一般做法是加一個后臺監控程序,輪詢每一個網管進程的狀態,如果發現某個進程不在了,那么就重新啟動這個進程對應的可執行程序。但是這種方法只能解決進程異常退出的情景。實際工程中,某個進程可能會出現異常而不退出的情況,比如,進程存在內存泄露,一段時間后無法從系統成功申請新的內存;或者進程使用完畢后沒有關閉一些系統資源,比如網絡套接字,文件句柄,注冊表訪問句柄等,導致這些系統資源的再次申請失敗。這些因系統資源申請而沒有正確釋放造成的后果是累積性的,在一段時間內不影響整個系統的正常工作,但是隨著進程工作時間的增加,系統的負擔也會逐漸加重,直到不能正常工作。而這些問題的定位往往比較困難,在定位前需要有一個應急的方法。

針對相關技術中系統資源申請沒有得到釋放造成的網管系統故障的問題,目前尚未提出有效的解決方案。



技術實現要素:

本發明提供了一種網管系統中進程的恢復方法及裝置,以至少解決相關技術中系統資源申請沒有得到釋放造成的網管系統故障的問題。

根據本發明的一個方面,提供了一種網管系統中進程的恢復方法,包括:按照預設時間周期獲取網管系統進程在預設時間周期內的系統資源申請量;判斷網管系統進程的系統資源申請量是否符合預設條件;以及在判定網管系統進程的系統資源申請量符合預設條件時,重新啟動網管系統進程。

進一步地,按照預設時間周期獲取網管系統進程在預設時間周期內的系統資源申請 量包括:按照預設時間周期獲取操作系統進程的系統資源申請量,將操作系統進程的系統資源申請量作為網管系統進程的系統資源申請量,其中,操作系統進程是與網管系統進程對應的。

進一步地,判斷網管系統進程的系統資源申請量是否符合預設條件包括:判斷網管系統進程的系統資源申請量是否達到預設門限;或者判斷預設時間周期內網管系統進程的系統資源申請量的增長量是否達到預設增長量。

進一步地,重新啟動網管系統進程包括:關閉網管系統進程,并加載網管系統進程對應的信息。

進一步地,網管系統進程對應的信息包括:網管系統進程的標識,網管系統進程的可執行文件,網管系統進程的啟動信息以及網管系統進程對應的系統資源門限。

進一步地,重新啟動網管系統進程包括:在與網管系統進程所對應的網管系統的空閑時段重新啟動網管系統進程。

根據本發明的另一方面,提供了一種網管系統中進程的恢復裝置,包括:獲取模塊,用于按照預設時間周期獲取網管系統進程在預設時間周期內的系統資源申請量;判斷模塊,用于判斷網管系統進程的系統資源申請量是否符合預設條件;以及重啟模塊,用于在判定網管系統進程的系統資源申請量符合預設條件時,重新啟動網管系統進程。

進一步地,獲取模塊包括:第一獲取子模塊,用于按照預設時間周期獲取操作系統進程的系統資源申請量,將操作系統進程的系統資源申請量作為網管系統進程的系統資源申請量,其中,操作系統進程是與網管系統進程對應的。

進一步地,網管系統中進程的恢復裝置還包括:更新模塊,用于更新與網管系統進程對應的操作系統進程的標識,并建立網管系統進程與標識的對應關系。

通過本發明,采用實時監測網管系統進程的系統資源申請量的方式,能夠及時發現當前占用過多系統資源的網管系統進程,從而找到潛在的異常的網管系統進程。通過將占用系統資源過多的網管系統進程重新啟動,解決了相關技術中系統資源申請沒有得到釋放造成的網管系統故障的問題,進而達到了最大程度的保證網管系統可用性的效果。

附圖說明

此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:

圖1是根據本發明實施例的網管系統中進程的恢復方法的流程圖;

圖2是根據本發明實施例的網管系統結構示意圖;

圖3是根據本發明實施例的網管系統結構布局示意圖;以及

圖4是根據本發明實施例的網管系統中進程的恢復裝置的結構框圖。

具體實施方式

下文中將參考附圖并結合實施例來詳細說明本發明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。

需要說明的是,本發明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區別類似的對象,而不必用于描述特定的順序或先后次序。

在本實施例中提供了一種網管系統中進程的恢復方法,圖1是根據本發明實施例的網管系統中進程的恢復方法的流程圖,如圖1所示,該流程包括如下步驟:

步驟S102,按照預設時間周期獲取網管系統進程在預設時間周期內的系統資源申請量;

步驟S104,判斷網管系統進程的系統資源申請量是否符合預設條件;

步驟S106,在判定網管系統進程的系統資源申請量符合預設條件時,重新啟動網管系統進程。

通過上述步驟,能夠及時地發現網管系統中占用系統資源過多的網管系統進程,從而找到潛在異常的網管系統進程。通過重新啟動占用系統資源過多的網管系統進程,解決了相關技術中系統資源申請沒有得到釋放造成的網管系統故障,達到了降低網管系統故障發生率,提高網管系統可用性的技術效果。

網管系統包括一個網絡管理器和一個或者多個子網管理器,網絡管理器進程協同一個或者多個子網管理器進程工作。圖2是根據本發明實施例的網管系統結構示意圖,如圖2所示,網絡管理器11的進程負責將消息轉發至子網管理器21,22,23,并獲取多個子網管理器的消息進行匯總上報。子網管理器21,22,23的進程分別負責管理各自子網內的網元。下面以圖2中所示的網管系統具體說明該實施例的網管系統中進程的恢復方法,需要說明的是,本發明實施例中的網管系統中進程的恢復方法并不僅限于圖2中所示的網管系統,對于其他結構的網管系統,本發明實施例的網管系統中進程的恢復方法同樣適用。

可選地,本發明預先創建網管系統的監測模塊,該監測模塊可以用于執行上述步驟S102至步驟S106。圖3是根據本發明實施例的網管系統結構布局示意圖,如圖3所示,該監測模塊31用于實時監測網管系統中的網絡管理器和子網管理器,其中,該監測模塊31中預先配置有網管系統正常工作所需的網管系統進程列表以及網管系統進程列表中每個網管系統進程對應的信息。其中,網管系統中的網管系統進程包括網絡管理器進程110,子網管理器進程210,220,230。

監測模塊31為一個單獨地用于監測網管系統進程的進程,對于不同的網管系統工程組網,需要對監測模塊31配置相應的網管系統進程列表以及網管系統進程列表中每個網管系統進程對應的信息,以保證網管系統的正常工作。可選地,監測模塊31中配置的內容包括:

網管系統進程列表,包括網絡管理器進程110,子網管理器進程210,220,230。

網管系統進程列表中每個網管系統進程對應的信息包括:

網管系統進程的標識,比如網絡管理器進程的標識為110,子網管理器進程的標識分別為210,220,230。

網管系統進程的可執行文件,為重新啟動網管系統進程時加載的可執行程序的文件。通常情況下,不同設備類型的網元對應的子網管理器的可執行程序是不同的。比如,子網管理器21管理網元類型A的網元,使用的可執行程序的文件為A1.exe,子網管理器22和子網管理器23管理網元類型B的網元,使用的可執行程序的文件為B1.exe,網絡管理器11管理所有的子網管理器,包括子網管理器21,子網管理器22和子網管理器23,使用的可執行程序的文件是C1.exe。

網管系統進程的啟動信息,為重新啟動網管系統進程時所需的啟動信息,比如子網ID,網絡監聽端口號等。比如,網絡管理器11不需要額外的啟動信息,而子網管理器21,22,23需要各自的子網ID,假設分別為1201,1202,1203,用于通過子網ID獲取各自管理的網元。

網管系統進程對應的系統資源門限,為網關系統進程允許的系統資源申請量的最大值,比如設置網管系統進程的系統資源門限為500M。該實施例假設只監測系統內存的資源申請量,對于其他的系統資源此處不再介紹,但是,該實施例的網管系統中進程的恢復方法同樣可以適用。

在創建監測模塊31,并配置好網管系統進程列表以及網管系統進程列表中每個網管系統進程對應的信息之后,該監測模塊31開始執行步驟S102至步驟S106:

在執行步驟S102之前,監測模塊31首先建立操作系統進程與網管系統進程的對應表,以便于在執行操作系統進程中對網管系統集成進行監測。其中,操作系統進程為網管系統所在的操作系統中的進程,比如Windiws操作系統。操作系統下包括多個操作系統進程,每個操作系統進程對應有唯一的操作系統進程標識。

可選地,建立操作系統進程與網管系統進程的對應表可以包括以下步驟:

監測模塊31遍歷當前操作系統下的所有操作系統進程:

當找到名稱為C1.exe的進程時,即網絡管理器進程110,記錄此操作系統進程的標識,比如101;

當找到名稱為A1.exe的進程時,即子網管理器進程210,記錄此操作系統進程的標識,比如201;

當找到名稱為B1.exe的進程時,即子網管理器進程220,230,記錄此操作系統進程的標識,比如202,203。

要求每個操作系統進程上報自己的啟動信息,即網管系統進程的啟動信息,分別為網絡管理器11不需要額外的啟動信息,而子網管理器21,22,23需要各自的子網ID,分別為1201,1202,1203。

通過上述步驟,監測模塊31建立了操作系統進程與網管系統進程的對應表,如表1所示,其中,表1為操作系統進程與網管系統進程的對應表。

表1

建立操作系統進程與網管系統進程的對應表,監測模塊31通過定時監測操作系統進程101,201,202,203的系統資源申請量便可以實現對網管系統進程110,210,220,220的系統資源申請量的定時監測。可選地,步驟S102按照預設時間周期獲取網管系統進程在預設時間周期內的系統資源申請量包括:按照預設時間周期獲取操作系統進程的系統資源申請量,將操作系統進程的系統資源申請量作為網管系統進程的系統資源申請量,其中,操作系統進程是與網管系統進程對應的,其對應關系可以如表1所示。

步驟S102中的預設時間周期可以根據實際需求設定,比如1個小時,10分鐘,即每隔1小時或者10分鐘獲取一次網管系統進程在1小時或者10分鐘內的系統資源申請量。網管系統進程在預設時間周期內的系統資源申請量是指在預設時間周期內,該網管系統進程申請的系統資源(比如內存)總量。監測模塊31可以對不同的網管系統進程配置有不同的預設時間周期,也可以對不同系統資源配置有不同的預設時間周期。比如,如果需要獲取網管系統內的其他系統資源,可以采取設定不同的時間周期,比如每2小時采集一次網管系統進程的文件同時打開的數量。獲取操作系統進程的系統資源申請量 一般是通過調用操作系統提供的應用函數接口來實現的,比如Windows操作系統下,獲取系統資源(比如內存)申請量是通過使用操作系統進程ID作為輸入參數,調用進程類應用過程接口函數來實現的。

監測模塊31在執行步驟S102按照預設時間周期獲取網管系統進程在預設時間周期內的系統資源申請量之后,執行步驟S104。步驟S104中的預設條件可以判定網管系統進程的系統資源申請量,也可以判定網管系統進程的系統資源申請量的增長量。可選地,判斷網管系統進程的系統資源申請量是否符合預設條件包括:判斷網管系統進程的系統資源申請量是否達到預設門限;或者判斷預設時間周期內網管系統進程的系統資源申請量的增長量是否達到預設增長量。其中,預設門限和預設增長量可以根據實際需求設定。

通過判斷網管系統進程的系統資源申請量是否達到預設門限,或者通過多次的對比多次網管系統進程的系統資源申請的對比,能夠分析出網管系統進程的系統資源申請量的增長量,從而找到潛在異常的網管系統進程。通過上述兩種方式的判定,有利于提高對網管系統進程的系統資源申請量監測的準確度,進而達到準確分析網管系統故障可能性的技術效果。

在執行步驟S104判斷網管系統進程的系統資源申請量是否符合預設條件之后,在判定在判定網管系統進程的系統資源申請量符合預設條件時,重新啟動網管系統進程,即步驟S106。

當判定網管系統進程的系統資源申請量達到預設門限,或者預設時間周期內網管系統進程的系統資源申請量的增長量達到預設增長量時,重新啟動該網管系統進程。

可選地,重新啟動網管系統進程包括:關閉網管系統進程,并加載網管系統進程對應的信息。網管系統進程對應的信息。由于重新啟動網管系統進程之后對應的操作系統進程的標識與未重新加載網管系統進程之前對應的操作系統進程的標識不同,所以,在重新啟動網管系統進程之后,該實施例還包括:更新與網管系統進程對應的操作系統進程的標識,并重新建立網管系統進程與標識的對應關系。

比如,監測模塊31監測到ID為101的操作系統進程,即網絡管理器進程110的系統資源申請量(申請內存量)為502M,已經超過了預設門限500M,則關閉該ID為101對應的操作系統進程,即網絡管理器進程110,并加載可執行文件C1.exe,由于沒有額外的啟動信息,則可以直接加載。由于加載后的進程ID往往與之前的進程ID 101不同,比如為102,監測模塊31需要更新操作系統進程與網管系統進程的對應表,更新后的操作系統進程與網管系統進程的對應表如表2所示:

表2

再比如,監測模塊31在連續的三個時間周期(時間周期為1小時)監測到進程ID為202的操作系統進程,即子網管理器進程220的系統資源申請量(內存申請量)分別為450M,460M,470M,則可以分析出該子網管理器進程220的內存申請量的每小時的增長量為10M,則3小時之后的系統資源申請量將會超過預設門限(500M)。如果當前時刻網管系統處于空閑時段,比如半夜12:00,則可以關閉該子網管理器進程220,并加載可執行文件B1.exe,加載啟動信息子網ID 1202。同理,由于加載后的進程ID往往與之前的進程ID 202不同,比如為208,監測模塊31需要更新操作系統進程與網管系統進程的對應表,更新后的操作系統進程與網管系統進程的對應表如表3所示:

表3

可選地,在判定網管系統進程的系統資源申請量達到預設門限,或者預設時間周期內網管系統進程的系統資源申請量的增長量達到預設增長量時,可以立即重新啟動網管系統進程,或者,為了保證網管系統正常工作,可以不立即重新啟動網管系統進程,而是在網管系統的空閑時段重新啟動網管系統進程。對于當前預設時間周期內的網管系統進程的系統資源申請量為達到預設門限,但是通過分析其增長量,可以判定其在一段時間后會超過預設門限的情況,采用在網管系統空閑時段重新啟動該網管系統進程,既有利于保證網管系統的正常工作,又能夠及時發現網管系統潛在異常的網管系統進程,達 到了最大程度地保證了網管系統的可用性的效果。

通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到根據上述實施例的方法可借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件,但很多情況下前者是更佳的實施方式。基于這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品存儲在一個存儲介質(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺終端設備(可以是手機,計算機,服務器,或者網絡設備等)執行本發明各個實施例所述的方法。

在本實施例中還提供了一種網管系統中進程的恢復裝置,該裝置用于實現上述實施例及優選實施方式,已經進行過說明的不再贅述。如以下所使用的,術語“模塊”可以實現預定功能的軟件和/或硬件的組合。盡管以下實施例所描述的裝置較佳地以軟件來實現,但是硬件,或者軟件和硬件的組合的實現也是可能并被構想的。

圖4是根據本發明實施例的網管系統中進程的恢復裝置的結構框圖,如圖4所示,該裝置包括:

獲取模塊42,用于按照預設時間周期獲取網管系統進程在預設時間周期內的系統資源申請量;

判斷模塊44,用于判斷網管系統進程的系統資源申請量是否符合預設條件;

重啟模塊46,用于在判定網管系統進程的系統資源申請量符合預設條件時,重新啟動網管系統進程。

可選地,獲取模塊42包括:第一獲取子模塊,用于按照預設時間周期獲取操作系統進程的系統資源申請量,將操作系統進程的系統資源申請量作為網管系統進程的系統資源申請量,其中,操作系統進程是與網管系統進程對應的。

可選地,判斷模塊44包括:第一判斷子模塊,用于判斷網管系統進程的系統資源申請量是否達到預設門限;第二判斷子模塊,用于判斷預設時間周期內網管系統進程的系統資源申請量的增長量是否達到預設增長量。

可選地,重啟模塊46包括:第一重啟子模塊模塊,用于關閉網管系統進程,并加載網管系統進程對應的信息。其中,網管系統進程對應的信息包括:網管系統進程的標識,網管系統進程的可執行文件,網管系統進程的啟動信息以及網管系統進程對應的系統資源門限。

可選地,重啟模塊46還可以包括:第二重啟子模塊,用于在與網管系統進程所對應的網管系統的空閑時段重新啟動網管系統進程。

可選地,該實施例的網管系統中進程的恢復裝置還包括:更新模塊,用于更新與網管系統進程對應的操作系統進程的標識,并建立網管系統進程與標識的對應關系。

該實施例的網管系統中進程的恢復裝置通過獲取模塊42按照預設時間周期獲取網管系統進程在預設時間周期內的系統資源申請量,通過判斷模塊44判斷網管系統進程的系統資源申請量是否符合預設條件,通過重啟模塊46在判定網管系統進程的系統資源申請量符合預設條件時,重新啟動網管系統進程,解決了相關技術中系統資源申請沒有得到釋放造成的網管系統故障,達到了降低網管系統故障發生率,提高網管系統可用性的技術效果。

需要說明的是,上述各個模塊是可以通過軟件或硬件來實現的,對于后者,可以通過以下方式實現,但不限于此:上述模塊均位于同一處理器中;或者,上述模塊分別位于多個處理器中。

本發明的實施例還提供了一種存儲介質。可選地,在本實施例中,上述存儲介質可以被設置為存儲用于執行以下步驟的程序代碼:

S1,按照預設時間周期獲取網管系統進程在預設時間周期內的系統資源申請量;

S2,判斷網管系統進程的系統資源申請量是否符合預設條件;

S3,在判定網管系統進程的系統資源申請量符合預設條件時,重新啟動網管系統進程。

可選地,在本實施例中,上述存儲介質可以包括但不限于:U盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質。

可選地,本實施例中的具體示例可以參考上述實施例及可選實施方式中所描述的示例,本實施例在此不再贅述。

顯然,本領域的技術人員應該明白,上述的本發明的各模塊或各步驟可以用通用的計算裝置來實現,它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網絡上,可選地,它們可以用計算裝置可執行的程序代碼來實現,從而,可以將它們存儲在存儲裝置中由計算裝置來執行,并且在某些情況下,可以以不同于此處的順序執行所示出或描述的步驟,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現。這樣,本發明不限制于任何特定的硬件和軟件結合。

以上所述僅為本發明的優選實施例而已,并不用于限制本發明,對于本領域的技術人員來說,本發明可以有各種更改和變化。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 黔西| 大厂| 揭东县| 和平县| 泗阳县| 巍山| 新营市| 准格尔旗| 高唐县| 辽阳市| 崇左市| 青州市| 深州市| 慈利县| 新巴尔虎右旗| 拉孜县| 饶河县| 普格县| 闻喜县| 花莲县| 海城市| 秭归县| 梁河县| 伊金霍洛旗| 海口市| 巫溪县| 铁力市| 商洛市| 通州区| 泰州市| 中方县| 甘泉县| 新源县| 洪洞县| 泰来县| 宿松县| 星子县| 东兴市| 古蔺县| 阿坝县| 金阳县|