麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種分布式系統無效節點判定方法與流程

文檔序號:11147591閱讀:874來源:國知局
一種分布式系統無效節點判定方法與制造工藝

本發明涉及一種分布式系統無效節點判定方法。



背景技術:

分布式系統(Distributed System)有很多不同的定義,一般認為:“一個分布式系統是一些獨立的計算機集合,但是對這個系統的用戶來說,系統就像一臺計算機一樣”。這個定義有兩方面的含義:第一,從硬件角度來講,每臺計算機都是自主的;第二,從軟件角度來講,用戶將整個系統看做是一臺計算機。這兩者都是必需的,缺一不可。在一個分布式系統中,一組獨立的計算機節點展現給用戶的是一個統一的整體,系統擁有多種通用的物理和邏輯資源,可以動態地分配任務,分散的物理和邏輯資源通過計算機網絡實現信息交換。主頻可達到GHZ的功能強大的微處理器的開發和高速計算機網絡的出現是分布式系統的產生的基礎。

分布式系統通常由一個管理節點與多個工作節點組成,節點管理是分布式系統系統管理的核心功能之一。管理節點的系統管理進程實時對工作節點的狀態進行監督,判斷工作節點能否正常工作,將其加入或排除出系統。由于節點自身運行狀態和網絡傳輸的可靠性等問題(例如報文只能單向傳輸),異常的工作節點給系統帶來眾多不確定性問題,如數據不一致、返回超時等,快速準確的節點管理策略已成為系統管理的難點問題。



技術實現要素:

本發明的目的,在于提供一種分布式系統無效節點判定方法,其可達到更加精準判定節點狀態的目標。

為了達成上述目的,本發明的解決方案是:

一種分布式系統無效節點判定方法,包括如下內容:

(1)各節點的進程啟動時在網絡中間件中注冊信息,退出時清理注冊信息,網絡中間件之間實時同步本節點的進程狀態信息;

(2)各節點的系統管理進程定時發送系統管理平安報文,由管理節點的系統管理進程接收并進行節點狀態更新;

(3)管理節點的系統管理進程對工作節點依次進行狀態檢測,判定節點是否正常工作,對于無法正常工作的節點進行退出處理。

上述內容(1)中,當節點退出時,主動注銷或被動由網絡中間件清理注冊信息。

上述內容(1)中,網絡中間件之間通過網絡平安報文實時同步本節點的進程狀態信息,并為上層系統管理模塊提供查詢接口。

上述網絡平安報文包括整體平安報文和變化平安報文,整體平安報文周期性發送,記錄了本節點的所有注冊引用進程信息;變化平安報文在本節點注冊應用程序變化的時候發送。

上述內容(2)中,當系統管理平安報文出現超時,管理節點的系統管理進程向目標節點的系統管理進程主動請求應答,進行進一步確認。

上述內容(3)的詳細內容是:管理節點的系統管理程序通過網絡中間件訪問接口檢查對方節點管理進程是否在線:如不在線,再對節點的投運狀態進行判斷,對于未投運的節點直接判斷該節點為故障,做節點退出處理;對于投運的節點進行進一步故障計數,超過閾值判斷節點故障,做節點退出處理;如在線,則驗證系統管理平安報文是否超時,如超時則請求對方發送系統管理平安報文,若在更長一些的時間段內仍然還收不到,則判斷該節點為故障,做節點退出處理;如不超時說明一切正常,將故障計數清零。

采用上述方案后,本發明采用基于網絡中間件同步信息和系統管理通訊狀態的綜合判定方法,管理節點的系統管理進程定期對工作節點的狀態進行維護,通過綜合網絡中間件同步的進程狀態信息與管理進程間通訊狀態信息,判定節點是否正常工作,使得管理節點可以準確判斷工作節點是否處于正常工作狀態,及時將異常節點退出系統操作,達到保證系統可靠性與可用性的效果。

附圖說明

圖1是本發明中分布式系統的層次結構圖;

圖2是本發明網絡中間件間信息同步示意圖;

圖3是本發明工作節點狀態維護流程圖。

具體實施方式

以下將結合附圖,對本發明的技術方案及有益效果進行詳細說明。

首先,對本發明涉及的分布式系統的架構進行說明,如圖1所示,自底向上依次是網絡層、應用層和系統管理層。其中,網絡層屏蔽操作系統差異,對上統一提供網絡服務;應用層負責處理具體的應用事務;系統管理層利用網絡層對應用服務、網絡節點等進行管理。

本發明提供一種分布式系統無效節點判定方法,包括網絡中間件間的信息同步技術,系統管理平安報文和探測技術,以及基于這兩項技術的工作節點狀態判定策略,下面分別介紹。

第一,網絡中間件進程注冊信息同步功能

節點內部應用進程啟動時需要在網絡中間件中注冊進程信息,退出時主動注銷或被動由網絡中間件清理注冊信息。網絡中間件之間實時同步本節點的進程狀態信息,并為上層系統管理模塊提供查詢接口,系統管理模塊可以實時獲得系統內任意節點及進程的當前狀態。如圖2所示,網絡中間件之間通過平安報文維持各節點中的注冊應用進程信息的同步,網絡平安報文包括整體平安報文和變化平安報文。

整體平安報文周期性發送,記錄了本節點的所有注冊引用進程信息。發送整體平安報文的目的是為了讓新加入的節點能很快知道本節點的注冊應用進程信息,同時不至于因為丟包而使各個節點上保存的注冊應用信息不一致。定時發送的報文都是整體平安報文。

變化平安報文在本節點注冊應用程序變化的時候發送。注冊應用進程變化是指本節點有新的應用程序注冊、本節點有應用進程注銷、本節點有應用進程的事件訂閱信息發生了變化。

通過平安報文維持各節點中的注冊應用進程信息的同步的內容包括:節點狀態信息、應用進程信息以及注冊事件信息,如下所示:

1)節點信息包括:現場名、節點名、節點IP、節點組號、節點狀態、鏈路連接信息等。

2)應用進程信息包括:進程編號、進程注冊信息(現場名、節點名、進程注冊名);

3)注冊事件信息包括:事件數量、注冊事件號、事件屏蔽碼等。

第二,系統管理平安報文及探測機制

分布式系統內各節點的系統管理進程定時發送系統管理平安報文(可設定為約30秒發送一次),系統管理平安報文由管理節點的系統管理進程接收并進行節點狀態更新,用于維護系統管理間通訊狀態。系統管理平安報文用于報告當前節點系統管理進程狀態,內容包括:報文進程類型標識、報文類型以及時標等。

當系統管理平安報文出現超時,通過主動請求應答的探測技術對目標節點系統管理工作狀態進行進一步確認。

第三,工作節點狀態判定策略

管理節點的系統管理進程對工作節點依次進行狀態檢測,如圖3所示,具體流程如下所示:

管理節點的系統管理程序通過網絡中間件訪問接口檢查對方節點管理進程是否在線:

1)不在線,說明當前已無法通過網絡中間件訪問到目標節點,為了避免網絡抖動造成誤判,還對節點的投運狀態進行判斷:

a)未投運,說明節點前狀態已經是離線,直接判斷該節點為故障,做節點退出處理;

b)已投運,說明節點在稍早前的一段時間內還是處于正常運行的狀態,為了避免網絡抖動造成誤判,在此增加故障計數驗證,當前故障計數加1,且如果計數超過閾值判斷節點故障,做節點退出處理。

2)在線,說明可以通過網絡中間件訪問到目標節點,但為了避免網絡單向傳輸或不穩定的故障,還需要進一步驗證系統管理平安報文的狀態,驗證目標節點系統管理平安報文是否超時:

a)超時,請求對方發送平安報文,若在更長一些的時間段內仍然還收不到,則判斷該節點為故障,做節點退出處理;

b)不超時,說明一切正常,將故障計數清零。

以上實施例僅為說明本發明的技術思想,不能以此限定本發明的保護范圍,凡是按照本發明提出的技術思想,在技術方案基礎上所做的任何改動,均落入本發明保護范圍之內。

當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 青神县| 崇州市| 新安县| 新邵县| 阜城县| 东明县| 商丘市| 崇左市| 甘泉县| 皮山县| 根河市| 吉安县| 简阳市| 刚察县| 洛宁县| 郸城县| 彩票| 麦盖提县| 宁南县| 益阳市| 运城市| 高唐县| 白朗县| 鸡西市| 呼图壁县| 靖州| 仙桃市| 紫阳县| 沈阳市| 那坡县| 无极县| 车险| 和静县| 扎赉特旗| 监利县| 青田县| 泸州市| 南充市| 咸宁市| 新安县| 新巴尔虎右旗|