麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

分布式網(wǎng)絡(luò)中的共享保活和故障檢測機制的制作方法

文檔序號:7994890閱讀:291來源:國知局
分布式網(wǎng)絡(luò)中的共享保活和故障檢測機制的制作方法
【專利摘要】本文描述了用于檢測結(jié)構(gòu)化網(wǎng)絡(luò)中失效節(jié)點的節(jié)點、計算機可讀介質(zhì)和方法。該方法包含:向主動組或被動組指配相鄰集合的節(jié)點,其中相鄰集合的節(jié)點連接到當前節(jié)點;命令主動組中的主動節(jié)點向當前節(jié)點發(fā)送保活查詢,其中由當前節(jié)點控制用于從主動節(jié)點向當前節(jié)點發(fā)送保活查詢的定時;命令被動節(jié)點偵聽來自當前節(jié)點的保活查詢,并用保活查詢響應(yīng)向當前節(jié)點答復(fù);將當前節(jié)點配置成用保活查詢響應(yīng)向主動節(jié)點答復(fù);以及基于(i)從被動節(jié)點接收的保活查詢響應(yīng)和(ii)由主動節(jié)點發(fā)送的保活查詢確定失效節(jié)點。當前節(jié)點配置成不向主動節(jié)點發(fā)送保活查詢,并且被動節(jié)點配置成不向當前節(jié)點發(fā)送保活查詢。
【專利說明】分布式網(wǎng)絡(luò)中的共享保活和故障檢測機制

【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明一般涉及與分布式網(wǎng)絡(luò)中的保活和故障檢測機制相關(guān)的系統(tǒng)、軟件和方 法,并且更具體地說,涉及用于有效檢測分布式網(wǎng)絡(luò)中失效節(jié)點的機制和技術(shù)。

【背景技術(shù)】
[0002] 分布式網(wǎng)絡(luò)今天被用在各種上下文中,例如用于文件共享或IP語音。分布式網(wǎng)絡(luò) 包含網(wǎng)格、云、分布式數(shù)據(jù)庫和對等(P2P)系統(tǒng)。它們演示了以靈活方式的分散式和自組織 資源定位和使用的能力。
[0003] 如圖1所示,分布式網(wǎng)絡(luò)100包含與其它節(jié)點互連的高數(shù)量的節(jié)點102 (與常規(guī)客 戶端-服務(wù)器網(wǎng)絡(luò)相比)。為了實現(xiàn)一致性并向節(jié)點提供所設(shè)計的應(yīng)用或服務(wù),通常節(jié)點、 鏈路和/或資源(應(yīng)用或服務(wù))的可用性有必要對其它節(jié)點已知。從而,在此類分布式系 統(tǒng)中,節(jié)點、鏈路和/或資源的可用性當前由一些保活(心跳)機制提供,在這些機制中在 節(jié)點之間定期交換短消息以檢測節(jié)點或鏈路的故障/可用性。
[0004] 換句話說,節(jié)點104向鄰居節(jié)點108發(fā)送保活消息106。如果在節(jié)點104未從節(jié)點 108接收到答復(fù),則節(jié)點104假定節(jié)點108停機(已經(jīng)失效)。這對于網(wǎng)絡(luò)100的每個節(jié)點 102都是正確的,S卩,網(wǎng)絡(luò)的每個節(jié)點都不斷地探測它連接到的其它節(jié)點。重要特性并且也 是在分布式網(wǎng)絡(luò)中使用保活機制的主要原因是:保活機制主動地允許在基礎(chǔ)應(yīng)用或服務(wù)需 要這些節(jié)點和連接之前檢測節(jié)點或連接停止。
[0005] 為了增強節(jié)點和/或服務(wù)的可用性并盡可能快速地檢測故障,需要在現(xiàn)有分布式 網(wǎng)絡(luò)中以高頻率交換保活消息。然而,在強互連的大規(guī)模分布式網(wǎng)絡(luò)中,保活機制引入了節(jié) 點之間的大量信令和通信開銷,并且從而,限制了網(wǎng)絡(luò)的可縮放性。因此,存在對于用于不 斷增大的分布式系統(tǒng)的有效保活和故障檢測機制的需要。
[0006] 現(xiàn)在討論現(xiàn)有機制的幾個限制。在當前分布式網(wǎng)絡(luò)中使用的一個機制是如A. Rowstron 和 P. Druschel 的"Pastry: Scalable, distributed object location and routing for large-scale peer-to-peer systems" (IF IP/ACM Middleware, 2001)和 Mahajan 等人的 "Controlling the Cost of Reliability in P2P Overlays"(Proc. IP TP S2003)所描述的基本保活(BK)機制。在此機制中,通過網(wǎng)絡(luò)從一個節(jié)點104向每個鄰 居節(jié)點108、110、112、114和116發(fā)送保活查詢,并且每個鄰居節(jié)點108、110、112、114和116 向查詢節(jié)點104發(fā)送回保活答復(fù)消息。當保活答復(fù)消息到達時,查詢節(jié)點104知道另一節(jié) 點仍存活并且鏈路在起作用。在兩個方向每k秒定期發(fā)起保活消息傳送,并且k稱為保活 間隔。直接連接到節(jié)點x(104)的節(jié)點(108、110、112、114和116)的集合稱為節(jié)點x的鄰 域集合(N(x))。
[0007] 用BK機制,每個節(jié)點獨立于系統(tǒng)中的所有其它節(jié)點而管理。例如,都連接到第三 節(jié)點108的兩個節(jié)點104和120不共享有關(guān)它們公共節(jié)點108的任何信息,因此保活任務(wù) 必須執(zhí)行兩次,一次由節(jié)點104并且一次由節(jié)點120,以便確定節(jié)點108是存活的。這將導(dǎo) 致兩個保活消息每k秒從節(jié)點104和120到達節(jié)點108。當然,節(jié)點108可連接到也發(fā)送保 活消息的其它節(jié)點,從而進一步增大由節(jié)點108接收的消息量。
[0008] 雖然BK機制直觀并且容易實現(xiàn),但系統(tǒng)大小或互連程度的增大引入了大量傳統(tǒng) 保活信令業(yè)務(wù),這使分布式系統(tǒng)的性能降級。
[0009] 為了解決基本保活機制的這個限制,Dedinski等人("Cooperative Keep-Alives: An Efficient Outage Detection Algorithm for P2P Overlay Networks, 〃 Peer-to-Peer Computing, 2007)已經(jīng)提出了合作保活(CK)機制。在此機制中,來自目標節(jié)點的鄰域集合 的所有節(jié)點都向目標節(jié)點連續(xù)發(fā)送保活請求,并且目標節(jié)點配置成對來自鄰域集合的節(jié)點 答復(fù)以確保目標節(jié)點仍然存活。請求以某一頻率發(fā)送,由目標節(jié)點控制。目標節(jié)點的目的 是確保所有進來的保活請求的頻率都接近期望的恒定間隔k,獨立于其鄰域集合的(通常 改變的)大小。
[0010] 這是通過在系統(tǒng)中的每個節(jié)點運行兩個任務(wù)一一發(fā)送方任務(wù)和接收方任務(wù)達成 的。因為網(wǎng)絡(luò)中的每個節(jié)點都運行這兩個任務(wù),因此系統(tǒng)是對稱的,即,沒有客戶端或服務(wù) 器角色。在給定節(jié)點的發(fā)送方任務(wù)的主要功能是在預(yù)先設(shè)置的時間向給定節(jié)點的鄰域中的 節(jié)點的接收方任務(wù)發(fā)送保活請求,并處理答復(fù)。發(fā)送方任務(wù)具有存儲發(fā)送時間的時間表,稱 為發(fā)送方進度表。從來自那個鄰居節(jié)點的最后保活答復(fù)中提取用于向具體鄰居節(jié)點發(fā)送下 一請求的時間。如果給定節(jié)點的發(fā)送方任務(wù)向另一節(jié)點發(fā)送請求并且給定節(jié)點未從另一節(jié) 點接收到答復(fù),則該請求最多被重復(fù)r次,其中r是預(yù)先定義的重試計數(shù)。在r次重試后, 給定節(jié)點的發(fā)送方任務(wù)檢測到另一節(jié)點的停止,并通過順序泛洪技術(shù)向另一節(jié)點的所有鄰 居廣播此信息。
[0011] 盡管以上機制與基本保活機制相比減少了在節(jié)點之間交換的保活消息量,但它仍 具有如下缺點。第一,保活消息是單向的,g卩,給定節(jié)點的鄰居需要主動地發(fā)送請求消息以 檢索所有其鄰居的狀態(tài)。
[0012] 第二,在節(jié)點失效之后,給定(檢測)節(jié)點向失效節(jié)點的所有已知鄰居節(jié)點發(fā)送保 活信息。然而,當發(fā)送出此類信息時,有可能給定節(jié)點不能直接與失效節(jié)點的所有已知鄰居 節(jié)點通信。在此情況下,這些節(jié)點未接收到故障信息,并且僅能由它們自己檢測失效節(jié)點, 這需要另外的消息。從而,根據(jù)此機制,那些節(jié)點將花更長時間檢測失效節(jié)點。此類問題未 被以上機制考慮,也未被解決。
[0013] 從而,存在開發(fā)減少大規(guī)模分布式網(wǎng)絡(luò)或系統(tǒng)中故障檢測時間和信令成本并且同 時維持基本保活機制的有效性和可靠性的新的且有效的保活和故障檢測機制的需要。


【發(fā)明內(nèi)容】

[0014] 在分布式網(wǎng)絡(luò)中具有一個或多個失效節(jié)點的可能性是有可能的。從而,存在具有 能以比現(xiàn)有機制有效且更快速的方式檢測故障節(jié)點的適當機制(例如方法)的需要。在一 個示范實施例中,網(wǎng)絡(luò)節(jié)點被劃分為被動節(jié)點(passive node)和主動節(jié)點(active node)。 當前節(jié)點探測被動節(jié)點,但不探測主動節(jié)點。當檢測到失效節(jié)點時,當前節(jié)點告知鄰居失效 節(jié)點,而且還追蹤?quán)従庸?jié)點是否可達到。使用后面所討論的備選布置告知不可達到的鄰居 節(jié)點。
[0015] 根據(jù)一個示范實施例,存在用于檢測結(jié)構(gòu)化網(wǎng)絡(luò)中失效節(jié)點的方法。該方法包含 向主動組或被動組指配相鄰集合的節(jié)點的步驟。相鄰集合的節(jié)點連接到當前節(jié)點。該方法 進一步包含命令主動組中的主動節(jié)點向當前節(jié)點發(fā)送保活查詢的步驟和命令被動節(jié)點偵 聽來自當前節(jié)點的保活查詢并用保活查詢響應(yīng)向當前節(jié)點答復(fù)的步驟。該方法還包含將當 前節(jié)點配置成用保活查詢響應(yīng)向主動節(jié)點答復(fù)的步驟。當前節(jié)點基于(i)從被動節(jié)點接收 的保活查詢響應(yīng)和(ii)由主動節(jié)點發(fā)送的保活查詢確定失效節(jié)點。當前節(jié)點配置成不向 主動節(jié)點發(fā)送保活查詢,并且被動節(jié)點配置成不向當前節(jié)點發(fā)送保活查詢。
[0016] 根據(jù)另一個示范實施例,存在配置成檢測結(jié)構(gòu)化網(wǎng)絡(luò)中失效節(jié)點的節(jié)點。該節(jié)點 包含配置成向主動組或被動組指配相鄰集合的節(jié)點的處理器。相鄰集合的節(jié)點連接到當前 節(jié)點。節(jié)點還包含接口,該接口配置成從主動節(jié)點接收保活查詢,并向被動節(jié)點發(fā)送保活查 詢,并從被動節(jié)點接收保活查詢響應(yīng)。接口還響應(yīng)于保活查詢向主動節(jié)點發(fā)送保活查詢響 應(yīng)。處理器基于⑴從被動節(jié)點接收的保活查詢響應(yīng)和(ii)由主動節(jié)點發(fā)送的保活查詢 確定失效節(jié)點。當前節(jié)點配置成不向主動節(jié)點發(fā)送保活查詢。
[0017] 根據(jù)又一個示范實施例,存在包含計算機可執(zhí)行指令的計算機可讀介質(zhì),其中所 述指令當由處理器執(zhí)行時實現(xiàn)上面提到的方法。
[0018] 從而,目的是克服以上部分中討論的缺陷中的一些,并且提供以較少消息交換確 定失效節(jié)點并且還以更安全方式告知鄰居節(jié)點失效節(jié)點的機制。一個或多個獨立權(quán)利要求 有利地提供了用于確定失效節(jié)點的此類機制。
[0019] 縮寫列表 BK基本保活 CK合作保活 NST鄰居集合表 ANL主動鄰居列表 PNL被動鄰居列表 KQ保活查詢 KQR保活查詢響應(yīng) KN保活通知 KNR保活通知響應(yīng) KNF保活通知轉(zhuǎn)發(fā) TCP傳輸控制協(xié)議 UDP用戶數(shù)據(jù)報協(xié)議。

【專利附圖】

【附圖說明】
[0020] 并入說明書并構(gòu)成其一部分的附圖圖示了一個或多個實施例,并且與說明書一起 說明這些實施例。在附圖中: 圖1是具有多個節(jié)點的通信網(wǎng)絡(luò)的示意圖; 圖2是根據(jù)示范實施例具有故障檢測機制的當前節(jié)點及其鄰居節(jié)點的示意圖; 圖3是圖示根據(jù)示范實施例如何在被動節(jié)點與主動節(jié)點之間交換保活消息的示意圖; 圖4是圖示根據(jù)示范實施例的保活查詢消息格式的示意圖; 圖5是根據(jù)示范實施例的保活查詢響應(yīng)消息格式的示意圖; 圖6是根據(jù)示范實施例的保活通知消息格式的示意圖; 圖7是根據(jù)示范實施例的保活通知響應(yīng)消息格式的示意圖; 圖8是根據(jù)示范實施例的保活通知轉(zhuǎn)發(fā)消息格式的示意圖; 圖9是圖示根據(jù)示范實施例在節(jié)點之間發(fā)生的檢測失效節(jié)點的各種步驟的示意圖; 圖10是根據(jù)示范實施例用于確定失效節(jié)點的方法的流程圖;以及 圖11是根據(jù)示范實施例實現(xiàn)用于檢測失效節(jié)點的方法的節(jié)點的示意圖。

【具體實施方式】
[0021] 示范實施例的如下描述參考附圖。不同附圖中的相同附圖標記標識相同或類似元 素。如下詳細描述不限制本發(fā)明。而是,本發(fā)明的范圍由所附權(quán)利要求書定義。為了簡化, 如下實施例相對于分布式協(xié)議(例如P2P Chord)建立成使得任何節(jié)點都知道其鄰居節(jié)點 的分布式網(wǎng)絡(luò)的術(shù)語和結(jié)構(gòu)進行討論。然而,新穎實施例不限于給定分布式協(xié)議,而是可應(yīng) 用于其它類型的基礎(chǔ)協(xié)議。
[0022] 在說明書通篇提到"一個實施例"或"實施例"是指結(jié)合一實施例描述的具體特征、 結(jié)構(gòu)或特性包含在本發(fā)明的至少一個實施例中。從而,在說明書通篇各處出現(xiàn)的短語"在一 個實施例中"或"在實施例中"不一定全都指的是同一實施例。進一步說,具體特征、結(jié)構(gòu)或 特性可以任何適合的方式組合在一個或多個實施例中。
[0023] 根據(jù)示范實施例,存在用于檢測結(jié)構(gòu)化網(wǎng)絡(luò)中失效節(jié)點的方法。該方法向主動組 或被動組指配當前節(jié)點的相鄰節(jié)點。命令來自主動組的節(jié)點向當前節(jié)點發(fā)送保活查詢,并 命令來自被動組的節(jié)點偵聽來自當前節(jié)點的保活查詢,并用保活查詢響應(yīng)向當前節(jié)點答 復(fù)。當前節(jié)點配置成用保活查詢響應(yīng)向主動節(jié)點答復(fù),并基于(i)從被動節(jié)點接收的保活 查詢響應(yīng)和(ii)由主動節(jié)點發(fā)送的保活查詢確定失效節(jié)點。當前節(jié)點配置成不向主動節(jié) 點發(fā)送保活查詢以減少業(yè)務(wù),并且被動節(jié)點配置成不向當前節(jié)點發(fā)送保活查詢以進一步減 少業(yè)務(wù)。
[0024] 現(xiàn)在相對于圖2更詳細說明這個新穎機制。分布式網(wǎng)絡(luò)200具有N個節(jié)點,其中每 個節(jié)點連接到網(wǎng)絡(luò)中的一些其它節(jié)點。圖2為了簡化僅示出了少數(shù)節(jié)點202、206、208、210、 212、214、222、224和226。當前節(jié)點202直接鏈接到節(jié)點206、208、210、212和214。這些節(jié) 點206、208、210、212和214是節(jié)點202的鄰居節(jié)點。它們形成節(jié)點202的鄰居集合(NS)。 鄰居集合被標示為N(x)或204。類似地,節(jié)點212具有鄰居節(jié)點202、222和224,并且這些 節(jié)點形成節(jié)點212的鄰居集合N(Z) 220。網(wǎng)絡(luò)中的所有其它節(jié)點由通用元素226表示。
[0025] 鄰居集合204中的節(jié)點206、208、210、212和214被指配給主動組216(其包含主 動節(jié)點206、208和210)和被動組218 (其包含被動節(jié)點212和214)。在下文假定,節(jié)點之 間的鄰域關(guān)系已經(jīng)由基礎(chǔ)覆蓋協(xié)議(例如P2P Chord或其它分布式協(xié)議)建立。換句話 說,當前節(jié)點知道其鄰居節(jié)點,并且當前節(jié)點可與鄰居節(jié)點通信,并且節(jié)點的基本信息(例 如ID和IP地址)已經(jīng)被交換。當節(jié)點加入或離開網(wǎng)絡(luò)時,其鄰居節(jié)點將基于現(xiàn)有協(xié)議更 新它們的鄰居集合204和相關(guān)參數(shù)。
[0026] 適當?shù)赜么私Y(jié)構(gòu),在當前節(jié)點202的鄰居集合204的節(jié)點之間共享保活信息,即, 在現(xiàn)有機制中鄰居集合204中的每個節(jié)點都不需要與當前節(jié)點202定期交換保活消息。而 是,根據(jù)此新穎方法,鄰居集合204中的節(jié)點被視為同一組的一部分,并且此組僅需要在固 定間隔(例如預(yù)定時間間隔)與當前節(jié)點202交換保活消息。
[0027] 換句話說,鄰居集合204的節(jié)點206、208、210、212和214按預(yù)定順序與當前節(jié)點 202交換保活消息,S卩,節(jié)點206首先與當前節(jié)點202交換保活消息,在預(yù)定時間間隔之后, 節(jié)點208與當前節(jié)點202交換保活消息,依此類推。進一步說,如后面將討論的,并不是鄰 居集合204中的所有節(jié)點都向當前節(jié)點202發(fā)送保活消息,而是僅主動節(jié)點發(fā)送。如果鄰 居集合204中的鄰居節(jié)點(例如節(jié)點208)已經(jīng)檢測到當前節(jié)點202的故障,則節(jié)點208將 與鄰居集合204中的所有其它節(jié)點共享此信息。
[0028] 此外,為了進一步減少故障檢測時間,在例如在圖3中所示的兩個節(jié)點之間雙向 共享保活信息。圖3示出了具有兩個鄰居206和212的節(jié)點202,其中節(jié)點206是主動節(jié) 點,而節(jié)點212是被動節(jié)點。這意味著,節(jié)點206向節(jié)點202發(fā)送保活查詢230A,而節(jié)點202 用保活查詢響應(yīng)230B向節(jié)點206答復(fù)。然而,節(jié)點202不向節(jié)點206發(fā)送保活查詢。
[0029] 類似地,因為節(jié)點202是被動節(jié)點212的主動節(jié)點,因此僅節(jié)點202向被動節(jié)點 212發(fā)送保活查詢232A,并且僅被動節(jié)點212向節(jié)點202發(fā)送回保活查詢響應(yīng)232B。換句 話說,當節(jié)點202不向主動節(jié)點206發(fā)送保活查詢并且被動節(jié)點212不向節(jié)點202發(fā)送保 活查詢時,這些節(jié)點之間的業(yè)務(wù)減少。從而,節(jié)點212通過檢查它在預(yù)計時間之前是否已經(jīng) 從節(jié)點202接收到保活消息232A來檢測節(jié)點202的故障。如果否,則節(jié)點212將假定節(jié)點 202已經(jīng)失效,并且保活消息被發(fā)送到節(jié)點202以主動確認節(jié)點202已經(jīng)永久失效。
[0030] 對于節(jié)點202確定節(jié)點206是否已經(jīng)失效同樣正確。換句話說,主動節(jié)點206通 過定期發(fā)送保活查詢消息230A來檢測節(jié)點202的狀態(tài)。如果主動節(jié)點206未從節(jié)點202 接收到響應(yīng),則主動節(jié)點206將認為節(jié)點202已經(jīng)失效,并將向節(jié)點202發(fā)送那個效果的確 認消息。被動節(jié)點202將通過檢查在預(yù)計時間期間是否從節(jié)點206接收到保活查詢消息 230A來檢測主動節(jié)點206的狀態(tài)。如果在預(yù)計時間以前節(jié)點202未從節(jié)點206接收到查詢 消息,則節(jié)點202將認為節(jié)點206已經(jīng)失效,并將向節(jié)點206發(fā)送那個效果的消息。
[0031] 為了實現(xiàn)這個新穎機制,根據(jù)示范實施例,每個節(jié)點需要保持兩個列表:主動鄰居 列表(ANL)和被動鄰居列表(PNL)。ANL配置成包含當前節(jié)點的主動鄰居,而PNL配置成包 含當前節(jié)點的被動鄰居。主動角色和被動角色是對稱的。例如,如果節(jié)點202是節(jié)點212 的主動節(jié)點,則節(jié)點212是節(jié)點202的被動節(jié)點。此外,一個節(jié)點可同時作為主動鄰居和被 動鄰居工作,例如圖3中的節(jié)點202。然而,給定某一鄰居,節(jié)點的角色是唯一的,例如,節(jié)點 202是節(jié)點212的主動節(jié)點。
[0032] 如上面所提到的,如果圖2中的鄰居集合220中的當前節(jié)點202已經(jīng)檢測到節(jié)點 212的故障,則節(jié)點202應(yīng)該向鄰居集合220中的所有其它節(jié)點222和224通知節(jié)點212的 故障。然而,在真實的分布式系統(tǒng)中,有可能節(jié)點202可能不能夠直接與鄰居集合220中的 所有其它節(jié)點通信。換句話說,節(jié)點222和224之一可能是節(jié)點202不可達到的。
[0033] 因此,與失效節(jié)點212相關(guān)的故障信息可能不與失效節(jié)點212的一些鄰居節(jié)點共 享。根據(jù)另一示范實施例,當前(檢測)節(jié)點202配置成要求鄰居集合220中的其它可達 到的鄰居節(jié)點向那些不可達到節(jié)點轉(zhuǎn)發(fā)此類故障信息。例如,仍相對于圖2,考慮當前節(jié)點 202可直接到達節(jié)點222但不到達節(jié)點224。然后,當故障信息發(fā)送給它時,當前節(jié)點202 追蹤到未從節(jié)點224接收到響應(yīng),并且從而,當前節(jié)點202向鄰居集合220中的其它可達到 節(jié)點(222)發(fā)送含有不可達到節(jié)點224的ID和其它信息的消息。可達到節(jié)點222然后向 不可達到節(jié)點224轉(zhuǎn)發(fā)與失效節(jié)點212相關(guān)的故障信息。
[0034] 用所提出的新穎機制,可迅速檢測到節(jié)點故障,同時信令開銷大大下降。從而,與 現(xiàn)有機制相比,改進了分布式系統(tǒng)的總體性能。現(xiàn)在更詳細地討論上面討論的新穎機制。
[0035] 鄰居集合表(NST)可自動保持在每個節(jié)點中,以將其鄰居節(jié)點的信息存儲在分布 式系統(tǒng)中。在NST中,對于每個鄰居節(jié)點都存在包含如下字段的條目:節(jié)點ID、IP地址和鄰 居列表。節(jié)點ID用于唯一表示分布式覆蓋網(wǎng)絡(luò)中的節(jié)點,例如在P2P網(wǎng)絡(luò)中,ID是節(jié)點的 對等ID。IP地址用于在節(jié)點之間傳送消息,包含保活消息。鄰居列表含有由當前條目的節(jié) 點ID表示的節(jié)點的節(jié)點鄰居集合。在當前節(jié)點檢測到其鄰居節(jié)點之一的故障時,它將通知 鄰居列表那個鄰居節(jié)點。
[0036] 表1示出了節(jié)點212的NST的示例。從該表中可以看到,節(jié)點212的鄰居節(jié)點包 含節(jié)點202、222和224。節(jié)點202的IP地址是〃 192. 168. 0. 100〃,而節(jié)點202的鄰居包含 節(jié)點 206、208、210、212 和 214。節(jié)點 222 的 IP 地址是〃 192. 168. 0? 200〃,而節(jié)點 222 的鄰 居包含節(jié)點c和d,依此類推。
[0037] 表1 :節(jié)點212的樣品鄰居集合表

【權(quán)利要求】
1. 一種用于檢測結(jié)構(gòu)化網(wǎng)絡(luò)(200)中失效節(jié)點(212)的方法,所述方法包括: 向主動組(216)或被動組(218)指配相鄰集合(204)的節(jié)點(206, 208, 210, 212, 214), 其中所述相鄰集合(204)的所述節(jié)點(206, 208, 210, 212, 214)連接到當前節(jié)點(202); 命令所述主動組(216)中的主動節(jié)點(206, 208, 210)向所述當前節(jié)點(202)發(fā)送保活 查詢(230A),其中由所述當前節(jié)點(202)控制用于從所述主動節(jié)點(206, 208, 210)向所述 當前節(jié)點(202)發(fā)送所述保活查詢(230A)的定時; 命令被動節(jié)點(212, 214)偵聽來自所述當前節(jié)點(202)的保活查詢(232A),并用保活 查詢響應(yīng)(232B)向所述當前節(jié)點(202)答復(fù); 將所述當前節(jié)點(202)配置成用保活查詢響應(yīng)(230B)向所述主動節(jié)點答復(fù);以及 基于(i)從所述被動節(jié)點接收的所述保活查詢響應(yīng)(232B)和(ii)由所述主動節(jié)點發(fā) 送的所述保活查詢(230A)確定所述失效節(jié)點(212), 其中所述當前節(jié)點(202)配置成不向所述主動節(jié)點發(fā)送所述保活查詢(232A),并且所 述被動節(jié)點配置成不向所述當前節(jié)點(202)發(fā)送保活查詢。
2. 如權(quán)利要求1所述的方法,進一步包括: 在所述當前節(jié)點保持僅包含所述主動節(jié)點的主動列表和僅包含所述被動節(jié)點的被動 列表,其中所述主動節(jié)點和所述被動節(jié)點形成所述當前節(jié)點的所述相鄰集合。
3. 如權(quán)利要求1所述的方法,進一步包括: 如果作為對所述當前節(jié)點向所述失效節(jié)點發(fā)送的所述保活查詢的答復(fù)未從所述失效 節(jié)點接收到保活查詢響應(yīng),則確定所述失效節(jié)點是被動節(jié)點。
4. 如權(quán)利要求1所述的方法,進一步包括: 如果在預(yù)計時間所述當前節(jié)點未從所述失效節(jié)點接收到保活查詢,則確定所述失效節(jié) 點是主動節(jié)點。
5. 如權(quán)利要求1所述的方法,進一步包括: 從所述當前節(jié)點向所述失效節(jié)點的鄰居節(jié)點發(fā)送保活通知消息,其中所述保活通知包 含所述失效節(jié)點已經(jīng)失效的信息。
6. 如權(quán)利要求5所述的方法,進一步包括: 保持具有所述失效節(jié)點的可達到的鄰居節(jié)點的列表,其中可達到的鄰居節(jié)點是響應(yīng)于 所述保活通知消息而對所述當前節(jié)點答復(fù)的節(jié)點。
7. 如權(quán)利要求6所述的方法,進一步包括: 保持具有所述失效節(jié)點的不可達到的鄰居節(jié)點的列表。
8. 如權(quán)利要求7所述的方法,進一步包括: 從所述可達到的鄰居節(jié)點列表中隨機選擇預(yù)定數(shù)量的節(jié)點。
9. 如權(quán)利要求8所述的方法,進一步包括: 從所述當前節(jié)點向隨機選擇的可達到的鄰居節(jié)點發(fā)送具有要被告知關(guān)于所述失效節(jié) 點的所述不可達到的鄰居節(jié)點的所述列表。
10. 如權(quán)利要求1所述的方法,進一步包括: 從所述當前節(jié)點保持的各種表或列表中移除所述失效節(jié)點。
11. 一種配置成檢測結(jié)構(gòu)化網(wǎng)絡(luò)(200)中失效節(jié)點(212)的當前節(jié)點(202),所述當前 節(jié)點(202)包括: 處理器,配置成向主動組(216)或被動組(218)指配相鄰集合(204)的節(jié)點 (206, 208, 210, 212, 214),其中所述相鄰集合(204)的所述節(jié)點(206, 208, 210, 212, 214)連 接到當前節(jié)點(202);以及 接口,配置成: 從所述主動組(216)中的主動節(jié)點(206, 208, 210)接收保活查詢(230A); 向被動節(jié)點(212, 214)發(fā)送保活查詢(232A),并從所述被動節(jié)點接收保活查詢響應(yīng) (232B);以及 響應(yīng)于所述保活查詢(230A)向所述主動節(jié)點發(fā)送保活查詢響應(yīng)(230B); 其中所述處理器基于(i)從所述被動節(jié)點接收的所述保活查詢響應(yīng)(232B)和(ii)由 所述主動節(jié)點發(fā)送的所述保活查詢(230A)確定所述失效節(jié)點,并且 其中所述當前節(jié)點(202)配置成不向所述主動節(jié)點發(fā)送所述保活查詢(232A)。
12. 如權(quán)利要求11所述的節(jié)點,其中所述處理器配置成不向所述被動節(jié)點發(fā)送保活 查詢響應(yīng)。
13. 如權(quán)利要求11所述的節(jié)點,其中所述處理器進一步配置成:保持僅包含所述主動 節(jié)點的主動列表和僅包含所述被動節(jié)點的被動列表,其中所述主動節(jié)點和所述被動節(jié)點形 成所述當前節(jié)點的所述相鄰集合。
14. 如權(quán)利要求11所述的節(jié)點,其中所述處理器進一步配置成: 如果作為對所述當前節(jié)點向所述失效節(jié)點發(fā)送的所述保活查詢的答復(fù)未從所述失效 節(jié)點接收到保活查詢響應(yīng),則確定所述失效節(jié)點是被動節(jié)點;或者 如果在預(yù)計時間所述當前節(jié)點未從所述失效節(jié)點接收到保活查詢,則確定所述失效節(jié) 點是主動節(jié)點。
15. 如權(quán)利要求11所述的節(jié)點,其中所述處理器進一步配置成:向所述失效節(jié)點的鄰 居節(jié)點發(fā)送保活通知消息。
16. 如權(quán)利要求15所述的節(jié)點,其中所述處理器進一步配置成:保持具有所述失效節(jié) 點的可達到的鄰居節(jié)點的列表,其中可達到的鄰居節(jié)點是響應(yīng)于所述保活通知消息而對所 述當前節(jié)點答復(fù)的節(jié)點。
17. 如權(quán)利要求16所述的節(jié)點,其中所述處理器進一步配置成:保持具有所述失效節(jié) 點的不可達到的鄰居節(jié)點的列表。
18. 如權(quán)利要求17所述的節(jié)點,其中所述處理器進一步配置成:從所述可達到的鄰居 節(jié)點列表中隨機選擇預(yù)定數(shù)量的節(jié)點。
19. 如權(quán)利要求18所述的節(jié)點,其中所述處理器進一步配置成:向隨機選擇的可達到 的鄰居節(jié)點發(fā)送具有要被告知關(guān)于所述失效節(jié)點的所述不可達到的鄰居節(jié)點的所述列表。
20. -種包含計算機可執(zhí)行指令的非暫時性計算機可讀介質(zhì),其中所述指令當由處理 器執(zhí)行時實現(xiàn)用于檢測結(jié)構(gòu)化網(wǎng)絡(luò)(200)中失效節(jié)點(212)的方法,所述指令包括: 向主動組(216)或被動組(218)指配相鄰集合(204)的節(jié)點(206, 208, 210, 212, 214), 其中所述相鄰集合(204)的所述節(jié)點(206, 208, 210, 212, 214)連接到當前節(jié)點(202); 命令所述主動組(216)中的主動節(jié)點(206, 208, 210)向所述當前節(jié)點(202)發(fā)送保活 查詢(230A),其中由所述當前節(jié)點(202)控制用于從所述主動節(jié)點(206, 208, 210)向所述 當前節(jié)點(202)發(fā)送所述保活查詢(230A)的定時; 命令被動節(jié)點(212,214)偵聽來自所述當前節(jié)點(202)的保活查詢(232A),并用保活 查詢響應(yīng)(232B)向所述當前節(jié)點(202)答復(fù); 將所述當前節(jié)點(202)配置成用保活查詢響應(yīng)(230B)向所述主動節(jié)點答復(fù);以及 基于(i)從所述被動節(jié)點接收的所述保活查詢響應(yīng)(232B)和(ii)由所述主動節(jié)點發(fā) 送的所述保活查詢(230A)確定所述失效節(jié)點(212), 其中所述當前節(jié)點(202)配置成不向所述主動節(jié)點發(fā)送所述保活查詢(232A),并且所 述被動節(jié)點配置成不向所述當前節(jié)點(202)發(fā)送保活查詢。
【文檔編號】H04L12/26GK104509033SQ201280073493
【公開日】2015年4月8日 申請日期:2012年3月27日 優(yōu)先權(quán)日:2012年3月27日
【發(fā)明者】蔡學軍 申請人:愛立信(中國)通信有限公司(中國)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 广饶县| 武定县| 葫芦岛市| 沙田区| 莱西市| 吉安市| 五台县| 台北市| 兴文县| 云浮市| 海城市| 龙陵县| 北碚区| 绥中县| 清镇市| 安图县| 华亭县| 四会市| 邢台县| 偃师市| 冀州市| 贵州省| 读书| 山东省| 嫩江县| 定结县| 游戏| 砚山县| 河曲县| 滦平县| 九龙县| 乳源| 长丰县| 防城港市| 东辽县| 文登市| 岑溪市| 汉中市| 永宁县| 新绛县| 金湖县|