專利名稱:網(wǎng)絡拓撲的分析處理方法、系統(tǒng)和管理服務器的制作方法
技術領域:
本發(fā)明實施例涉及網(wǎng)絡通信技術領域,尤其涉及一種網(wǎng)絡拓撲的分析處理方法、 系統(tǒng)和管理服務器。
背景技術:
彈性分組環(huán)(Resilient Packet Ring ;以下簡稱RPR)作為一種新型的介質(zhì)接 入控制(Media Access Control ;以下簡稱MAC)協(xié)議,具有同步數(shù)字體系(Synchronous Digital Hierarchy ;以下簡稱SDH)/同步光網(wǎng)絡(Synchronous Optical Network;以下 簡稱S0NET)環(huán)網(wǎng)的保護機制和以太網(wǎng)傳輸數(shù)據(jù)報文的有效性。因此,RH 環(huán)網(wǎng)具有高可靠 性、穩(wěn)定性、電信級的快速故障恢復能力,且通常用于相對核心的骨干網(wǎng)絡中。相應地,其對 網(wǎng)絡維護人員也提出了較高的要求,快速定位并解決可能出現(xiàn)的故障,即時排除網(wǎng)絡隱患。 而由于RH 環(huán)網(wǎng)的復雜性,網(wǎng)絡維護人員需要經(jīng)過專業(yè)的培訓才能理解并定位當前網(wǎng)絡中 的各種故障原因,這無疑增加了企業(yè)的運營成本。在現(xiàn)有技術中,電氣電子工程師協(xié)會(Institute of Electrical and Electronics Engineers ;以下簡稱IEEE)組織提出了對應的RPR管理信息庫(Management Information Base ;以下簡稱MIB),用于呈現(xiàn)RH 環(huán)網(wǎng)中報文的收發(fā)情況、當前的配置情 況以及當前的網(wǎng)絡拓撲情況,使得網(wǎng)絡維護人員根據(jù)RPR MIB中的信息以及自身的經(jīng)驗判 斷當前網(wǎng)絡可能發(fā)生的故障。然而,現(xiàn)有技術中對RH 環(huán)網(wǎng)中故障的分析、定位和解決仍依賴于網(wǎng)絡維護人員 的自身能力,且無法及時發(fā)現(xiàn)并排除一些一閃而逝的故障,從而造成了 RH 環(huán)網(wǎng)中的故障 隱患,降低了環(huán)網(wǎng)的可維護性和穩(wěn)定性。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種網(wǎng)絡拓撲的分析處理方法、系統(tǒng)和管理服務器,用以解決 現(xiàn)有技術中依賴于網(wǎng)絡維護人員來分析、定位和解決網(wǎng)絡故障的缺陷,實現(xiàn)對網(wǎng)絡拓撲事 件的收集和分析,為網(wǎng)絡維護人員提供拓撲事件的分析結果,降低對網(wǎng)絡維護人員的技術 要求,提高網(wǎng)絡的可維護性和穩(wěn)定性。本發(fā)明實施例提供一種網(wǎng)絡拓撲的分析處理方法,包括接收環(huán)網(wǎng)設備收集的網(wǎng)絡中產(chǎn)生的拓撲信息,并將所述拓撲信息寫入事件庫中;根據(jù)所述拓撲信息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事件的處理對策。本發(fā)明實施例提供一種管理服務器,包括接收模塊,用于接收環(huán)網(wǎng)設備收集的網(wǎng)絡中產(chǎn)生的拓撲信息;寫入模塊,用于將所述拓撲信息寫入事件庫中;分析模塊,用于根據(jù)所述拓撲信息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事件的 處理對策。本發(fā)明實施例提供一種網(wǎng)絡拓撲的分析處理系統(tǒng),包括多個環(huán)網(wǎng)設備和上述管理服務器。本發(fā)明實施例的網(wǎng)絡拓撲的分析處理方法、系統(tǒng)和管理服務器,通過環(huán)網(wǎng)設備對 網(wǎng)絡中產(chǎn)生的各種拓撲信息進行收集處理,管理服務器接收到由環(huán)網(wǎng)設備發(fā)送的拓撲信 息,根據(jù)該拓撲信息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事件的處理對策,將處理對策反 饋給網(wǎng)管,以使得網(wǎng)管可以根據(jù)處理對策對網(wǎng)絡中的故障事件進行即時有效的處理,解決 了現(xiàn)有技術中依賴于網(wǎng)絡維護人員來分析、定位和解決網(wǎng)絡故障的缺陷,實現(xiàn)了對網(wǎng)絡拓 撲事件的收集和分析,為網(wǎng)絡維護人員提供拓撲事件的分析結果,降低了對網(wǎng)絡維護人員 的技術要求,提高了網(wǎng)絡的可維護性和穩(wěn)定性。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明網(wǎng)絡拓撲的分析處理方法實施例一的流程圖;圖2為本發(fā)明網(wǎng)絡拓撲的分析處理方法實施例一中RH 環(huán)網(wǎng)的結構示意圖;圖3為本發(fā)明網(wǎng)絡拓撲的分析處理方法實施例一中RH 環(huán)網(wǎng)的工作示例圖;圖4為本發(fā)明網(wǎng)絡拓撲的分析處理方法實施例二的流程5為本發(fā)明管理服務器實施例一的結構示意圖;圖6為本發(fā)明管理服務器實施例二的結構示意圖。
具體實施例方式為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。圖1為本發(fā)明網(wǎng)絡拓撲的分析處理方法實施例一的流程圖,如圖1所示,本實施例 提供了一種網(wǎng)絡拓撲的分析處理方法,可以具體包括如下步驟步驟101,管理服務器接收環(huán)網(wǎng)設備收集的網(wǎng)絡中產(chǎn)生的拓撲信息,并將所述拓撲 信息寫入事件庫中。在本步驟中,環(huán)網(wǎng)設備對網(wǎng)絡中產(chǎn)生的拓撲信息進行收集處理,包括每次的拓撲 變化事件和拓撲穩(wěn)定事件,管理服務器從與其相連的多個環(huán)網(wǎng)設備接收拓撲信息,并將接 收到的拓撲信息寫入管理服務器的事件庫中。本實施例的網(wǎng)絡拓撲的分析處理方法可以具體應用于RH 環(huán)網(wǎng)中,如圖2所示為 本發(fā)明網(wǎng)絡拓撲的分析處理方法實施例一中RH 環(huán)網(wǎng)的結構示意圖,圖中包括6個RH 站 點,g卩S1-S6,相鄰的RPR站點間通過RPR接口連接,以形成一個環(huán)狀網(wǎng)絡。其中,每個RPR 接口均包括接收線路與發(fā)送線路,則形成如圖2所示的可雙向傳輸?shù)腞H 環(huán)網(wǎng),即順時針 或環(huán)0、逆時針或環(huán)1。其中,局域網(wǎng)(Local Area Network ;以下簡稱LAN) 1、LAN2、LAN3、 LAN4、LAN5、LAN6分別表示與各RTO站點互聯(lián)的內(nèi)部網(wǎng)絡,這些網(wǎng)絡通過RPR環(huán)網(wǎng)建立相互
8之間的通訊。如圖3所示為本發(fā)明網(wǎng)絡拓撲的分析處理方法實施例一中RH 環(huán)網(wǎng)的工作示例 圖,其中,鏈路(link)表示RH 站點之間每個方向的連接,線路(span)為RH 環(huán)網(wǎng)中相鄰兩 個站點間的部分,其由一對互為相反方向傳輸?shù)膯蜗騦ink組成,例如圖2中SO與S1之間 的span由SO向SI發(fā)送數(shù)據(jù)的linkO和S1向SO發(fā)送數(shù)據(jù)的linkl組成。每一個RPR站 點均與其他兩個RPR站點進行互聯(lián),則每個站點對應有兩個span,通常將這兩個span按照 方位進行區(qū)分,即分為west span和east span。如對于圖2中的S2而言,S2與SI互聯(lián)的 span可以稱為S2的west span,可以稱為SI的east span,S2與S3互聯(lián)的span可以稱為 S2的east span,可以稱為S3的west span。邊緣(edge)為不能正常傳送數(shù)據(jù)的span,即 處于故障狀態(tài)的span。在本實施例中,RPR的拓撲發(fā)現(xiàn)與保護可能出現(xiàn)以下幾種保護請求狀態(tài),按其優(yōu) 先級從高到低的順序可以為強制倒換(Forced Switch ;以下簡稱FS)、信號失效(Signal Fail ;以下簡稱SF)、信號衰弱(Signal Dgrade ;以下簡稱SD)、人為倒換(Manual Switch ;以下簡稱MS)、等待恢復(Wait To Restore ;以下簡稱WTR)和空閑(IDLE)。其 中,F(xiàn)S為用戶強制保護請求,即用戶強制請求將相應的link斷掉而引起的保護請求;SF為 接口信號失效引起的保護請求;SD為接口信號衰弱引起的保護請求;MS也是用戶強制保護 請求,其與FS類似,只是優(yōu)先級較低;WTR為處于WTR期間的保護請求,WTR事件是當發(fā)生SF 或SD的線路故障恢復后,RHU辦議定義的一種恢復過渡狀態(tài),主要目的為防止頻繁的SF、SD 恢復事件導致網(wǎng)絡拓撲頻繁振蕩。另外,RH 還提供了一個配置供用戶選擇是否希望WTR事 件能夠自動恢復還是永久保留WTR狀態(tài),除非發(fā)生了更高優(yōu)先級的事件將其替代。IDLE為 無保護請求狀態(tài)。其中FS、SF、SD、MS、WTR等原因可能引起span的edge狀態(tài),是本次設計 中重點關注的環(huán)節(jié)。其中,SF、SD的狀態(tài)由接收方檢測,其絕大多數(shù)情況由外部線路故障或 對端故障觸發(fā),而除SF、SD之外的其余狀態(tài)由設備主動通告,其由用戶配置或設備內(nèi)部狀 態(tài)控制觸發(fā)。例如,假定圖2中在S3與S4互聯(lián)的兩個link中,上面的link稱為linkl、下 面的link稱為link2。從圖中的箭頭方向可以看出,linkl對應為S3發(fā)送、S4接收,link2 對應為S4發(fā)送、S3接收。當linkl的連接斷掉時,此時由S4檢測到SF狀態(tài);同理當link2 的連接斷掉時,則S3會檢測到SF狀態(tài);若兩個link同時斷掉,則S3、S4同時會檢測到SF 狀態(tài)。步驟102,管理服務器根據(jù)所述拓撲信息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事 件的處理對策。管理服務器在接收到新的拓撲信息后,根據(jù)從事件庫中讀取的拓撲信息對網(wǎng)絡拓 撲狀態(tài)進行分析,并根據(jù)分析的結果生成故障事件的相應地處理對策,將生成的處理對策 反饋給網(wǎng)管,可以協(xié)助網(wǎng)管對網(wǎng)絡中出現(xiàn)的故障事件進行實時有效的處理。本實施例提供了一種網(wǎng)絡拓撲的分析處理方法,通過環(huán)網(wǎng)設備對網(wǎng)絡中產(chǎn)生的各 種拓撲信息進行收集處理,管理服務器接收到由環(huán)網(wǎng)設備發(fā)送的拓撲信息,根據(jù)該拓撲信 息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事件的處理對策,將處理對策反饋給網(wǎng)管,以使得 網(wǎng)管可以根據(jù)處理對策對網(wǎng)絡中的故障事件進行即時有效的處理,解決了現(xiàn)有技術中依賴 于網(wǎng)絡維護人員來分析、定位和解決網(wǎng)絡故障的缺陷,實現(xiàn)了對網(wǎng)絡拓撲事件的收集和分 析,為網(wǎng)絡維護人員提供拓撲事件的分析結果,降低了對網(wǎng)絡維護人員的技術要求,提高了網(wǎng)絡的可維護性和穩(wěn)定性。圖4為本發(fā)明網(wǎng)絡拓撲的分析處理方法實施例二的流程圖,如圖4所示,本實施例 提供了一種網(wǎng)絡拓撲的分析處理方法,可以包括如下步驟步驟401,環(huán)網(wǎng)設備對網(wǎng)絡中產(chǎn)生的拓撲信息進行收集處理。在本步驟中,環(huán)網(wǎng)設備對網(wǎng)絡中產(chǎn)生的拓撲變化事件、拓撲穩(wěn)定事件等的拓撲信 息進行收集處理。此處的拓撲信息可以包括但不限于本次拓撲發(fā)生變化的時間、本次拓撲 穩(wěn)定的時間、本次拓撲持續(xù)穩(wěn)定的時間、上一次拓撲最終持續(xù)穩(wěn)定的時間、本次拓撲發(fā)生變 化的直接原因、本次發(fā)生拓撲變化的根源站點的拓撲變化的真實事件、本次發(fā)生拓撲變化 的站點和所述站點與網(wǎng)絡中其余站點的相對位置,以及當前網(wǎng)絡中存在的缺陷指示。其中,本次拓撲發(fā)生變化的時間可以依據(jù)RH 環(huán)網(wǎng)設備的設備啟動時間來獲得, 即與設備啟動時間相對的相對時間,也可以依據(jù)當前標準時間來獲得,即為絕對時間。本次 拓撲穩(wěn)定的時間也可以依據(jù)RH 環(huán)網(wǎng)設備的設備啟動時間或當前標準時間來獲得,通常, RH 環(huán)網(wǎng)的從拓撲變化到拓撲穩(wěn)定的時間間隔需要再50ms以內(nèi)。本次拓撲持續(xù)穩(wěn)定的時 間可以根據(jù)本次拓撲穩(wěn)定時間來確定,例如本次拓撲穩(wěn)定事件發(fā)生在2010-5-9 1:00,則在 2010-5-9 18:00查看當前的網(wǎng)絡拓撲情況時,該域的值為0天17小時,表示本次拓撲已經(jīng) 持續(xù)穩(wěn)定了 17個小時。由于只能等到下一次拓撲發(fā)生變化時才能獲得前次拓撲的最終穩(wěn) 定時間,則上一次拓撲最終持續(xù)穩(wěn)定的時間可以根據(jù)本次拓撲發(fā)生變化的時間來獲得。本 次拓撲發(fā)生變化的直接原因可能為保護配置、SD、SF、FS、MS等,即本次拓撲發(fā)生變化可以 表現(xiàn)為發(fā)生SD或SF等事件,在本次拓撲發(fā)生變化時,RH 環(huán)網(wǎng)設備可以根據(jù)接收到的RPR 報文來獲取其中攜帶的次拓撲發(fā)生變化的直接原因。對于發(fā)生拓撲變化的根源站點來說, 即對于第一個檢測到故障的故障站點來說,還需要記錄拓撲變化的真實事件。例如,觸發(fā) SF事件的原因可以為由于線路連接斷開、保活超時或者錯接環(huán)等等。其中,由于每個RPR span互聯(lián)的兩個站點在線路連接正常的情況下,都會主動對外發(fā)送保活報文,當一方在設 定的持續(xù)時間內(nèi)未收到保活報文,則認為對端站點失效,進而檢測到產(chǎn)生SF事件,則這種 情況的SF事件產(chǎn)生的真實事件為保活超時。而錯接環(huán)為互聯(lián)的兩個站點之間的兩條線路 發(fā)生連接錯位,例如,圖3中S3和S4之間的兩個link發(fā)生連接錯位,即linkl的發(fā)送接到 link2的接收,link2的發(fā)送接到linkl的接收。環(huán)網(wǎng)設備還需記錄本次發(fā)生拓撲變化的站 點和該站點與網(wǎng)絡中其余站點的相對位置,以圖2為例,假設S2站點引發(fā)了拓撲變化,則在 S1站點上記錄的發(fā)生拓撲變化的站點為S1站點在環(huán)0發(fā)送的第一跳對應的站點,即S1站 點在順時針方向發(fā)送的第一跳對應的站點,或者S1站點在環(huán)1發(fā)送的第五跳對應的站點, 即S1站點在逆時針方向發(fā)送的第五跳對應的站點。另外,環(huán)網(wǎng)設備還對當前網(wǎng)絡中存在的 缺陷指示進行記錄,環(huán)網(wǎng)設備可以查看當前RH 環(huán)網(wǎng)中是否存在缺陷指示,如果存在,則對 該缺陷指示進行記錄。步驟402,管理服務器接收環(huán)網(wǎng)設備收集的拓撲信息,并將拓撲信息寫入事件庫 中。本步驟為管理服務器從與其連接的多個環(huán)網(wǎng)設備中接收各環(huán)網(wǎng)設備收集的拓 撲信息,并將該拓撲信息寫入管理服務器的事件庫中。在本實施例中站點和管理服務 器之間進行通訊的數(shù)據(jù)報文可以使用簡單網(wǎng)絡管理協(xié)議(Simple Network Management Protocol ;以下簡稱SNMP)格式,其中,SNMP報文中攜帶的負載內(nèi)容即為上述步驟401中環(huán)網(wǎng)設備記錄的拓撲信息。本實施例中管理服務器與RH 環(huán)網(wǎng)設備之間的通訊方式主要包 括兩種,其中一種形式為由RH 環(huán)網(wǎng)設備主動向管理服務器通告拓撲信息,這種情況主要 發(fā)生在RH 環(huán)網(wǎng)的網(wǎng)絡狀態(tài)發(fā)生變化的情況下,即可能由于用于的配置發(fā)生修改、設備變 更或連接變更等;另外一種形式為管理服務器向環(huán)網(wǎng)設備發(fā)起查詢請求,根據(jù)該查詢請求 接收環(huán)網(wǎng)設備收集的拓撲信息,這種情況發(fā)生在由網(wǎng)管主動發(fā)起的查詢操作的情況。步驟403,管理服務器根據(jù)獲取的拓撲信息分別對單次拓撲事件的網(wǎng)絡拓撲狀態(tài) 進行分析,并生成單次故障事件的處理對策,所述單次故障事件為出現(xiàn)故障的所述單次拓 撲事件。當管理服務器通過主動查詢方式或環(huán)網(wǎng)設備主動通告方式接收到環(huán)網(wǎng)設備收集 的拓撲信息后,管理服務器將接收到的拓撲信息寫入本地的事件庫中,同時新的拓撲信息 觸發(fā)管理服務器的分析進程。在本實施例中,拓撲發(fā)生變化的事件分為兩類,一類是出現(xiàn)故 障需要進行處理,另一類是故障恢復,無需處理。因此,對于單次拓撲事件來說,需要針對單 次故障事件采用相應地對策,本實施例的單次故障事件為對單次拓撲事件進行分析時故障 出現(xiàn)相關的事件,而對于歷史事件來說,則需要進行所有事件的統(tǒng)計分析,本步驟具體為對 單次故障事件的分析處理。在本步驟中,管理服務器在執(zhí)行分析進程時,通過記錄上一次的 事件處理編號,進而識別哪些是新增事件,編號可以采用64bit編碼,理論上可以記錄2的 64次方條記錄,因此不會發(fā)生編號回繞問題。在上一次事件處理編號之后的人一個事件均 為新增事件,則管理服務器先讀取上次分析處理完的記錄編號,從事件庫中讀取該記錄編 號之后的所有記錄,然后對每個記錄逐一進行單次分析處理。管理服務器在對單次拓撲事件進行分析時,可以根據(jù)拓撲信息獲取事件的具體類 型,由于拓撲信息中已經(jīng)記錄了哪個站點的哪個span發(fā)生故障,因此再通過該span互聯(lián)的 兩個站點對應的設備的記錄,便可以定位到具體的發(fā)生故障的link。當拓撲信息指示某一 個站點發(fā)生信號失效SF事件時,管理服務器可以根據(jù)當前拓撲信息中該站點本次的拓撲 事件和該站點相鄰站點的事件記錄,對本次故障進行分類如下具體地,當根據(jù)拓撲信息檢測到該站點發(fā)生保活失效且未檢測到所述站點發(fā)生鏈 路失效時,生成單次故障事件的處理對策為與所述故障站點互聯(lián)的對端站點對應的設備很 可能出現(xiàn)故障,尤其當該對端站點對應的設備的另外一個span的互聯(lián)站點也同樣檢測到 保活超時時。例如,參照圖3,S4的westspan檢測到保活超時,S2的east span也檢測到 保活超時,則基本可以確定S3設備發(fā)生了故障,如果S3的兩側都發(fā)生保活失效,則可以建 議網(wǎng)管在排除故障之前將S3設置為直通模式以保證環(huán)網(wǎng)按閉環(huán)的方式運行。當對端站點 對應的設備未出現(xiàn)故障時,監(jiān)測站點對應的設備是否出現(xiàn)故障,可能由于該站點的保活檢 測機制出現(xiàn)了問題,如出現(xiàn)誤報的情況。具體地,當根據(jù)拓撲信息檢測到該站點發(fā)生鏈路失效且與該站點互聯(lián)的對端站點 發(fā)生鏈路失效時,生成單次故障事件的處理對策為建議網(wǎng)管重點監(jiān)測該對端站點向該站點 發(fā)送數(shù)據(jù)的鏈路是否出現(xiàn)故障。例如,參照圖3,如果S4的west span的link2檢測到SF, 而S3的east span未檢測到SF,則建議網(wǎng)管重點關注S4和S3的span中的link2是否發(fā) 生了故障。具體地,當根據(jù)拓撲信息檢測到所述站點和與所述站點互聯(lián)的對端站點均發(fā)生鏈 路失效時,生成單次故障事件的處理對策為建議網(wǎng)管重點監(jiān)測所述站點與所述對端站點之間的鏈路是否出現(xiàn)故障。例如,參照圖3,如果S4的west span的link2檢測到SF,而S3 的east span也檢測到SF,則建議網(wǎng)管重點關注S4和S3的span中的link2和linkl是否 均發(fā)生了故障。具體地,當根據(jù)拓撲信息檢測到所述站點和與所述站點互聯(lián)的對端站點均發(fā)生錯 接環(huán)時,生成單次故障事件的處理對策為修訂所述站點與所述對端站點之間線路的錯接 環(huán)。當拓撲信息指示某一個站點發(fā)生信號衰弱SD事件時,管理服務器可以根據(jù)當前 拓撲信息中該站點本次的拓撲事件和該站點相鄰站點的事件記錄,對本次故障進行分類如 下具體地,當根據(jù)拓撲信息檢測到所述站點發(fā)生線路信號衰弱且與所述站點互聯(lián)的 對端站點未檢測到發(fā)生線路信號衰弱時,生成單次故障事件的處理對策為統(tǒng)計所述站點從 所述對端站點接收到的錯誤報文的數(shù)量。當所述錯誤報文的數(shù)量與預設的錯誤報文門限值 之差小于預設的錯誤容忍量時,提高所述錯誤報文門限值,當所述錯誤報文的數(shù)量與預設 的錯誤報文門限值之差大于預設的錯誤容忍量時,對所述對端站點向所述站點發(fā)送數(shù)據(jù)的 鏈路進行更換處理,其中,所述錯誤容忍量為網(wǎng)管根據(jù)應用情況而設定的,即不同的應用情 況下網(wǎng)管的錯誤容忍量不同。例如,參照圖3,如果S4的west span的link2檢測到SD,而 S3的east span未檢測到SD,則建議網(wǎng)管重點關注S4和S3 span中的link2線路。由于 SD的告警表示這段link的信號質(zhì)量存在問題,但是有可能還能通訊,因此進一步建議網(wǎng)管 觀察S4的west span接收的數(shù)據(jù)統(tǒng)計中是否存在較多的錯誤報文,如果錯誤報文的數(shù)量與 預設的錯誤報文門限值之差小于預設的錯誤容忍量,即表明錯誤報文的數(shù)量在可容忍的范 圍內(nèi),此處的錯誤容忍量與當前的網(wǎng)絡應用相關,需要網(wǎng)管根據(jù)實際情況進行預設,則建議 網(wǎng)管提高錯誤報文門限值,即降低SD檢測的門限,然后判斷是否能排除該SD故障。如果錯 誤報文的數(shù)量與預設的錯誤報文門限值之差大于預設的錯誤容忍量,即表明錯誤報文的數(shù) 量太多而無法忍受,則建議網(wǎng)管對該link進行更換。其中,所述錯誤容忍量為網(wǎng)管根據(jù)應 用情況而設定的,即不同的應用情況下網(wǎng)管的錯誤容忍量不同。具體地,當根據(jù)拓撲信息檢測到所述站點和所述站點互聯(lián)的對端站點均發(fā)生線路 信號衰弱時,生成單次故障事件的處理對策為統(tǒng)計所述站點從所述對端站點接收到的錯誤 報文的數(shù)量以及所述對端站點從所述站點接收到的錯誤報文的數(shù)量;當所述對端站點向所 述站點發(fā)送的錯誤報文的數(shù)量與預設的第一錯誤報文門限值之差小于預設的錯誤容忍量 時,提高所述第一錯誤報文門限值之差,當所述對端站點向所述站點發(fā)送的錯誤報文的數(shù) 量與預設的第一錯誤報文門限值之差大于預設的錯誤容忍量時,對所述對端站點向所述站 點發(fā)送數(shù)據(jù)的鏈路進行更換處理;當所述站點向所述對端站點發(fā)送的錯誤報文的數(shù)量與預 設的第二錯誤報文門限值之差小于預設的錯誤容忍量時,提高所述第二錯誤報文門限值, 當所述站點向所述對端站點發(fā)送的錯誤報文的數(shù)量與預設的第二錯誤報文門限值之差大 于預設的錯誤容忍量時,對所述站點向所述對端站點發(fā)送數(shù)據(jù)的鏈路進行更換處理。例如, 參照圖3,如果S4的west span的link2檢測到SD, S3的east span也檢測到SD,則建議 網(wǎng)管重點關注S4和S3 span中的link2和linkl線路。并進一步建議網(wǎng)管觀察S4的west span接收的數(shù)據(jù)統(tǒng)計中是否存在較多的錯誤報文,如果錯誤報文的數(shù)量小于預設的錯誤容 忍量,即表明錯誤報文的數(shù)量在可容忍的范圍內(nèi),此處的錯誤容忍量與當前的網(wǎng)絡應用相關,需要網(wǎng)管根據(jù)實際情況進行預設,則建議網(wǎng)管降低SD檢測門限,即提高錯誤容忍量,然 后判斷是否能排除該SD故障。如果錯誤報文的數(shù)量大于預設的錯誤容忍量,即表明錯誤報 文的數(shù)量太多而無法忍受,則建議網(wǎng)管對相應的link進行更換。當拓撲信息指示某一個站點發(fā)生強制倒換FS或人為倒換MS事件時,管理服務器 可以根據(jù)當前拓撲信息中該站點本次的拓撲事件和該站點相鄰站點的事件記錄,對本次故 障的處理對策如下根據(jù)拓撲信息獲取所述站點中發(fā)生FS或MS事件的線路,生成單次故障 事件的處理對策為向網(wǎng)管反饋發(fā)生FS或MS事件的站點中的線路。即由于FS或MS事件只 有通過用戶配置產(chǎn)生,因此此時只需通知網(wǎng)管某個站點的某個span發(fā)生了 FS或MS事件, 請確認是否為期望的結果即可。當拓撲信息指示某一個站點發(fā)生等待恢復WTR事件時,管理服務器可以根據(jù)當前 拓撲信息中該站點本次的拓撲事件和該站點相鄰站點的事件記錄,對本次故障的處理對策 如下管理服務器先根據(jù)拓撲信息獲取所述站點對應的設備的WTR配置信息,由于WTR是一 個臨時狀態(tài),SF/SD故障恢復后先進入WTR狀態(tài),此時span依然處于edge狀態(tài),無法收發(fā) 數(shù)據(jù),當經(jīng)過一段時間(默認是10秒,最長1440秒)未發(fā)生其它高優(yōu)先級的保護事件后, 如果用戶配置了 WTR允許恢復,則WTR將恢復成IDLE狀態(tài),此時edge狀態(tài)被排除,通訊正 常。當所述WTR配置信息為WTR不可恢復時,則只需向網(wǎng)管反饋該WTR配置信息,通知網(wǎng)管 判斷該配置是否為期望的結果。當所述WTR配置信息為WTR可恢復,且在WTR恢復時間超 過預設的可恢復時間的兩倍后所述站點對應的設備仍保持WTR狀態(tài)時,生成單次故障事件 的處理對策為所述設備的軟件出現(xiàn)異常。進一步地,在保留故障內(nèi)容以便與設備廠商交流 外,還可以通過在故障span上進行MS配置、解除MS配置的操作以解決該問題。當拓撲信息指示某一個站點發(fā)生配置改變事件時,管理服務器可以根據(jù)當前拓撲 信息中該站點本次的拓撲事件和該站點相鄰站點的事件記錄,對本次故障的處理對策如 下根據(jù)拓撲信息獲取所述站點的配置改變信息,生成單次故障事件的處理對策為向網(wǎng)管 提示所述站點的配置改變信息。即向網(wǎng)管給出提示信息,表明哪些站點的哪些配置引發(fā)了 本次拓撲變化事件,由網(wǎng)管來判斷該事件的合理性。步驟404,管理服務器根據(jù)預設的關聯(lián)歷史記錄條數(shù)從所述事件庫中讀取對應數(shù) 量的所述單次拓撲事件對應的最新歷史記錄事件。當一個單次拓撲事件分析完成之后,管理服務器根據(jù)預設的關聯(lián)歷史記錄條數(shù)從 事件庫中讀取對應數(shù)量的該單次拓撲事件對應的最新歷史記錄事件,此處的關聯(lián)歷史記錄 條數(shù)可以由網(wǎng)管根據(jù)需要來設定,如設定為5,則管理服務器從事件庫中讀取5條最新歷史 記錄事件,即該單次拓撲事件的記錄編號之前的5條最新歷史記錄事件。本實施例對歷史 事件的分析與之前單次拓撲事件的分析的最大區(qū)別在于,普通的單次線路發(fā)生SF事件,例 如因施工原因將光纖挖斷,則沒有人工的干預來替換新的光纖,因此SF事件無法恢復。而 大多接觸不良引起線路SF后會在極短的時間內(nèi)自動恢復,因此僅查看當前拓撲狀態(tài)很難 察覺到該故障,需要對多個歷史記錄事件進行分析。管理服務器判斷讀取的最新歷史記錄事件的記錄編號是否連續(xù),如果是,則使用 這些最新歷史記錄事件啟動歷史數(shù)據(jù)分析進程;否則直接使用當前連續(xù)的最新歷史記錄事 件啟動歷史數(shù)據(jù)分析進程。由于網(wǎng)管可以對事件庫中的歷史數(shù)據(jù)進行查詢或刪除等操作, 則可能造成歷史數(shù)據(jù)丟失,導致歷史數(shù)據(jù)的前后關聯(lián)丟失,即出現(xiàn)記錄編號不連續(xù)的情況,
13則本實施例僅對連續(xù)編號的歷史事件進行分析,一旦發(fā)現(xiàn)編號不連續(xù),則僅分析道編號斷 點對應的歷史事件為止。如果最終發(fā)現(xiàn)連續(xù)的歷史事件僅為一條,則按照上述步驟403的 單次拓撲事件的分析方法進行分析。步驟405,管理服務器根據(jù)讀取的所述最新歷史記錄事件對歷史事件的網(wǎng)絡拓撲 狀態(tài)進行分析,并生成歷史事件的處理對策。管理服務器在對歷史事件進行分析時,可以根據(jù)拓撲信息獲取歷史記錄事件的統(tǒng) 計情況,根據(jù)歷史記錄事件的統(tǒng)計情況來進行分析處理。當最新歷史記錄事件指指示一個 站點發(fā)生SF/SF恢復事件的連續(xù)次數(shù)超過預設的第一次數(shù)閾值,或指示一個站點發(fā)生SF/ SF恢復事件的次數(shù)超過預設的第二次數(shù)閾值時,此處的第一次數(shù)閾值和第二次數(shù)閾值可以 具體由網(wǎng)管根據(jù)實際情況進行設定,如分別設定為3和5,即管理服務器根據(jù)獲取的歷史數(shù) 據(jù)獲知某個站點連續(xù)3次或以上發(fā)生SF/SF恢復(從WTR到IDLE)事件,典型地為某個站點 連續(xù)多次發(fā)生SF/SF恢復事件,且每次拓撲穩(wěn)定持續(xù)的時間均比較短,如在一個小時以內(nèi), 或獲知某個站點曾經(jīng)至少發(fā)生或5次或以上的SF/SF恢復事件。此時,管理服務器可以對 本次故障進行分類如下具體地,當根據(jù)所述最新歷史記錄事件檢測到所述SF由所述站點的鏈路無效引 起時,生成歷史事件的處理對策為所述站點對應的線路互聯(lián)的光纖線或光模塊出現(xiàn)異常。 最常見的情況是觸發(fā)多次SF的均為鏈路發(fā)生SF事件引起的,根據(jù)單次故障分析中可以知 道,SF還分單個link發(fā)生SF事件和兩個link同時發(fā)生SF事件。則管理服務器可以向網(wǎng) 管給出告警通知網(wǎng)管有可能該故障span互聯(lián)的光纖線接觸不良或光模塊異常,需要更換 光纖線或光模塊。進一步地,如果故障仍未能排除,則很可能是設備引發(fā)的故障,建議網(wǎng)管 需要通知廠商維修并提供歷史記錄供廠商人員查詢。具體地,當根據(jù)所述最新歷史記錄事件檢測到所述SF由所述站點的保活失效引 起時,生成歷史事件的處理對策為按照預設的執(zhí)行概率執(zhí)行以下對策,此處的執(zhí)行概率可 以由管理服務器自行設定,較優(yōu)地為以下述排列順序作為執(zhí)行概率的高低,即排在前面的 優(yōu)先執(zhí)行,如果之前的對策未排除故障,則繼續(xù)執(zhí)行后續(xù)的對策。建議網(wǎng)管按照執(zhí)行概率執(zhí) 行以下對策由于雙方的保護機制不兼容,則建議網(wǎng)管將一直檢測到保活失效的站點的保 活失效時間設置為最長保活失效時間;如果上一個對策不能解決問題,則建議網(wǎng)管將所述 站點對應的線路互聯(lián)的光纖線、光模塊或與所述站點互聯(lián)的對端站點的光模塊進行更換處 理;如果上一個對策不能解決問題,則建議網(wǎng)管對所述對端站點對應的設備的運行情況和 聯(lián)通性進行監(jiān)測處理,并在觀察到故障的情況下及時聯(lián)系廠商進行維修并提供對應的歷史 記錄和觀察結果。當最新歷史記錄事件指指示一個站點的兩個線路的對端站點交替地發(fā)生SF事件 或保活失效事件時,如圖3中S3的兩側相鄰站點S2和S4連續(xù)檢測到SF或保活失效事件, 管理服務器可以根據(jù)讀取的最新歷史記錄事件生成歷史事件的處理對策為按照預設的執(zhí) 行概率執(zhí)行以下對策,此處的執(zhí)行概率的解釋與上述類似,此處不再贅述管理服務器建議 網(wǎng)管對所述站點對應的設備的運行情況和聯(lián)通性進行監(jiān)測處理,在觀察到故障的情況下及 時聯(lián)系廠商進行維修并提供對應的歷史記錄和觀察結果;如果上一條對策不能解決問題, 則管理服務器建議網(wǎng)管對所述站點的兩個線路互聯(lián)的光纖線和光模塊進行更換處理。當最新歷史記錄事件指示一個站點發(fā)生FS/MS事件和FS解除事件的次數(shù)超過預設的第三次數(shù)閾值時,管理服務器可以根據(jù)讀取的最新歷史記錄事件生成歷史事件的處理 對策為檢測測試過程中使用的用戶配置腳本是否未關閉。即向網(wǎng)管給出告警并通知網(wǎng)管可 能存在某些測試過程使用的用戶配置腳本忘記關閉,在不停的進行FS/MS然后刪除FS/MS 配置,需要網(wǎng)管檢查對應的控制終端的行為。本實施例提供了一種網(wǎng)絡拓撲的分析處理方法,通過環(huán)網(wǎng)設備對網(wǎng)絡中產(chǎn)生的各 種拓撲信息進行收集處理,管理服務器接收到由環(huán)網(wǎng)設備發(fā)送的拓撲信息,根據(jù)該拓撲信 息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事件的處理對策,將處理對策反饋給網(wǎng)管,以使得 網(wǎng)管可以根據(jù)處理對策對網(wǎng)絡中的故障事件進行即時有效的處理,解決了現(xiàn)有技術中依賴 于網(wǎng)絡維護人員來分析、定位和解決網(wǎng)絡故障的缺陷,實現(xiàn)了對網(wǎng)絡拓撲事件的收集和分 析,為網(wǎng)絡維護人員提供拓撲事件的分析結果,有利于網(wǎng)管更好地維護網(wǎng)絡設備并及時地 分析解決故障,降低了對網(wǎng)絡維護人員的技術要求,提高了網(wǎng)絡的可維護性和穩(wěn)定性。本領域普通技術人員可以理解實現(xiàn)上述方法實施例的全部或部分步驟可以通過 程序指令相關的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序 在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括R0M、RAM、磁碟或者 光盤等各種可以存儲程序代碼的介質(zhì)。圖5為本發(fā)明管理服務器實施例一的結構示意圖,如圖5所示,本實施例提供了一 種管理服務器,可以具體執(zhí)行上述方法實施例一的各個步驟,此處不再贅述。本實施例提供 的管理服務器可以具體包括接收模塊501、寫入模塊502和分析模塊503。其中,接收模塊 501用于接收環(huán)網(wǎng)設備收集的網(wǎng)絡中產(chǎn)生的拓撲信息。寫入模塊502用于將所述拓撲信息 寫入事件庫中。分析模塊503用于根據(jù)所述拓撲信息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故 障事件的處理對策。圖6為本發(fā)明管理服務器實施例二的結構示意圖,如圖6所示,本實施例提供了 一 種管理服務器,可以具體執(zhí)行上述方法實施例二的各個步驟,此處不再贅述。本實施例提供 的管理服務器在上述圖5所示的基礎之上,分析模塊503可以具體包括第一分析單元513、 讀取單元523和第二分析單元533。其中,第一分析單元513用于根據(jù)獲取的拓撲信息分別 對單次拓撲事件的網(wǎng)絡拓撲狀態(tài)進行分析,并生成單次故障事件的處理對策,所述單次故 障事件為出現(xiàn)故障的所述單次拓撲事件。讀取單元523用于根據(jù)預設的關聯(lián)歷史記錄條數(shù) 從所述事件庫中讀取對應數(shù)量的所述單次拓撲事件對應的最新歷史記錄事件。第二分析單 元533用于根據(jù)讀取的所述最新歷史記錄事件對歷史事件的網(wǎng)絡拓撲狀態(tài)進行分析,并生 成歷史事件的處理對策。進一步地,當所述拓撲信息指示一個站點發(fā)生信號失效SF事件時,第一分析單元 513可以具體包括第一對策生成子單元5131、第二對策生成子單元5132、第三對策生成子 單元5133和第四對策生成子單元5134。其中,第一對策生成子單元5131用于當根據(jù)拓撲 信息檢測到所述站點發(fā)生保活失效且未檢測到所述站點發(fā)生鏈路失效時,生成單次故障事 件的處理對策為監(jiān)測與所述站點互聯(lián)的對端站點對應的設備是否出現(xiàn)故障,且當所述對端 站點對應的設備未出現(xiàn)故障時,監(jiān)測所述站點對應的設備是否出現(xiàn)故障。第二對策生成子 單元5132用于當根據(jù)拓撲信息檢測到所述站點發(fā)生鏈路失效且與所述站點互聯(lián)的對端站 點發(fā)生鏈路失效時,生成單次故障事件的處理對策為監(jiān)測所述對端站點向所述站點發(fā)送數(shù) 據(jù)的鏈路是否出現(xiàn)故障。第三對策生成子單元5133用于當根據(jù)拓撲信息檢測到所述站點
15和與所述站點互聯(lián)的對端站點均發(fā)生鏈路失效時,生成單次故障事件的處理對策為監(jiān)測所 述站點與所述對端站點之間的鏈路是否出現(xiàn)故障。第四對策生成子單元5134用于當根據(jù) 拓撲信息檢測到所述站點和與所述站點互聯(lián)的對端站點均發(fā)生錯接環(huán)時,生成單次故障事 件的處理對策為修訂所述站點與所述對端站點之間線路的錯接環(huán)。或者,當所述拓撲信息指示一個站點發(fā)生信號衰弱SD事件時,第一分析單元513 可以具體包括第五對策生成子單元5135和第六對策生成子單元5136。其中,第五對策生 成子單元5135用于當根據(jù)拓撲信息檢測到所述站點發(fā)生線路信號衰弱且與所述站點互聯(lián) 的對端站點未檢測到發(fā)生線路信號衰弱時,生成單次故障事件的處理對策為統(tǒng)計所述站點 從所述對端站點接收到的錯誤報文的數(shù)量;當所述錯誤報文的數(shù)量與預設的錯誤報文門限 值之差小于預設的錯誤容忍量時,提高所述錯誤報文門限值,當所述錯誤報文的數(shù)量與預 設的錯誤報文門限值之差大于預設的錯誤容忍量時,對所述對端站點向所述站點發(fā)送數(shù)據(jù) 的鏈路進行更換處理,其中,所述錯誤容忍量為根據(jù)應用情況而設定的。第六對策生成子單 元5136用于當根據(jù)拓撲信息檢測到所述站點和所述站點互聯(lián)的對端站點均發(fā)生線路信號 衰弱時,生成單次故障事件的處理對策為統(tǒng)計所述站點從所述對端站點接收到的錯誤報文 的數(shù)量以及所述對端站點從所述站點接收到的錯誤報文的數(shù)量;當所述對端站點向所述站 點發(fā)送的錯誤報文的數(shù)量與預設的第一錯誤報文門限值之差小于預設的錯誤容忍量時,提 高所述第一錯誤報文門限值,當所述對端站點向所述站點發(fā)送的錯誤報文的數(shù)量與預設的 第一錯誤報文門限值之差大于預設的錯誤容忍量時,對所述對端站點向所述站點發(fā)送數(shù)據(jù) 的鏈路進行更換處理;當所述站點向所述對端站點發(fā)送的錯誤報文的數(shù)量與預設的第二錯 誤報文門限值之差小于預設的錯誤容忍量時,提高所述第二錯誤報文門限值,當所述站點 向所述對端站點發(fā)送的錯誤報文的數(shù)量與預設的第二錯誤報文門限值之差大于預設的錯 誤容忍量時,對所述站點向所述對端站點發(fā)送數(shù)據(jù)的鏈路進行更換處理,其中,所述錯誤容 忍量為根據(jù)應用情況而設定的。或者,當所述拓撲信息指示一個站點發(fā)生強制倒換FS或人為倒換MS事件時,第一 分析單元513可以具體包括第七對策生成子單元5137,第七對策生成子單元5137用于根據(jù) 拓撲信息獲取所述站點中發(fā)生FS或MS事件的線路,生成單次故障事件的處理對策為向網(wǎng) 管反饋發(fā)生FS或MS事件的站點中的線路。或者,當所述拓撲信息指示一個站點發(fā)生等待恢復WTR事件時,第一分析單元513 可以具體包括獲取子單元5138、第八對策生成子單元5139和第九對策生成子單元5231。其 中,獲取子單元5138用于根據(jù)拓撲信息獲取所述站點對應的設備的WTR配置信息。第八對 策生成子單元5139用于當所述WTR配置信息為WTR不可恢復時,生成單次故障事件的處理 對策為向網(wǎng)管反饋所述WTR配置信息。第九對策生成子單元5231用于當所述WTR配置信 息為WTR可恢復,且在WTR恢復時間超過預設的可恢復時間的兩倍后所述站點對應的設備 仍保持WTR狀態(tài)時,生成單次故障事件的處理對策為所述設備的軟件出現(xiàn)異常。或者,當所述拓撲信息指示一個站點發(fā)生配置改變事件時,第一分析單元513可 以具體包括第十對策生成子單元5232,第十對策生成子單元5232用于根據(jù)拓撲信息獲取 所述站點的配置改變信息,生成單次故障事件的處理對策為向網(wǎng)管提示所述站點的配置改 變{曰息。更進一步地,當所述最新歷史記錄事件指示一個站點發(fā)生SF/SF恢復事件的連續(xù)次數(shù)超過預設的第一次數(shù)閾值,或指示一個站點發(fā)生SF/SF恢復事件的次數(shù)超過預設的第 二次數(shù)閾值時,第二分析單元533可以具體包括第一歷史對策生成子單元5331和第二歷史 對策生成子單元5332。其中,第一歷史對策生成子單元5331用于當根據(jù)所述最新歷史記錄 事件檢測到所述SF由所述站點的鏈路無效引起時,生成歷史事件的處理對策為所述站點 對應的線路互聯(lián)的光纖線或光模塊出現(xiàn)異常。第二歷史對策生成子單元5332用于當根據(jù) 所述最新歷史記錄事件檢測到所述SF由所述站點的保活失效引起時,生成歷史事件的處 理對策為按照預設的執(zhí)行概率執(zhí)行以下對策將所述站點的保活失效時間設置為最長保活 失效時間;將所述站點對應的線路互聯(lián)的光纖線、光模塊或與所述站點互聯(lián)的對端站點的 光模塊進行更換處理;對所述對端站點對應的設備的運行情況和聯(lián)通性進行監(jiān)測處理。或者,當所述最新歷史記錄事件指示一個站點的兩個線路的對端站點交替地發(fā) 生SF事件或保活失效事件時,第二分析單元533可以具體包括第三歷史對策生成子單元 5333,第三歷史對策生成子單元5333用于根據(jù)讀取的最新歷史記錄事件生成歷史事件的 處理對策為按照預設的執(zhí)行概率執(zhí)行以下對策對所述站點對應的設備的運行情況和聯(lián)通 性進行監(jiān)測處理;對所述站點的兩個線路互聯(lián)的光纖線和光模塊進行更換處理。或者,當所述最新歷史記錄事件指示一個站點發(fā)生FS/MS事件和FS解除事件的次 數(shù)超過預設的第三次數(shù)閾值時,第二分析單元533可以具體包括第四歷史對策生成子單元 5334,第四歷史對策生成子單元5334用于根據(jù)讀取的最新歷史記錄事件生成歷史事件的 處理對策為檢測測試過程中使用的用戶配置腳本是否未關閉。本實施例提供了一種管理服務器,通過環(huán)網(wǎng)設備對網(wǎng)絡中產(chǎn)生的各種拓撲信息進 行收集處理,管理服務器接收到由環(huán)網(wǎng)設備發(fā)送的拓撲信息,根據(jù)該拓撲信息對網(wǎng)絡拓撲 狀態(tài)進行分析,并生成故障事件的處理對策,將處理對策反饋給網(wǎng)管,以使得網(wǎng)管可以根據(jù) 處理對策對網(wǎng)絡中的故障事件進行即時有效的處理,解決了現(xiàn)有技術中依賴于網(wǎng)絡維護人 員來分析、定位和解決網(wǎng)絡故障的缺陷,實現(xiàn)了對網(wǎng)絡拓撲事件的收集和分析,為網(wǎng)絡維護 人員提供拓撲事件的分析結果,有利于網(wǎng)管更好地維護網(wǎng)絡設備并及時地分析解決故障, 降低了對網(wǎng)絡維護人員的技術要求,提高了網(wǎng)絡的可維護性和穩(wěn)定性。本實施例還提供了一種網(wǎng)絡拓撲的分析處理系統(tǒng),具體可以包括多個環(huán)網(wǎng)設備和 上述圖5或圖6所示的管理服務器。最后應說明的是以上實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡 管參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解其依然 可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替 換;而這些修改或者替換,并不使相應技術方案的本質(zhì)脫離本發(fā)明各實施例技術方案的精 神和范圍。
1權利要求
一種網(wǎng)絡拓撲的分析處理方法,其特征在于,包括接收環(huán)網(wǎng)設備收集的網(wǎng)絡中產(chǎn)生的拓撲信息,并將所述拓撲信息寫入事件庫中;根據(jù)所述拓撲信息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事件的處理對策。
2.根據(jù)權利要求1所述的方法,其特征在于,所述拓撲信息包括本次拓撲發(fā)生變化的 時間、本次拓撲穩(wěn)定的時間、本次拓撲持續(xù)穩(wěn)定的時間、上一次拓撲最終持續(xù)穩(wěn)定的時間、 本次拓撲發(fā)生變化的直接原因、本次發(fā)生拓撲變化的根源站點的拓撲變化的真實事件、本 次發(fā)生拓撲變化的站點和所述站點與網(wǎng)絡中其余站點的相對位置,以及當前網(wǎng)絡中存在的 缺陷指示。
3.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述拓撲信息對網(wǎng)絡拓撲狀態(tài) 進行分析,并生成故障事件的處理對策包括根據(jù)獲取的拓撲信息分別對單次拓撲事件的網(wǎng)絡拓撲狀態(tài)進行分析,并生成單次故障 事件的處理對策,所述單次故障事件為出現(xiàn)故障的所述單次拓撲事件;根據(jù)預設的關聯(lián)歷史記錄條數(shù)從所述事件庫中讀取對應數(shù)量的所述單次拓撲事件對 應的最新歷史記錄事件;根據(jù)讀取的所述最新歷史記錄事件對歷史事件的網(wǎng)絡拓撲狀態(tài)進行分析,并生成歷史 事件的處理對策。
4.根據(jù)權利要求3所述的方法,其特征在于,當所述拓撲信息指示一個站點發(fā)生信號 失效SF事件時,所述根據(jù)獲取的拓撲信息分別對單次拓撲事件的網(wǎng)絡拓撲狀態(tài)進行分析, 并生成單次故障事件的處理對策包括當根據(jù)拓撲信息檢測到所述站點發(fā)生保活失效且未檢測到所述站點發(fā)生鏈路失效 時,生成單次故障事件的處理對策為監(jiān)測與所述站點互聯(lián)的對端站點對應的設備是否出現(xiàn) 故障,且當所述對端站點對應的設備未出現(xiàn)故障時,監(jiān)測所述站點對應的設備是否出現(xiàn)故 障;當根據(jù)拓撲信息檢測到所述站點發(fā)生鏈路失效且與所述站點互聯(lián)的對端站點發(fā)生鏈 路失效時,生成單次故障事件的處理對策為監(jiān)測所述對端站點向所述站點發(fā)送數(shù)據(jù)的鏈路 是否出現(xiàn)故障;當根據(jù)拓撲信息檢測到所述站點和與所述站點互聯(lián)的對端站點均發(fā)生鏈路失效時,生 成單次故障事件的處理對策為監(jiān)測所述站點與所述對端站點之間的鏈路是否出現(xiàn)故障;當根據(jù)拓撲信息檢測到所述站點和與所述站點互聯(lián)的對端站點均發(fā)生錯接環(huán)時,生成 單次故障事件的處理對策為修訂所述站點與所述對端站點之間線路的錯接環(huán)。
5.根據(jù)權利要求3所述的方法,其特征在于,當所述拓撲信息指示一個站點發(fā)生信號 衰弱SD事件時,所述根據(jù)獲取的拓撲信息分別對單次拓撲事件的網(wǎng)絡拓撲狀態(tài)進行分析, 并生成單次故障事件的處理對策包括當根據(jù)拓撲信息檢測到所述站點發(fā)生線路信號衰弱且與所述站點互聯(lián)的對端站點未 檢測到發(fā)生線路信號衰弱時,生成單次故障事件的處理對策為統(tǒng)計所述站點從所述對端站 點接收到的錯誤報文的數(shù)量;當所述錯誤報文的數(shù)量與預設的錯誤報文門限值之差小于預 設的錯誤容忍量時,提高所述錯誤報文門限值,當所述錯誤報文的數(shù)量與預設的錯誤報文 門限值之差大于預設的錯誤容忍量時,對所述對端站點向所述站點發(fā)送數(shù)據(jù)的鏈路進行更 換處理,其中,所述錯誤容忍量為根據(jù)應用情況而設定的;當根據(jù)拓撲信息檢測到所述站點和所述站點互聯(lián)的對端站點均發(fā)生線路信號衰弱時, 生成單次故障事件的處理對策為統(tǒng)計所述站點從所述對端站點接收到的錯誤報文的數(shù)量 以及所述對端站點從所述站點接收到的錯誤報文的數(shù)量;當所述對端站點向所述站點發(fā)送 的錯誤報文的數(shù)量與預設的第一錯誤報文門限值之差小于預設的錯誤容忍量時,提高所述 第一錯誤報文門限值,當所述對端站點向所述站點發(fā)送的錯誤報文的數(shù)量與預設的第一錯 誤報文門限值之差大于預設的錯誤容忍量時,對所述對端站點向所述站點發(fā)送數(shù)據(jù)的鏈路 進行更換處理;當所述站點向所述對端站點發(fā)送的錯誤報文的數(shù)量與預設的第二錯誤報文 門限值之差小于預設的錯誤容忍量時,提高所述第二錯誤報文門限值,當所述站點向所述 對端站點發(fā)送的錯誤報文的數(shù)量與預設的第二錯誤報文門限值之差大于預設的錯誤容忍 量時,對所述站點向所述對端站點發(fā)送數(shù)據(jù)的鏈路進行更換處理,其中,所述錯誤容忍量為 根據(jù)應用情況而設定的。
6.根據(jù)權利要求3所述的方法,其特征在于,當所述拓撲信息指示一個站點發(fā)生強制 倒換FS或人為倒換MS事件時,所述根據(jù)獲取的拓撲信息分別對單次拓撲事件的網(wǎng)絡拓撲 狀態(tài)進行分析,并生成單次故障事件的處理對策包括根據(jù)拓撲信息獲取所述站點中發(fā)生FS或MS事件的線路,生成單次故障事件的處理對 策為向網(wǎng)管反饋發(fā)生FS或MS事件的站點中的線路。
7.根據(jù)權利要求3所述的方法,其特征在于,當所述拓撲信息指示一個站點發(fā)生等待 恢復WTR事件時,所述根據(jù)獲取的拓撲信息分別對單次拓撲事件的網(wǎng)絡拓撲狀態(tài)進行分 析,并生成單次故障事件的處理對策包括根據(jù)拓撲信息獲取所述站點對應的設備的WTR配置信息;當所述WTR配置信息為WTR不可恢復時,生成單次故障事件的處理對策為向網(wǎng)管反饋 所述WTR配置信息;當所述WTR配置信息為WTR可恢復,且在WTR恢復時間超過預設的可恢復時間的兩倍 后所述站點對應的設備仍保持WTR狀態(tài)時,生成單次故障事件的處理對策為所述設備的軟 件出現(xiàn)異常。
8.根據(jù)權利要求3所述的方法,其特征在于,當所述拓撲信息指示一個站點發(fā)生配置 改變事件時,所述根據(jù)獲取的拓撲信息分別對單次拓撲事件的網(wǎng)絡拓撲狀態(tài)進行分析,并 生成單次故障事件的處理對策包括根據(jù)拓撲信息獲取所述站點的配置改變信息,生成單次故障事件的處理對策為向網(wǎng)管 提示所述站點的配置改變信息。
9.根據(jù)權利要求3-8中任一項所述的方法,其特征在于,當所述最新歷史記錄事件指 示一個站點發(fā)生SF/SF恢復事件的連續(xù)次數(shù)超過預設的第一次數(shù)閾值,或指示一個站點發(fā) 生SF/SF恢復事件的次數(shù)超過預設的第二次數(shù)閾值時,所述根據(jù)讀取的所述最新歷史記錄 事件對歷史事件的網(wǎng)絡拓撲狀態(tài)進行分析,并生成歷史事件的處理對策包括當根據(jù)所述最新歷史記錄事件檢測到所述SF由所述站點的鏈路無效引起時,生成歷 史事件的處理對策為所述站點對應的線路互聯(lián)的光纖線或光模塊出現(xiàn)異常;當根據(jù)所述最新歷史記錄事件檢測到所述SF由所述站點的保活失效引起時,生成歷 史事件的處理對策為按照預設的執(zhí)行概率執(zhí)行以下對策將所述站點的保活失效時間設置 為最長保活失效時間;將所述站點對應的線路互聯(lián)的光纖線、光模塊或與所述站點互聯(lián)的對端站點的光模塊進行更換處理;對所述對端站點對應的設備的運行情況和聯(lián)通性進行監(jiān) 測處理。
10.根據(jù)權利要求3-8中任一項所述的方法,其特征在于,當所述最新歷史記錄事件指 示一個站點的兩個線路的對端站點交替地發(fā)生SF事件或保活失效事件時,所述根據(jù)讀取 的所述最新歷史記錄事件對歷史事件的網(wǎng)絡拓撲狀態(tài)進行分析,并生成歷史事件的處理對 策包括根據(jù)讀取的最新歷史記錄事件生成歷史事件的處理對策為按照預設的執(zhí)行概率執(zhí)行 以下對策對所述站點對應的設備的運行情況和聯(lián)通性進行監(jiān)測處理;對所述站點的兩個 線路互聯(lián)的光纖線和光模塊進行更換處理。
11.根據(jù)權利要求3-8中任一項所述的方法,其特征在于,當所述最新歷史記錄事件指 示一個站點發(fā)生FS/MS事件和FS解除事件的次數(shù)超過預設的第三次數(shù)閾值時,所述根據(jù)讀 取的所述最新歷史記錄事件對歷史事件的網(wǎng)絡拓撲狀態(tài)進行分析,并生成歷史事件的處理 對策包括根據(jù)讀取的最新歷史記錄事件生成歷史事件的處理對策為檢測測試過程中使用的用 戶配置腳本是否未關閉。
12.—種管理服務器,其特征在于,包括接收模塊,用于接收環(huán)網(wǎng)設備收集的網(wǎng)絡中產(chǎn)生的拓撲信息;寫入模塊,用于將所述拓撲信息寫入事件庫中;分析模塊,用于根據(jù)所述拓撲信息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事件的處理 對策。
13.根據(jù)權利要求12所述的管理服務器,其特征在于,所述分析模塊包括第一分析單元,用于根據(jù)獲取的拓撲信息分別對單次拓撲事件的網(wǎng)絡拓撲狀態(tài)進行 分析,并生成單次故障事件的處理對策,所述單次故障事件為出現(xiàn)故障的所述單次拓撲事 件;讀取單元,用于根據(jù)預設的關聯(lián)歷史記錄條數(shù)從所述事件庫中讀取對應數(shù)量的所述單 次拓撲事件對應的最新歷史記錄事件;第二分析單元,用于根據(jù)讀取的所述最新歷史記錄事件對歷史事件的網(wǎng)絡拓撲狀態(tài)進 行分析,并生成歷史事件的處理對策。
14.根據(jù)權利要求13所述的管理服務器,其特征在于,當所述拓撲信息指示一個站點 發(fā)生信號失效SF事件時,所述第一分析單元包括第一對策生成子單元,用于當根據(jù)拓撲信息檢測到所述站點發(fā)生保活失效且未檢測到 所述站點發(fā)生鏈路失效時,生成單次故障事件的處理對策為監(jiān)測與所述站點互聯(lián)的對端站 點對應的設備是否出現(xiàn)故障,且當所述對端站點對應的設備未出現(xiàn)故障時,監(jiān)測所述站點 對應的設備是否出現(xiàn)故障;第二對策生成子單元,用于當根據(jù)拓撲信息檢測到所述站點發(fā)生鏈路失效且與所述站 點互聯(lián)的對端站點發(fā)生鏈路失效時,生成單次故障事件的處理對策為監(jiān)測所述對端站點向 所述站點發(fā)送數(shù)據(jù)的鏈路是否出現(xiàn)故障;第三對策生成子單元,用于當根據(jù)拓撲信息檢測到所述站點和與所述站點互聯(lián)的對端 站點均發(fā)生鏈路失效時,生成單次故障事件的處理對策為監(jiān)測所述站點與所述對端站點之間的鏈路是否出現(xiàn)故障;第四對策生成子單元,用于當根據(jù)拓撲信息檢測到所述站點和與所述站點互聯(lián)的對端 站點均發(fā)生錯接環(huán)時,生成單次故障事件的處理對策為修訂所述站點與所述對端站點之間 線路的錯接環(huán)。
15.根據(jù)權利要求13所述的管理服務器,其特征在于,當所述拓撲信息指示一個站點 發(fā)生信號衰弱SD事件時,所述第一分析單元包括第五對策生成子單元,用于當根據(jù)拓撲信息檢測到所述站點發(fā)生線路信號衰弱且與所 述站點互聯(lián)的對端站點未檢測到發(fā)生線路信號衰弱時,生成單次故障事件的處理對策為統(tǒng) 計所述站點從所述對端站點接收到的錯誤報文的數(shù)量;當所述錯誤報文的數(shù)量與預設的錯 誤報文門限值之差小于預設的錯誤容忍量時,提高所述錯誤報文門限值,當所述錯誤報文 的數(shù)量與預設的錯誤報文門限值之差大于預設的錯誤容忍量時,對所述對端站點向所述站 點發(fā)送數(shù)據(jù)的鏈路進行更換處理,其中,所述錯誤容忍量為根據(jù)應用情況而設定的;第六對策生成子單元,用于當根據(jù)拓撲信息檢測到所述站點和所述站點互聯(lián)的對端站 點均發(fā)生線路信號衰弱時,生成單次故障事件的處理對策為統(tǒng)計所述站點從所述對端站點 接收到的錯誤報文的數(shù)量以及所述對端站點從所述站點接收到的錯誤報文的數(shù)量;當所述 對端站點向所述站點發(fā)送的錯誤報文的數(shù)量與預設的第一錯誤報文門限值之差小于預設 的錯誤容忍量時,提高所述第一錯誤報文門限值,當所述對端站點向所述站點發(fā)送的錯誤 報文的數(shù)量與預設的第一錯誤報文門限值之差大于預設的錯誤容忍量時,對所述對端站點 向所述站點發(fā)送數(shù)據(jù)的鏈路進行更換處理;當所述站點向所述對端站點發(fā)送的錯誤報文 的數(shù)量與預設的第二錯誤報文門限值之差小于預設的錯誤容忍量時,提高所述第二錯誤報 文門限值,當所述站點向所述對端站點發(fā)送的錯誤報文的數(shù)量與預設的第二錯誤報文門限 值之差大于預設的錯誤容忍量時,對所述站點向所述對端站點發(fā)送數(shù)據(jù)的鏈路進行更換處 理,其中,所述錯誤容忍量為根據(jù)應用情況而設定的。
16.根據(jù)權利要求13所述的管理服務器,其特征在于,當所述拓撲信息指示一個站點 發(fā)生強制倒換FS或人為倒換MS事件時,所述第一分析單元包括第七對策生成子單元,用于根據(jù)拓撲信息獲取所述站點中發(fā)生FS或MS事件的線路,生 成單次故障事件的處理對策為向網(wǎng)管反饋發(fā)生FS或MS事件的站點中的線路。
17.根據(jù)權利要求13所述的管理服務器,其特征在于,當所述拓撲信息指示一個站點 發(fā)生等待恢復WTR事件時,所述第一分析單元包括獲取子單元,用于根據(jù)拓撲信息獲取所述站點對應的設備的WTR配置信息;第八對策生成子單元,用于當所述WTR配置信息為WTR不可恢復時,生成單次故障事件 的處理對策為向網(wǎng)管反饋所述WTR配置信息;第九對策生成子單元,用于當所述WTR配置信息為WTR可恢復,且在WTR恢復時間超過 預設的可恢復時間的兩倍后所述站點對應的設備仍保持WTR狀態(tài)時,生成單次故障事件的 處理對策為所述設備的軟件出現(xiàn)異常。
18.根據(jù)權利要求13所述的管理服務器,其特征在于,當所述拓撲信息指示一個站點 發(fā)生配置改變事件時,所述第一分析單元包括第十對策生成子單元,用于根據(jù)拓撲信息獲取所述站點的配置改變信息,生成單次故 障事件的處理對策為向網(wǎng)管提示所述站點的配置改變信息。
19.根據(jù)權利要求13-18中任一項所述的管理服務器,其特征在于,當所述最新歷史記 錄事件指示一個站點發(fā)生SF/SF恢復事件的連續(xù)次數(shù)超過預設的第一次數(shù)閾值,或指示一 個站點發(fā)生SF/SF恢復事件的次數(shù)超過預設的第二次數(shù)閾值時,所述第二分析單元包括第一歷史對策生成子單元,用于當根據(jù)所述最新歷史記錄事件檢測到所述SF由所述 站點的鏈路無效引起時,生成歷史事件的處理對策為所述站點對應的線路互聯(lián)的光纖線或 光模塊出現(xiàn)異常;第二歷史對策生成子單元,用于當根據(jù)所述最新歷史記錄事件檢測到所述SF由所述 站點的保活失效引起時,生成歷史事件的處理對策為按照預設的執(zhí)行概率執(zhí)行以下對策 將所述站點的保活失效時間設置為最長保活失效時間;將所述站點對應的線路互聯(lián)的光纖 線、光模塊或與所述站點互聯(lián)的對端站點的光模塊進行更換處理;對所述對端站點對應的 設備的運行情況和聯(lián)通性進行監(jiān)測處理。
20.根據(jù)權利要求13-18中任一項所述的管理服務器,其特征在于,當所述最新歷史記 錄事件指示一個站點的兩個線路的對端站點交替地發(fā)生SF事件或保活失效事件時,所述 第二分析單元包括第三歷史對策生成子單元,用于根據(jù)讀取的最新歷史記錄事件生成歷史事件的處理對 策為按照預設的執(zhí)行概率執(zhí)行以下對策對所述站點對應的設備的運行情況和聯(lián)通性進行 監(jiān)測處理;對所述站點的兩個線路互聯(lián)的光纖線和光模塊進行更換處理。
21.根據(jù)權利要求13-18中任一項所述的管理服務器,其特征在于,當所述最新歷史記 錄事件指示一個站點發(fā)生FS/MS事件和FS解除事件的次數(shù)超過預設的第三次數(shù)閾值時,所 述第二分析單元包括第四歷史對策生成子單元,用于根據(jù)讀取的最新歷史記錄事件生成歷史事件的處理對 策為檢測測試過程中使用的用戶配置腳本是否未關閉。
22.—種網(wǎng)絡拓撲的分析處理系統(tǒng),其特征在于,包括多個環(huán)網(wǎng)設備和根據(jù)權利要求 12-21中任一項所述的管理服務器。
全文摘要
本發(fā)明提供一種網(wǎng)絡拓撲的分析處理方法、系統(tǒng)和管理服務器,其中,方法包括接收環(huán)網(wǎng)設備收集的網(wǎng)絡中產(chǎn)生的拓撲信息,并將拓撲信息寫入事件庫中;根據(jù)拓撲信息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事件的處理對策。管理服務器包括接收模塊,用于接收環(huán)網(wǎng)設備收集的網(wǎng)絡中產(chǎn)生的拓撲信息;寫入模塊,用于將拓撲信息寫入事件庫中;分析模塊,用于根據(jù)拓撲信息對網(wǎng)絡拓撲狀態(tài)進行分析,并生成故障事件的處理對策。網(wǎng)絡拓撲的分析處理系統(tǒng)包括多個環(huán)網(wǎng)設備和上述管理服務器。本發(fā)明實施例實現(xiàn)了對網(wǎng)絡拓撲事件的收集和分析,為網(wǎng)絡維護人員提供拓撲事件的分析結果,降低了對網(wǎng)絡維護人員的技術要求,提高了網(wǎng)絡的可維護性和穩(wěn)定性。
文檔編號H04L12/26GK101854263SQ20101020844
公開日2010年10月6日 申請日期2010年6月13日 優(yōu)先權日2010年6月13日
發(fā)明者吳航 申請人:北京星網(wǎng)銳捷網(wǎng)絡技術有限公司