麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

電力系統終端通信接入網告警集中監控系統及方法與流程

文檔序號:11291995閱讀:1518來源:國知局
電力系統終端通信接入網告警集中監控系統及方法與流程

本發明涉及電力系統終端通信接入網告警集中監控系統及方法。



背景技術:

終端通信接入網是面向配電、用電數據采集、電力光纖到戶、電力營銷、用電互動等環節所建立的通信接入網絡,由于終端通信接入網具有技術體制多樣、廠家型號類型繁多、業務應用需求各異的特點,從根本上加大了終端通信接入網的運維和管理難度。目前在實際運維工作中,接入網通信監控以及故障處理主要依賴業務部門申告和多套設備網管告警監視,告警監視難以做到全覆蓋集中管理,故障分析和協同處理較為被動。

通信監盤的目的是通過實時監視電力通信網的運行狀態盡早發現電力通信網運行中的故障與隱患,以便于及時采取相關措施對故障進行隔離和處置,減少網絡故障對承載業務的影響。通信監盤的手段雖然包括告警監視、性能監視、事件監視和自動巡檢等,但由于大部分通信設備本身已建立了相對完善的故障檢測機制,故障的發生通常會引發設備的一系列告警,因此通信調度員在監視網絡運行狀態時常將告警監視作為發現故障的主要手段。

由于通信設備的容錯機制和故障預警機制使得設備產生的告警數量遠大于實際發生的故障數量,真正反映故障發生的有效告警通常被淹沒在海量的提示性告警信息中難以辨識。而且,電力通信網的檢修、方式等工程施工時,也會引發通信設備的大量告警,這類告警并非由于網絡設備故障產生,對于分析故障不但不具備參考意義,反而會分散和干擾運維人員的注意力。此外,不同設備廠家、不同版本的設備網管北向接口在告警的定義、分類、分級和描述等方面也存在巨大的差異,甚至連所使用的語言都不統一,增加了告警閱讀與分析的難度,而且不利于告警處理經驗的積累、提煉和交流。

通信調度員在通信監盤工作過程中,需要憑借通信管理系統提供的各種告警分析功能和積累的工作經驗及時從海量告警信息中甄別出有價值的告警信息進行分析定性,最終診斷出網絡運行中的故障與潛在隱患。



技術實現要素:

本發明的目的就是為了解決上述問題,提供電力系統終端通信接入網告警集中監控系統及方法,接入網實施監視,實現在設備網管基礎上,通過進一步擴展通信網絡的監視范圍,整合通信設備的各種管理信息和實時信息,為通信運行和管理人員提供更全面、完整的通信運行監視視圖,實現在統一的界面下對多廠商設備運行狀態的集中監視,實現面向業務的告警分析和故障處理,為通信調度提供技術手段。

為了實現上述目的,本發明采用如下技術方案:

電力系統終端通信接入網告警集中監控系統,包括:

告警采集模塊,用于接收各設備網管系統上報的實時告警消息,將設備網管系統的實時告警信息同步給告警處理器模塊,為告警的監視和處理提供數據源;

告警預處理模塊,用于對采集的告警信息進行歸一化處理和分類壓縮,減少無效告警對告警監視的干擾;

告警監視模塊,用于在告警操作臺和網絡拓撲圖上實時展示預處理后的各類告警信息,以及將重要告警通過短信、郵件和站內消息手段前轉給運維人員重點關注;

故障診斷模塊,用于依據告警處理經驗庫中的經驗對告警進行分析診斷和定性,識別引發告警的各類可能故障原因,并提供故障排查向導指導運維人員逐步確定故障點與故障原因;

故障處理調度模塊,用于依據故障診斷的結果定位故障點的地理位置及責任運維班組,并采用自動與手動相結合的方式派發缺陷處理工單,調度相關運維班組開展缺陷故障的排除工作。

所述告警采集模塊,包括:

協議適配器,用于實現與各設備網管北向接口之間協議適配工作,包括與設備網管北向接口的連接建立與維護、設備廠家原始告警報文的解析和標準告警報文的生成;

采集框架服務單元,用于對將協議轉換后的標準告警報文傳輸給告警接收服務單元;

告警接收服務單元,用于實時接收和解析采集框架服務單元傳輸過來的標準告警報文;

告警同步服務單元,按照告警同步觸發策略主動發起對設備網管系統當前活躍告警列表的同步;告警同步觸發策略支持定期觸發和事件觸發兩種,同步的范圍支持對全部設備網管的同步和對指定設備網管的同步兩種。

所述告警預處理模塊,包括:

告警標準化規則庫維護單元,用于告警標準化規則庫的維護與使用,包括告警標準化規則的創建、修改、查看、刪除和查詢;查詢時設置的查詢條件,包括:設備廠家名稱、廠家告警等級、廠家告警原因、廠家告警類型、標準告警等級、標準告警原因或標準告警類型;

工程告警識別單元,用于根據工單數據,自動識別出工程施工所引發的告警,識別出施工資源對象和關聯工單編號;

根告警分析單元,根據設定的根告警分析規則分析告警之間的衍生關系,將分析后的告警分為三類:根告警、衍生告警和待分析告警;根告警是能直接反映故障原因的告警;待分析告警為因設定的根告警分析規則未覆蓋而無法判斷是否為根告警的告警,提示用戶重點關注;衍生告警是指當網絡中設備發生故障時,故障設備以及與故障設備存在關聯關系的其他網絡設備所產生的間接反映故障各種影響的告警,這類告警與直接反映故障原因的根告警相對應,伴隨根告警產生。

告警數據清洗單元,用于去除重復告警和頻閃告警;重復告警是內容完全相同的告警;頻閃告警是在設定的時間范圍內多次交替收到某個告警產生和清除的消息;

告警重定義單元,用于根據告警標準化規則對采集的告警信息進行歸一化處理,重定義的內容包括告警等級、告警原因和告警類型。

所述告警監視模塊,包括:

告警集中監視單元,用于將通信網絡和設備告警信息通過列表的形式進行集中匯總展現,實現對通信網絡運行實時狀態的集中監視和管理;

網絡運行狀態監視單元,用于對網絡運行狀態進行監視;

告警訂閱單元,用于用戶對告警狀態進行訂閱;

告警前轉單元,用于將告警狀態通過短信或郵件形式前轉給工作人員;

告警推送單元,用于將告警狀態推送給用戶;

告警狀態計算服務單元,用于負責對告警預處理后的實時告警數據集合進行及時資源影響狀態計算,計算內容包括:資源告警累計計數計算、資源告警累計等級計算和資源確認告警累計計數計算三類,計算內容存入內存庫并通過統一接口提供相關服務調用,所述資源告警累計計數:資源及其子資源的告警總數累加值;所述資源告警累計等級:資源及其子資源的告警最高等級冒泡值;所述資源確認告警累計計數:資源及其子資源告警確認總數累加值。

所述故障診斷模塊,包括:

告警定性單元,用于對可歸并、檢修引起、用戶側原因、誤告警、設備運行異常和設備故障引發告警原因的最終定性,包括:依據工程告警識別結果自動定性檢修引起的告警,依據疑似故障確認的結果自動定性設備故障引起的告警,運維人員對自動定性的結果進行人工確認或更改,運維人員對其他引發告警原因進行人工定性;

告警處理經驗庫,是故障診斷功能的核心,是疑似故障的識別和疑似故障的排查確認的重要依據;告警處理經驗庫負責告警處理經驗庫的維護、分享與使用,包括告警處理經驗的創建、修改、刪除、查看和查詢,以及各網省系統自定義告警處理經驗的上報和總部系統典型告警處理經驗的發布;告警處理經驗查詢時設置的查詢條件,包括:經驗類型、告警原因、告警等級、告警類型、告警描述或疑似故障原因;

故障輔助識別單元,用于依據告警處理經驗庫自動分析引發告警的各種疑似故障原因及其發生概率,包括提取根告警的告警特征信息,依據告警特征檢索告警處理經驗庫中的告警處理經驗,依據檢索到的經驗權值計算各種疑似故障原因的發生概率,以及提示運維人員引發根告警的各種可能故障原因及概率;

故障輔助確認單元,用于依據告警處理經驗庫自動分析排查各種疑似故障原因的方法和步驟,提供疑似故障排查向導指導和跟蹤運維人員排查故障原因,根據用戶錄入的排查結果最終確認故障原因,依據用戶錄入的排查結果更新告警處理經驗權值。

所述故障處理調度模塊,包括:

故障處理經驗庫,用于存儲故障處理經驗;

故障gis定位單元,用于對故障進行定位;

手動派單單元,用于人工派單;

自動派單單元,用于自動派單。

告警集中監視單元,包括:告警呈現子單元、告警查詢子單元、告警過濾子單元、告警定位子單元和告警備注子單元。

所述告警呈現子單元是以列表的形式按照用戶設置的條件,對全部告警、經過過濾后的告警或根源性告警信息進行集中顯示,并能夠按照設定規則排序;以色彩、高亮或閃爍方式顯示未確認的當前告警信息,以不同顏色反映不同的告警等級、以計數反映對象的當前累計告警數。

所述告警呈現子單元呈現的信息包括如下內容:告警基本信息,包括:告警等級、告警對象、告警類型、告警原因、告警時間或告警描述;屬地化告警標識,以不同的圖標區分出來是當前用戶本單位的告警還是上級單位屬地化資源的告警;告警處理狀態,以不同的圖標區分出當前告警的后續處理方式及處理進度;告警確認狀態標識,在告警列表的一列采用閃爍圖標的方式表示出新采集的尚未處理的告警,如果告警人工操作后將取消告警的閃爍;告警狀態標識,在對告警進行操作后,標識出當前告警所處的狀態,如用戶確認為誤告警的、將當前告警歸并到其它告警上的、因為檢修工作引起的、方式編制引起的、用戶側原因、設備異常、設備缺陷、啟動缺陷單消缺。

所述告警查詢子單元,讓用戶能夠找到用戶關注的告警;告警查詢方式分為兩種,一種是基本信息查詢,一種是相關查詢;基本信息查詢是根據告警的基本信息進行查詢,如系統,廠家,專業,告警的描述,時間進行查詢,能夠查詢實時告警信息和歷史告警信息;相關查詢分為兩種方式:一種是從告警列表關聯到相關資源、業務,如告警列表中對告警定位查詢查看相應的資源圖形,影響業務和影響的電路;另一種是從相關資源、業務關聯到告警列表,如從設備、盤或時隙查看告警,或者查看影響該電路或者業務的告警。

所述告警過濾子單元,通過設定的告警過濾規則,從大量告警中屏蔽用戶不關心的告警,過濾出重要告警從而有效防止告警風暴;告警過濾,包括:告警過濾規則定制和告警過濾規則應用;告警過濾規則定制指對告警級別、告警原因、告警所屬設備、告警關聯業務制定相應的過濾規則,并存儲到過濾規則庫;告警過濾規則應用指對實時接收的告警按照規則庫中相匹配的規則進行過濾,對于過濾掉的告警信息只存儲到數據庫,不在監視視圖中展現。

所述告警定位子單元,告警定位與資源圖形相結合,為用戶提供在告警列表信息中快速的跳轉到呈現當前告警的設備或設備板卡、插槽、端口的資源圖形中;告警定位按照用戶的需求不同,包括定位到設備;定位到設備是指當通過告警列表查詢到告警時,定位到拓撲圖當中,并已特殊提示顯示當前設備,從而分析出當前設備的資源關系等,明確當前設備所在的站點、機房、機柜,便于分析告警,解決故障。

所述告警備注子單元,用于對不需要立即處理的告警進行備注。

電力系統終端通信接入網告警集中監控方法,包括:

步驟(1):告警采集:接收各設備網管系統上報的實時告警消息,為告警的監視和處理提供數據源;

步驟(2):告警預處理:對采集的告警信息進行歸一化處理和分類壓縮,減少無效告警對告警監視的干擾;

步驟(3):故障監視:在告警操作臺和網絡拓撲圖上實時展示預處理后的各類告警信息,以及將重要告警通過短信、郵件和站內消息手段前轉給運維人員重點關注;

步驟(4):故障診斷:依據告警處理經驗庫中的經驗對告警進行分析診斷和定性,識別引發告警的各類可能故障原因,并提供故障排查向導指導運維人員逐步確定故障點與故障原因;

步驟(5):故障處理調度:依據故障診斷的結果定位故障點的地理位置及責任運維班組,并采用自動與手動相結合的方式派發缺陷處理工單,調度相關運維班組開展缺陷故障的排除工作。

所述步驟(1)的步驟包括:實時告警上報步驟和告警同步步驟。

所述實時告警上報步驟,包括:

步驟(101):協議適配器等待設備網關上報告警信息,協議適配器判斷自身是否收到告警報文,若是,則協議適配器對告警報文進行解析,同時生成標準告警報文;若否則返回步驟(101);

步驟(102):采集框架服務單元接收協議適配器生成的標準告警報文,采集框架服務單元判斷是否滿足百度策略,若是,則將告警報文合并,將報文發送至告警接收服務單元,若否,則返回班組(102);

步驟(103):告警接收服務單元等待接收告警報文,告警接收服務單元判斷自身是否收到告警報文,若是,則對告警報文進行解析,然后進入步驟(2);若否,則返回步驟(103)。

所述告警同步步驟,包括:

步驟(111):告警同步服務單元分析告警同步策略,然后告警同步服務單元分析是否觸發告警同步,若是就生成告警同步指令,然后將告警同步指令發送給采集框架服務單元;若否,則返回步驟(111);

步驟(112):采集框架服務單元等待接收告警同步指令,然后,判斷是否收到同步指令,若是,則發送告警同步指令至協議適配器;若否,則返回步驟(112);

步驟(113):協議適配器等待告警同步指令,然后,判斷是否收到同步指令,若未收到同步指令則返回步驟(113);若收到同步指令,則協議適配器生成同步請求報文,并發送同步請求報文;

步驟(114):協議適配器等待設備網管反饋,判斷是否收到同步反饋,若否,就返回步驟(114);若是,就解析原始告警報文,生成標準告警報文,協議適配器將標準報文發送給采集框架服務單元;

步驟(115):采集框架服務單元等待接收標準告警報文,判斷是否滿足擺渡策略,若滿足則合并告警報文,發送告警報文至告警接收服務單元,若不滿足,則返回步驟(115);

步驟(116):告警接收服務單元等待接收告警報文,判斷是否收到告警報文,若是則解析告警報文,然后進入步驟(2);若否則返回步驟(116)。

所述告警預處理步驟,包括:

步驟(21):告警標準化規則庫維護:包括告警標準化規則的創建、修改、查看、刪除和查詢;查詢時設置的查詢條件,包括:設備廠家名稱、廠家告警等級、廠家告警原因、廠家告警類型、標準告警等級、標準告警原因或標準告警類型;

步驟(22):告警數據清洗:去除重復告警和頻閃告警;重復告警是內容完全相同的告警;頻閃告警是在設定的時間范圍內多次交替收到某個告警產生和清除的消息;

步驟(23):告警重定義:根據告警標準化規則對采集的告警信息進行歸一化處理,重定義的內容包括告警等級、告警原因和告警類型;

步驟(24):根告警分析:根據設定的根告警分析規則分析告警之間的衍生關系,將分析后的告警分為三類:根告警、衍生告警和待分析告警;根告警是能直接反映故障原因的告警;待分析告警為因設定的根告警分析規則未覆蓋而無法判斷是否為根告警的告警,提示用戶重點關注;衍生告警是指當網絡中設備發生故障時,故障設備以及與故障設備存在關聯關系的其他網絡設備所產生的間接反映故障各種影響的告警,衍生告警與直接反映故障原因的根告警相對應,伴隨根告警產生;

步驟(25):工程告警識別:根據工單數據,自動識別出工程施工所引發的告警,識別出施工資源對象和關聯工單編號。

所述告警數據清洗步驟,包括:

步驟(221):收到告警后,首先在活躍告警表中查詢當前告警是否已經存在于告警表中,若存在,則判斷為重復告警,丟棄重復告警;若不存在,就進入步驟(222);

步驟(222):判斷查詢頻閃時間窗內是否發生過當前告警,若發生過,則判斷為頻閃告警,修改告警的最近發生時間和頻閃次數;當頻閃次數超過設定次數時,刪除頻閃報警;若沒有發生過,則判定為新告警,告警信息存入活躍告警表中。

所述告警重定義步驟包括:

步驟(231):告警重定義單元等待接收告警信息,判斷是否有新告警,若否,則返回步驟(231);若是,則提取告警原始特征信息;

步驟(232):依據告警原始特征信息從告警標準化規則庫中查詢標準化規則,判斷是否查到規則,若否就結束;若是則提取規則中的標準化告警信息,然后根據標準化告警信息對新告警信息進行歸一化處理。

所述根告警分析步驟包括:

步驟(241):開始,等待接收新告警,判斷是否收到新告警,若否,則返回步驟(241);若是,就提取告警設備廠家的根告警分析規則組;

步驟(242):判斷當前新告警是否存在于根告警分析規則組中,若否,就表示該告警為待分析告警;若是,則將當前新告警與根告警分析規則組進行匹配,判斷是否匹配成功,若未成功就返回步驟(242);若成功就表示該告警為根告警;

步驟(243):分析根告警的告警源的資源類型,依次判斷資源類型是否是光端口;若是光端口就進入步驟(244);否則,判斷是否是板卡,若是板卡就進入步驟(245);若不是板卡就進入步驟(246);

步驟(244):加載光端口連接的其他端口;提取加載光端口當前告警;提取加載光端口設定時間范圍內歷史故障;進入步驟(247);

步驟(245):加載板卡端口信息;判斷是否是光端口,若是就加載光端口連接的其他端口;提取加載光端口當前告警,提取加載光端口設定時間范圍內歷史故障;若否就提取加載光端口當前告警,提取加載光端口設定時間范圍內歷史故障;進入步驟(247);

步驟(246):判斷是否是設備,若是,則加載設備板卡信息,然后進入步驟(245);若否就結束;進入步驟(247);

步驟(247):判斷是否存在待分析告警,若是就匹配當前規則組中的衍生告警特征,然后,進入步驟(248);若否就結束;

步驟(248):判斷匹配是否成功,若成功,就標記該告警為當前跟告警的衍生告警,返回步驟(247);若否,就直接返回步驟(247)。

所述工程告警識別步驟包括:

步驟(251):啟動工程作業開工偵聽線程,判斷是否偵聽到新的開工工程,若是就分析工程作業影響的資源對象,標識為施工資源,同時記錄工單編號;進入步驟(252);若否就進入步驟(253);

步驟(252):繼續判斷是否存在關聯資源,若是就標識關聯資源為施工資源,記錄工單編號,進入步驟(253);若否就結束;

步驟(253):判斷是否結束線程,若是就結束,若否,就返回步驟(251);

步驟(254):啟動工程作業完工偵聽線程,判斷是否偵聽到新完工工程,若是就分析工程作業影響的資源對象,取消施工資源標識、刪除工單編號;進入步驟(255);若否就進入步驟(256);

步驟(255):判斷是否存在關聯資源,若是就取消關聯資源的施工資源標識,刪除工單編號,進入步驟(256),否則,直接進入步驟(256);

步驟(256):判斷是否結束線程,若是就結束,若否就返回步驟(254);

步驟(257):啟動工程告警識別線程,判斷是否有新告警,若是就分析告警源資源對象標識,進入步驟(258);若否,就直接進入步驟(259);

步驟(258):判斷是否是施工資源,若是就表示該新告警為施工告警,記錄告警關聯的工單編號,進入步驟(259);若否就直接進入步驟(259);

步驟(259):判斷是否結束線程,若是就結束,若否就返回步驟(257)。

所述告警監視步驟,包括:

將通信網絡和設備告警信息通過列表的形式進行集中匯總展現,實現對通信網絡運行實時狀態的集中監視和管理;對網絡運行狀態進行監視;用戶對告警狀態進行訂閱;將告警狀態通過短信或郵件形式前轉給工作人員;將告警狀態推送給用戶;

告警狀態計算服務步驟,負責對告警預處理后的實時告警數據集合進行及時資源影響狀態計算,計算內容包括:資源告警累計計數計算、資源告警累計等級計算和資源確認告警累計計數計算三類,計算內容存入內存庫并通過統一接口提供相關服務調用,所述資源告警累計計數:資源及其子資源的告警總數累加值;所述資源告警累計等級:資源及其子資源的告警最高等級冒泡值;所述資源確認告警累計計數:資源及其子資源告警確認總數累加值。

所述故障診斷步驟包括:

告警定性子步驟:對可歸并、檢修引起、用戶側原因、誤告警、設備運行異常和設備故障引發告警原因的最終定性,包括:依據工程告警識別結果自動定性檢修引起的告警,依據疑似故障確認的結果自動定性設備故障引起的告警,運維人員對自動定性的結果進行人工確認或更改,運維人員對其他引發告警原因進行人工定性;

告警處理經驗庫維護子步驟:包括告警處理經驗的創建、修改、刪除、查看和查詢,以及各網省系統自定義告警處理經驗的上報和總部系統典型告警處理經驗的發布;告警處理經驗查詢時設置的查詢條件,包括:經驗類型、告警原因、告警等級、告警類型、告警描述或疑似故障原因;

故障輔助識別子步驟:依據告警處理經驗庫自動分析引發告警的各種疑似故障原因及其發生概率,包括提取根告警的告警特征信息,依據告警特征檢索告警處理經驗庫中的告警處理經驗,依據檢索到的經驗權值計算各種疑似故障原因的發生概率,以及提示運維人員引發根告警的各種可能故障原因及概率;

故障輔助確認子步驟:依據告警處理經驗庫自動分析排查各種疑似故障原因的方法和步驟,提供疑似故障排查向導指導和跟蹤運維人員排查故障原因,根據用戶錄入的排查結果最終確認故障原因,依據用戶錄入的排查結果更新告警處理經驗權值

所述故障處理調度步驟,包括:

故障處理經驗庫維護子步驟:存儲故障處理經驗;

故障gis定位子步驟:對故障進行定位;

手動派單子步驟:人工派單;

自動派單子步驟:用于自動派單。

本發明的有益效果:

建立體系完善、運行可靠的可管理、可維護的終端通信接入網管理系統,構建符合終端通信接入網絡運行需要的資源管理、實時監視和運行管理等管理功能,最終實現接入網通信網絡的資源合理分配、網絡運行故障自動分析定位,將加大的節約人力成本,提升電力系統終端通信接入網的運維管理水平,提高配用電智能服務業務支撐能力,有著巨大的現實意義、經濟意義和社會意義。

以綜合管理系統對接設備廠家網管或第三方網管北向接口的方式完成對網絡系統和設備的接入、數據采集,實現接入網多種技術體制、多廠家、通信與業務融合的綜合監視,并以告警分析、故障原因分析、故障點定位和故障處置專家案例庫、自動派單等功能實現綜合性故障輔助處理。解決當前接入網運維中網絡難以監控、故障難以判斷和處理的核心問題。

綜合管理系統采用規范化、擴展性、開放性原則,嚴格遵循規范化原則,制定系統自身相關的標準規范體系,包括數據交換規范、模型規范、命名規范、功能規范、ui規范、過程管理規范等相關規范,基于服務的構架(soa),使得終端通信接入網管理系統具備功能可擴展,以滿足不斷發展的應用需求。應采用開放性技術平臺和軟件架構,保證系統能夠方便的實現與其它應用集成。

附圖說明

圖1終端通信管理系統告警處理全過程功能結構;

圖2為本發明整體流程圖;

圖3告警采集流程圖;

圖4實時告警上報處理流程圖;

圖5告警同步處理流程;

圖6告警預處理流程圖;

圖7告警數據清洗流程圖;

圖8告警重定義流程圖;

圖9為根告警分析流程圖;

圖10為工程告警識別流程圖;

圖11為故障處理調度流程圖。

具體實施方式

下面結合附圖與實施例對本發明作進一步說明。

接入網實施監視,實現在設備網管基礎上,通過進一步擴展通信網絡的監視范圍,整合通信設備的各種管理信息和實時信息,為通信運行和管理人員提供更全面、完整的通信運行監視視圖,實現在統一的界面下對多廠商設備運行狀態的集中監視,實現面向業務的告警分析和故障處理,為通信調度提供技術手段。

1、告警分類。按接入網組網技術、告警級別、告警類型對告警進行分類顯示。

2、告警壓縮。針對未清除的重復、抖動等活躍告警,當網管系統收到多條(數目大于等于2時)同一告警時,應進行告警壓縮,同時記錄同一告警重復上報的次數。網管系統支持用戶自定義告警壓縮時間周期,如定義為10分鐘。

3、告警升級。當同一告警發生的頻次過高,系統需對告警的告警級別進行升級。網管系統支持用戶自定義告警升級條件。

4、告警重定義。為了便于網管系統對網元特定告警信息進行監視、統計和分析,網管系統應支持用戶對告警的重定義功能,包括重新分配告警級別、重新進行告警分類等功能。

為實現多種技術體制、多廠家、通信與業務融合的綜合監視進行告警標準化、告警標注、告警關聯。

(一)告警標準化

對各專業設備的告警分類、告警級別、告警唯一標識等字段進行標準化處理。實現設備、業務、通道告警級別重定義等功能。具備自動導入告警標準化梳理表進行告警的標準化能力。

告警標準化規則的字段包括:廠家、技術體制、廠家告警級別、網管告警級別、告警類別、設備類型、業務類型、通道類型、告警邏輯分類、告警邏輯子類、該事件對設備的影響、該事件對業務的影響、該事件對通道的影響、網管告警id、廠家告警id、告警標題等。對于不同廠家、不同設備、不同技術體制,其告警標準化梳理規則有不同的key值。

(二)告警標注

根據網管告警級別、告警類別、設備類型、業務類型、通道類型、檢修工作對設備的影響、對業務的影響、對通道的影響、網管告警id、廠家告警id、告警標題、網元名稱、網元id、業務名稱、業務id、通道名稱、影響業務系統、檢修開始和結束時間等檢修信息,并與oms/pms系統橫向連接,采集相應狀態和計劃檢修信息,實現各類檢修告警自動標注。不僅對各技術體制的本端網元告警(設備、板卡、端口、中繼、鏈路等)實現標注,還應對端業務設備、業務通道的告警實現標注。支持對單條告警或批量告警手動進行檢修告警標注。系統對于檢修告警實現抑制派單。對于檢修時間結束仍未恢復的檢修告警,可通過半自動或自動方式派發工單,并注明檢修遺留告警。

對于運行方式變更引起的通信設備告警,同樣需要進行告警標注。

(三)告警關聯

告警關聯是指在窗口時間內將具有相關性的一組告警關聯在一起,從而支撐告警定位分析。對于關聯告警,可進行壓縮派單。

1、關聯關系

1)主次關聯:一批告警某時間內發生,選一個作為主告警,其他作為該主告警下掛次告警。如:pon設備電源告警與動環告警、無線專網基站退服與動環告警。主告警和次告警根據各自的告警清除邏輯清除。

2)衍生關聯:根據一組告警衍生出一個新告警。如:單個olt中斷引發的多站點onu通道告警、大面積基站退服告警。衍生條件不滿足時清除告警。

2、技術體制內告警關聯

實現設備內部各個組成部分的告警關聯。如:olt中斷與onu中斷、基站退服與終端接入站點退服等。

3、技術體制間關聯

以業務或者通道id編號連接為索引,建立各類技術體制間的告警關聯關系實現epon、工業以太網、無線專網、無線公網、plc、衛星通信等技術體制間的告警關聯。

4、跨專業關聯

實現epon、工業以太網、無線專網、無線公網、plc、衛星通信等通信專業與配電自動化、視頻監控等業務系統的告警關聯。如:以物理端口為索引,建立跨專業的告警關聯關系,比如onulos告警與業務側終端掉線告警。

5、告警關聯規則

主次告警關聯規則的字段包括:規則名稱、技術體制、設備類型、廠家、網管告警id、告警標題、關聯時間窗、啟用狀態等。

衍生告警關聯規則的字段包括:規則名稱、衍生告警標題、衍生告警級別、技術體制、設備類型、廠家、網管告警id、告警標題、頻次門限、關聯時間窗、啟用狀態等。

如圖1所示,電力系統終端通信接入網告警集中監控系統,包括:

性能管理模塊,用于對各類通信資源的性能數據進行分析處理,為大屏指標展示模塊提供性能統計信息,為網絡運行狀態監視模塊提供預警信息性能數據;

網絡運行狀態監視模塊,用于接收故障智能分析模塊發送過來的故障定位影響分析結果,接收性能管理模塊發送過來的預警信息性能數據,接收數據采集單元發送過來的告警量或狀態值,接收告警集中監視模塊發送過來的狀態結果,并向接入網業務監視模塊發送網絡運行狀態監視結果,還向故障智能分析模塊發送網絡狀態數據,從而實現對網絡運行狀態進行監視;

接入網業務監視模塊,用于接收網絡運行狀態監視模塊發送過來的數據;

故障智能分析模塊,用于接收告警集中監視模塊發送過來的告警信息,接收網絡運行狀態監視模塊發送過來的網絡狀態,還將故障統計信息發送給大屏指標展示模塊;

故障智能處理為通信運行維護提供智能化的分析處理手段,包括故障預警、故障定位、缺陷故障智能處理、故障專家庫管理等功能。

告警集中監視模塊,用于接收數據采集單元發送來的告警信息,并將告警信息發送給故障智能分析模塊,將狀態結果發送給網絡運行狀態監視模塊;

大屏指標展示模塊,用于展示全網告警分析數據,所述告警分析數據包括:告警數量及告警時長。

資源管理單元,用于統計各類通信資源的信息,并將統計的信息通過大屏指標展示單元進行展示;所述各類通信資源包括:網絡資源、通信主設備、輔助設備、機房配線、光纜資源、端口帶寬資源或業務電路;所述通信資源的信息包括:屬性信息、連接信息、動靜態資源關聯關系和各層通信資源關聯關系;

數據采集單元,用于完成各類通信資源的告警信息、性能信息和配置信息的采集、預處理以及上傳;數據采集方式包括:文件主動查詢訪問、數據庫主動查詢訪問,數據采集還通過corba、snmp或tcp/ip協議查詢和推送方式。

模型管理單元,用于利用各類通信資源的實時性能數據與歷史性能數據,根據故障預警模型來預測各類通信資源可能發生的故障;故障預測包括故障預警模型構建和故障預警模型應用;故障預警模型的構建過程考慮光纜纖芯劣化分析、通信設備告警發生頻率、通信業務是否有主備保護、主備路由是否相同、網絡流量或信號質量因素,根據故障預警需要來構建。故障預警模型應用指根據匹配的故障預警模型主動預測通信設備、光纜和各類業務可能發生故障。

通信資源管理類單元,用于實現對各類通信資源的維護和管理,所述維護和管理包括:資源信息維護、資源信息操作和資源信息校驗;對通信網絡層的設備和網絡進行數據的整理、存儲、維護和展現。

通信資源管理類單元,包括資源信息管理模塊和資源圖形管理模塊,資源信息管理模塊完成資源數據的整理、存儲和維護,資源圖形管理模塊以資源信息管理模塊提供的數據為基礎對通信網絡進行圖形繪制與展現。

通信專業管理類單元,用于對通信運行業務進行管理,實現流程電子化、自動化。

所述告警集中監視模塊,包括:

告警采集子模塊,用于采集告警數據,實現對設備性能參數的周期性采集;

告警過濾子模塊,用于對各通信設備的告警分類、告警級別、告警唯一標識字段進行標準化處理;

告警分類子模塊,用于依據接入網組網、告警級別、告警類型對告警進行分類;接入網組網包括:epon、工業以太網、plc、無線專網或無線公網;

告警壓縮子模塊,用于對重復告警進行告警壓縮,同時對重復告警的次數進行記錄;

告警升級子模塊,對同一告警發生頻次超過設定次數的告警,對告警的告警級別進行升級;

告警重定義子模塊,用于重新分配告警級別和告警分類;

告警提示子模塊,用于根據預設的閾值判斷性能越限并進行告警提示,提供設備和鏈路性能越限的監視手段。

告警顯示子模塊,用于根據接入網類型對不同廠家的告警進行標準化并集中展示,支持設備和線路實時狀態在拓撲圖上的告警展示;通過告警顯示子模塊提供集中、標準化規則字段、分權分域的接入網實時告警監控界面。

告警狀態計算子模塊,用于對告警顯示模塊發送來的數據進行告警狀態計算,并將計算出來的告警狀態結果通過網絡運行狀態監視模塊顯示出來;

告警操作子模塊,用于告警確認、告警定性及告警工單派發,啟動缺陷單、檢修單的工單處理告警;清除錯誤告警以及已經解決的告警工單,對告警級別超過設定級別的工單進行封鎖,并上傳;

告警查詢子模塊,用于告警查詢提供當前告警查詢和歷史告警查詢;

告警標準化規則的字段包括:廠家、技術體制、廠家告警級別、網管告警級別、告警類別、設備類型、業務類型、通道類型、告警邏輯分類、告警邏輯子類、該事件對設備的影響、該事件對業務的影響、該事件對通道的影響、網管告警id、廠家告警id、告警標題。

所述告警集中監視模塊,還包括:

告警標注子模塊,根據檢修信息,并與oms/pms系統橫向連接,采集設備當前工作狀態和計劃檢修信息,實現各類檢修告警自動標注。檢修信息包括:網管告警級別、告警類別、設備類型、業務類型、通道類型、檢修工作對設備的影響、對業務的影響、對通道的影響、網管告警id、廠家告警id、告警標題、網元名稱、網元id、業務名稱、業務id、通道名稱、影響業務系統、檢修開始和結束時間;

不僅對各接入網組網的本端網元告警實現標注,還對端業務設備、業務通道的告警實現標注;所述本端網元包括:設備、板卡、端口、中繼、鏈路;支持對單條告警或批量告警手動進行檢修告警標注。對于檢修告警實現抑制派單。對于檢修時間結束仍未恢復的檢修告警,可通過半自動或自動方式派發工單,并注明檢修遺留告警。對于運行方式變更引起的通信設備告警,同樣需要進行告警標注。

所述告警關聯子模塊,包括:

告警關聯是指在窗口時間內將具有關聯關系的一組告警關聯在一起,從而支撐告警定位分析;對于關聯告警,可進行壓縮派單;

所述關聯關系,包括主次關聯、衍生關聯、技術體制內告警關聯、技術體制間關聯、跨專業關聯;

所述主次關聯:一批告警某時間內發生,選一個作為主告警,其他作為該主告警的次告警。主次告警關聯規則的字段包括:規則名稱、技術體制、設備類型、廠家、網管告警id、告警標題、關聯時間窗、啟用狀態等。

如:pon設備電源告警與動環告警、無線專網基站退服與動環告警。主告警和次告警根據各自的告警清除邏輯清除。

所述衍生關聯:根據一組告警衍生出一個新告警。衍生告警關聯規則的字段包括:規則名稱、衍生告警標題、衍生告警級別、技術體制、設備類型、廠家、網管告警id、告警標題、頻次門限、關聯時間窗、啟用狀態等。如:單個olt中斷引發的多站點onu通道告警、大面積基站退服告警。衍生條件不滿足時清除告警。

所述技術體制內告警關聯:實現設備內部各個組成部分的告警關聯。如:olt中斷與onu中斷、基站退服與終端接入站點退服等。

所述技術體制間關聯:以業務或者通道id編號連接為索引,建立各類技術體制間的告警關聯關系實現epon、工業以太網、無線專網、無線公網、plc、衛星通信等技術體制間的告警關聯。

所述跨專業關聯:實現epon、工業以太網、無線專網、無線公網、plc、衛星通信等通信專業與配電自動化、視頻監控等業務系統的告警關聯。如:以物理端口為索引,建立跨專業的告警關聯關系,比如onulos告警與業務側終端掉線告警。

通信資源管理類單元,還包括:

配置管理模塊,用于接收數據采集單元采集的配置信息,并將配置信息轉發給資源信息管理模塊;

資源調度管理模塊,用于接收資源信息管理模塊提供的資源數據,接收資源圖形管理模塊提供的拓撲圖數據,并將調度資源發送給運行方式管理模塊;

如圖11所示,通信管理系統支撐通信監盤和缺陷故障處置調度的告警處理全過程功能包括:告警采集、告警預處理、告警監視、故障診斷和故障處理調度五大功能模塊。

其中,告警采集功能由采集控制層的采集框架服務、告警接收服務、告警同步服務以及協議適配層的各設備網管北向接口適配器組成,主要負責實時接收各設備網管系統上報的實時告警消息和同步設備網管系統的當前活躍告警,為告警的監視和處理提供可靠的基礎數據源;

告警預處理功能由告警數據清洗、告警重定義、告警信息標準化庫、根告警分析和工程告警識別功能組成,主要負責對采集的原始告警進行歸一化處理和分類壓縮,減少無效告警對告警監視的干擾;

告警監視功能由告警狀態計算服務、告警訂閱功能、告警推送服務、告警前轉功能、告警集中監視功能和網絡運行狀態監視功能組成,主要負責在告警操作臺和網絡拓撲圖上實時展示預處理后的各類告警信息,以及將重要告警通過短信、郵件和站內消息等手段前轉給運維人員重點關注;

故障診斷功能由告警定性、告警處理經驗庫、故障輔助識別和故障輔助確認功能組成,主要負責依據告警處理經驗庫中的經驗對告警進行分析診斷和定性,識別引發告警的各類可能故障原因,并提供故障排查向導指導運維人員逐步確定故障點與故障原因;

故障處理調度功能由故障gis定位、故障處理經驗庫、故障手動派單和故障自動派單功能組成,主要負責依據故障診斷的結果定位故障點的地理位置及責任運維班組,并采用自動與手動相結合的方式派發缺陷處理工單,調度相關運維班組開展缺陷故障的排除工作。

如圖2所示,(一)告警采集:

告警采集模塊負責從各設備網管系統北向接口采集告警數據,告警的監視和處理提供可靠的基礎數據源,主要功能包括實時接收各設備網管系統上報的實時告警消息和同步設備網管系統的當前活躍告警。告警采集功能包括協議適配器、采集框架服務、告警接收服務和告警同步服務4個子功能。

1.協議適配器

協議適配器負責與各設備網管北向接口的協議適配工作,包括與設備網管北向接口的連接建立與維護、設備廠家原始告警報文的解析和標準告警報文的生成。

2.采集框架服務

采集框架服務負責對將協議轉換后的標準告警報文從二區跨隔離裝置傳輸至三區,包括告警擺渡策略的管理、告警報文的合并和跨隔離裝置傳輸。

3.告警接收服務

告警接收服務負責實時接收和解析采集框架服務傳輸至三區的標準告警報文。

4.告警同步服務

告警同步服務負責主動發起對設備網管系統當前活躍告警列表的同步。告警同步的觸發策略應支持定期觸發和事件觸發兩種,同步的范圍應支持對全部設備網管的同步和對指定設備網管的同步兩種。

以上四個過程處理流程如下:

如圖3所示,告警采集流程包括實時告警上報和告警同步兩個子流程。

(1)實時告警上報處理流程如圖4所示。

(2)告警同步處理流程如圖5所示。

(二)告警預處理,如圖6所示:

告警預處理功能模塊主要負責對采集的原始告警進行歸一化處理和分類壓縮,減少無效告警對告警監視的干擾,主要功能包括告警數據清洗、告警重定義、根告警分析、工程告警識別、告警標準化規則庫維護和告警標準化規則庫檢索。

1.告警數據清洗,如圖7所示,

終端通信網的告警數量巨大,其中存在相當數量的重復告警和頻閃告警。重復告警是指通信管理系統收到的信息內容完全相同的多條告警;頻閃告警是指通信管理系統在一定的時間窗內多次交替收到某個告警的產生和清除消息。無論是重復告警還是頻閃告警,由于其告警內容基本相同,重復閱讀這類告警將額外增加不必要的工作量,降低告警處理的效率。

告警數據清洗功能應能對采集的原始告警數據進行臟數據清洗,去除多余的重復告警,壓縮頻閃告警。

系統接收告警采集模塊采集到的新告警;在系統活躍告警表中查找該告警;若找到則判定為重復告警,丟棄該告警;若未找到則在歷史告警表中查找頻閃時間窗內是否發生過該告警;若找到則判定為頻閃告警,修改該歷史告警的狀態為活躍告警,更新最近發生時間和頻閃次數字段;若未找到則判定為普通新告警,存入系統活躍告警表。

告警重定義,如圖8所示,

終端通信網由等多種技術體制的網絡共同組成,由于不同技術體制網絡設備遵循的標準規范各不相同,導致告警信息的格式和內容也各不相同。即便是同一種技術體制,不同設備廠家、不同版本的設備網管北向接口在告警的定義、分類、分級和描述等方面也存在巨大的差異,甚至連所使用的語言都不統一。種類繁多且形式各異的告警信息大大降低了告警的可讀性,不但提高了運行維護人員的學習成本,而且不利于告警處理經驗的積累、提煉和交流。

告警重定義功能應能根據梳理的告警標準化規則對采集的原始告警信息進行歸一化處理,重定義的內容可包括告警等級、告警原因和告警類型等。

1)系統依據告警原始信息檢索告警標準化規則庫

2)若檢索到規則,則依據規則補充告警的標準化信息,包括標準告警等級、標準告警原因和標準告警類型

3)根告警分析

終端通信網的告警數量巨大,但并非所有的告警信息都能提供發現設備故障的有效信息,相反絕大多數的告警都是不能反映網絡設備故障的無效告警,如衍生告警。衍生告警是指當網絡中設備發生故障時,故障設備以及與故障設備存在關聯關系的其他網絡設備所產生的間接反映故障各種影響的告警,這類告警與直接反映故障原因的根告警相對應,伴隨根告警產生。衍生告警對于分析網絡設備故障雖然具有一定的參考意義,但由于網絡連接關系和承載關系的復雜性,往往衍生告警的數量數十倍甚至數百倍于反映故障原因的根告警,大量的衍生告警淹沒了最值得關注的根告警,分散了運維人員的注意力,客觀上卻降低了運維人員分析告警發現故障的效率。

如圖9所示,根告警分析功能應能根據梳理的根告警分析規則分析告警之間的衍生關系,識別出直接反映故障原因的根告警,便于運維人員重點關注。考慮到根告警分析規則的完善是一個長期持續的過程,為提高根告警分析功能的實用性,根告警分析功能應將分析后的告警劃分為三類:根告警、衍生告警和待分析告警。其中待分析告警為因現有規則未覆蓋而無法判斷是否為根告警的告警,也需要提示用戶重點關注。

由于根告警分析規則比較復雜,系統不提供根告警分析規則的管理功能,規則由項目組隨系統版本發布內嵌于系統程序中。

1)系統依據根告警分析時間窗設置從活躍告警列表中提取待分析告警集

2)系統依據根告警分析規則庫中的根告警判定規則檢索待分析告警集

3)若存在告警匹配根告警判定規則,系統標識該告警為根告警

4)系統分析該根告警的告警源資源對象,提取待分析告警集中該資源對象以及與其存在包含關系或連接關系的其他資源對象上的告警作為疑似衍生告警集

5)系統依據與該根告警匹配的根告警判定規則同組的衍生告警判定規則,檢索疑似告警集

6)若存在疑似衍生告警匹配衍生告警判定規則,系統標識該告警為衍生告警

7)若待分析告警集中還存在既未標識為根告警又未標識為衍生告警的告警,系統標識該告警為待分析告警

4.工程告警識別

如圖10所示,終端通信網的檢修、方式等工程施工時,也會引發通信設備的大量告警,這類告警并非由于網絡設備故障產生,因此對于分析故障也不具備參考意義。相反,大量的工程告警反而會干擾運維人員的注意力,增加不必要的告警監視工作量,降低告警處理的工作效率。

工程告警識別功能應能根據系統的檢修單、方式單等工單數據,自動識別出由于檢修、方式等已知的工程施工所引發的告警。

系統實時分析已開工未完工檢修單和方式單中的施工資源對象,標識施工資源對象和關聯工單編號;系統分析與施工資源對象存在包含和關聯關系的其他資源對象,也標識施工資源對象和關聯工單編號;系統實時分析施工期間采集告警的告警源資源對象,若該資源對象為施工資源,則判定該告警為工程告警,標記工程告警標識,關聯工單編號

5.告警標準化規則庫維護

由于不同設備廠家、不同版本的設備網管北向接口在告警的定義、分類、分級和描述等方面存在巨大的差異,降低了告警的可讀性,增加了告警分析和處理的難度,也不利于告警處理經驗的提煉、積累和分享。

告警標準化規則庫的建立可有效支撐告警重定義功能對各設備廠家的原始告警信息進行歸一化處理,屏蔽不同設備廠家告警之間的差異性,為告警的智能分析和自動處理提供良好的數據支撐。告警標準化規則庫管理功能主要負責告警標準化規則庫的維護與使用,包括告警標準化規則的創建、修改、查看、刪除和查詢。規則查詢時可設置的查詢條件包括設備廠家名稱、廠家告警等級、廠家告警原因、廠家告警類型、標準告警等級、標準告警原因、標準告警類型等。

1)系統管理員進入告警標準化規則庫維護界面,系統以列表顯示庫中已存在的標準化規則

2)系統管理員填寫新增告警標準化規則屬性,包括設備廠家名稱、廠家告警等級、廠家告警原因、廠家告警類型、標準告警等級、標準告警原因、標準告警類型、備注等

3)系統校驗填寫數據的合法性并保存新增告警標準化規則入庫,關閉創建標準化規則界面系統更新維護界面的告警標準化規則列表

(三)告警監視:

告警監視負責在以告警集中監視的方式在告警操作臺和以網絡運行狀態監視的方式在網絡拓撲圖上實時展示預處理后的各類告警信息,以及將重要告警通過短信、郵件和站內消息等手段前轉給運維人員重點關注。主要功能包括告警狀態計算、告警訂閱、告警推送、告警集中監視、網絡運行狀態監視、告警前轉。

1.告警狀態計算

系統查詢每類圖形中各個資源及資源的包含關系;系統計算每類圖形中各個資源的累計告警數量;系統計算每類圖形中各個資源的告警最高等級;系統計算每類圖形中各個資源的累計確認告警數量

告警狀態計算功能為后臺計算功能,隸屬于處理邏輯層,負責對告警預處理后的實時告警數據集合進行及時資源影響狀態計算,計算內容包括:資源告警累計計數計算、資源告警累計等級計算和資源確認告警累計計數計算三類,計算內容存入內存庫并通過統一接口提供相關服務調用,三類計算指標描述如下:

1)資源告警累計計數:資源及其子資源的告警總數累加值;

2)資源告警累計等級:資源及其子資源的告警最高等級冒泡值;

3)資源確認告警累計計數:資源及其子資源告警確認總數累加值。

2.告警集中監視

告警集中監視隸屬于界面展現層,主要負責將通信各專業的網絡和設備告警信息通過列表的形式進行集中匯總展現,實現對通信網運行實時狀態的集中監視和管理。告警集中監視包括告警呈現、告警查詢、告警過濾、告警定位、告警備注。

1)告警呈現

告警呈現是以列表的形式按照用戶設置的條件,對全部告警、經過過濾后的告警或根源性告警信息進行集中顯示,并能夠按照一定規則排序。以色彩、高亮或閃爍等方式顯示未確認的當前告警信息,以不同顏色反映不同的告警等級、以計數反映對象的當前累計告警數。告警呈現的信息至少包括如下內容:

(1)告警基本信息

在告警列表中呈現采集到,并且經過系統標準化處理后的告警信息,包括告警等級、告警對象、告警類型、告警原因、告警時間、告警描述等等。

(2)屬地化告警標識

以不同的圖標區分出來是當前用戶本單位的告警還是上級單位屬地化資源的告警。

(3)告警處理狀態

以不同的圖標區分出當前告警的后續處理方式及處理進度。

(4)告警確認狀態標識

在告警列表的一列采用閃爍圖標的方式表示出新采集的尚未處理的告警,如果告警人工操作后將取消告警的閃爍。

(5)告警狀態標識

告警狀態標識主要是指在對告警進行操作后,標識出當前告警所處的狀態,如用戶確認為誤告警的、將當前告警歸并到其它告警上的、因為檢修工作引起的、方式編制引起的、用戶側原因、設備異常、設備缺陷、啟動缺陷單消缺的等多種不同的圖標表示出告警的處理狀態。

2)告警查詢

告警查詢是為了讓用戶能夠快捷的找到用戶關注的告警。告警查詢分為兩種,一種是通過告警的基本信息查詢,一種是相關查詢。

基本信息查詢是根據告警的基本信息進行查詢,如系統,廠家,專業,告警的描述,時間等進行查詢,可查詢實時告警信息和歷史告警信息。

相關查詢分為兩種方式,一種是從告警列表關聯到相關資源、業務等,如告警列表中對告警定位查詢查看相應的資源圖形,影響業務和影響的電路等;另一種是從相關資源、業務關聯到告警列表,如從設備,盤,時隙等查看其上的告警,或者查看影響該電路或者業務的告警。

3)告警過濾

通過制定合理的告警過濾規則,從大量告警中屏蔽用戶不關心的告警,過濾出重要告警從而有效防止告警風暴。告警過濾包括告警過濾規則定制、告警過濾規則應用。

告警過濾規則定制指對告警級別、告警原因、告警所屬設備、告警關聯業務等制定相應的過濾規則,并存儲到過濾規則庫。

告警過濾規則應用指對實時接收的告警按照規則庫中相匹配的規則進行過濾,對于過濾掉的告警信息只存儲到數據庫,不在監視視圖中展現。

4)告警定位

用戶在通過告警列表看到資源對象的告警后,經常需要直觀的了解到到底是那個資源對象存在異常情況,因此需要告警定位與資源圖形相結合,定位到資源圖形中去。

告警定位功能為用戶提供在告警列表信息中快速的跳轉到呈現當前告警的設備或設備板卡、插槽、端口的資源圖形中。

告警定位按照用戶的需求不同,包括定位到設備和定位到資源兩種情況。

定位設備是指當通過告警列表查詢到告警時,定位到拓撲圖當中,并已特殊提示顯示當前的設備,這樣可以明確的分析出該設備的資源關系等,明確該設備所在的站點、機房、機柜,便于分析告警,解決故障。

可直接產生告警的告警對象包括網元、插槽、板卡、端口,不同烈性的告警對象,由于層級不同,將定位到不同的圖像上以便最直觀的展現發生告警的資源對象。當網元發生告警會定位到拓撲圖中,同定位設備,當插槽或板卡發生告警將定位到設備面板圖中,當端口發生告警將定位到板卡視圖中。

5)告警備注

告警集中監視列表中展現的告警信息,有些告警不需要立即處理,但需要增加批注作為提醒,在下次看到告警信息是需要查閱,可為用戶提供告警備注功能,該備注信息將一直伴隨告警(直至進入歷史告警記錄)。

(四)故障診斷:

告警診斷功能模塊主要負責告警處理經驗庫的維護,以及依據告警處理經驗對告警預處理后的根告警進行故障原因分析與排查,提高運維人員分析處理告警的工作效率,主要功能包括疑似故障識別、疑似故障排查、告警定性、告警處理經驗庫維護、告警處理經驗檢索、告警處理經驗權值優化、典型處理經驗評審和告警處理經驗分享。

如圖11所示,故障診斷功能包括疑似故障識別、疑似故障確認、告警定性和告警處理經驗庫管理4個子功能。

1.疑似故障識別

疑似故障識別功能主要負責依據告警處理經驗庫自動分析引發告警的各種疑似故障原因及其發生概率,包括提取根告警的告警特征信息,依據告警特征檢索經驗庫中的告警處理經驗,依據檢索到的經驗權值計算各種疑似故障原因的發生概率,以及提示運維人員引發根告警的各種可能故障原因及概率等。

2.疑似故障確認

疑似故障確認功能主要負責依據告警處理經驗庫自動分析排查各種疑似故障原因的方法和步驟,提供疑似故障排查向導指導和跟蹤運維人員排查故障原因,根據用戶錄入的排查結果最終確認故障原因,依據用戶錄入的排查結果更新告警處理經驗權值等。

3.告警定性

告警定性功能主要負責對可歸并、檢修引起、方式引起、用戶側原因、誤告警、設備運行異常和設備故障7類引發告警原因的最終定性,包括系統依據工程告警識別結果自動定性檢修引起或方式引起的告警,系統依據疑似故障確認的結果自動定性設備故障引起的告警,運維人員對自動定性的結果進行人工確認或更改,運維人員對其他引發告警原因進行人工定性等。

4.告警處理經驗庫管理

告警處理經驗庫是故障診斷功能的核心,是疑似故障的識別和疑似故障的排查確認的重要依據。告警處理經驗庫的管理功能主要負責告警處理經驗庫的維護、分享與使用,包括告警處理經驗的創建、修改、刪除、查看和查詢,以及各網省系統自定義告警處理經驗的上報和總部系統典型告警處理經驗的發布。告警處理經驗查詢時可設置的查詢條件包括經驗類型、告警原因、告警等級、告警類型、告警描述、疑似故障原因。

故障診斷處理流程包括疑似故障識別、疑似故障確認、告警定性、告警處理經驗庫維護和告警處理經驗庫分享5個子流程。

上述雖然結合附圖對本發明的具體實施方式進行了描述,但并非對本發明保護范圍的限制,所屬領域技術人員應該明白,在本發明的技術方案的基礎上,本領域技術人員不需要付出創造性勞動即可做出的各種修改或變形仍在本發明的保護范圍以內。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 青田县| 潜山县| 福鼎市| 临夏县| 呼图壁县| 娄底市| 甘南县| 沈丘县| 尚志市| 凭祥市| 建昌县| 奈曼旗| 乐昌市| 台东市| 阜南县| 安陆市| 尼玛县| 仙游县| 海南省| 天柱县| 广平县| 遂昌县| 江西省| 政和县| 黄山市| 闸北区| 烟台市| 洪江市| 青神县| 榆林市| 哈巴河县| 墨竹工卡县| 宁强县| 曲松县| 谢通门县| 加查县| 崇左市| 全南县| 肥乡县| 鲁甸县| 凤庆县|