屬于計算機數據中心智能監測管理系統領域,涉及一種服務器溫度監控方法,具體的說是一種基于遠程管理通訊協議的服務器溫度監控系統及方法。
背景技術:
當今社會,隨著互聯網的高速發展,計算機數據中心的數量越來越多,規模越來越大,高密度的服務器搭建在數據中心的機房中,每臺服務器的溫度監控就顯得非常重要,溫度的異常,輕則導致服務器宕機,造成業務上的異常,重則引起火災,導致不可預期的嚴重后果。
現有技術中,服務器溫度監控方法有以下兩種:一是在服務器周圍部署溫度傳感器,但服務器內部溫度異常傳遞到溫度傳感器有時間延遲,采集數值也不夠精確,造成該方法將溫度異常通知到用戶時,已經錯過了最佳時機。二是在服務器操作系統上部署監控軟件,由軟件讀取服務器溫度并向外部發送,該方法會較大占用操作系統的系統資源和網絡數據傳輸帶寬,在操作系統異常時整個監控就會失效。
目前,隨著物聯網和嵌入式的飛速發展,在服務器主板上定制支持遠程管理和溫度采集的芯片的技術和方案已經很成熟,這為硬件級的服務器溫度監控方法提供了技術支持。
技術實現要素:
本發明所要解決的技術問題是,克服現有技術的缺點,提供一種基于遠程管理通訊協議的服務器溫度監控系統及方法,可以針對大數量、高密度的數據中心里的服務器,采用硬件級芯片的方案,通過遠程管理通訊協議,對服務器溫度進行監控,同時對采集到的溫度值進行匯總、分析、報警,預防由于溫度問題導致的服務器異常、數據中心安全隱患、數據中心能耗浪費。
本發明解決以上技術問題的技術方案是:
一種基于遠程管理通訊協議的服務器溫度監控系統,包括:
溫度采集模塊,用于采集服務器溫度,將采集到的溫度值,通過遠程管理通訊協議提供給其他模塊獲取;
溫度數據記錄模塊,與溫度采集模塊通訊,將溫度值記錄到數據庫中;
溫度數據分析模塊,用于提取溫度數據記錄模塊記錄在數據庫中的實時溫度值,對其進行匯總和分析;
溫度數據展示模塊,用于將溫度數據分析模塊產生的數據直觀具體的展示給用戶;
溫度數據報警模塊,用于對采集到的實時溫度值進行掃描、監控和報警,當實時溫度值異常時,及時的通過監控系統或短信通知用戶,防止溫度異常造成的進一步損失;
所述溫度數據分析模塊包括:
小時溫度記錄子模塊,首先每隔一個小時,將這一個小時的實時溫度值取平均值,記錄在小時溫度值表中;
天溫度記錄子模塊,每隔一天,將小時溫度值表中這一天的溫度值取平均值,記錄在天溫度值表中;
數據分析模塊子模塊,通過實時、小時、天,這3個時間維度的溫度值之后,分析一天之中的最高溫度出現在哪個時間段,意味著哪個時間段負載最高,機房中哪些位置的服務器溫度較高,哪些位置的服務器溫度較低,溫度高的說明制冷不夠,需要加強,溫度低的說明制冷過度,需要調整。
一種基于遠程管理通訊協議的服務器溫度監控方法,包括以下步驟:
㈠采集服務器溫度,將采集到的溫度值,通過遠程管理通訊協議提供給其他模塊獲取;
㈡與溫度采集模塊通訊,將溫度值記錄到數據庫中;
㈢提取記錄在數據庫中的實時溫度值,對其進行匯總和分析;
㈣將溫度數據分析模塊產生的數據直觀具體的展示給用戶;
㈤對采集到的實時溫度值進行掃描、監控和報警,當實時溫度值異常時,及時的通過監控系統或短信通知用戶,防止溫度異常造成的進一步損失;
步驟㈢具體包括:
⑴每隔一個小時,將這一個小時的實時溫度值取平均值,記錄在小時溫度值表中;
⑵每隔一天,將小時溫度值表中這一天的溫度值取平均值,記錄在天溫度值表中;
⑶通過實時、小時、天,這3個時間維度的溫度值之后,分析一天之中的最高溫度出現在哪個時間段,意味著哪個時間段負載最高,機房中哪些位置的服務器溫度較高,哪些位置的服務器溫度較低,溫度高的說明制冷不夠,需要加強,溫度低的說明制冷過度,需要調整。
本發明的有益效果是:⑴基于硬件的溫度采集,穩定,高效:溫度采集芯片位于服務器主板上,不受操作系統和各種軟件的干擾,即使服務器關機,仍然可以采集;因為不是傳統的軟件采集形式,所以沒有占用珍貴的服務器系統資源。⑵數據分析功能健全:系統將采集到的實時溫度值,按照小時、天的粒度,統計出平均值、最高值、最低值,為展示和報警功能提供基礎數據。⑶歷史數據可追溯:實時采集溫度值、數據分析生成的各種粒度、維度的溫度值,都記錄在系統的數據庫中,歷史數據可以很方便的進行追溯、查詢。⑷溫度監控展示合理:在基礎數據的支撐下,可以向用戶展示各種粒度、維度的溫度監控;比如實時溫度顯示、溫度歷史曲線圖、各種用戶定制的溫度報表。⑸溫度報警及時:系統在進行實時溫度采集的同時,會監控溫度值,如果某臺服務器的溫度異常,將會在實時溫度顯示界面進行明顯的報警顯示,并通過郵件、手機短信等方式向監控系統用戶進行報警提示,保證溫度異常的及時報警。
附圖說明
圖1為本發明的部署示意圖。
具體實施方式
實施例1
本實施例是一種基于遠程管理通訊協議的服務器溫度監控系統,本實施例服務器采用的主板嵌有定制的溫度監控芯片,服務器采用的主板上嵌有支持遠程管理通訊協議的芯片,該芯片采集溫度,并支持外部讀取,現在物聯網和嵌入式技術高速發展,定制這種芯片很方便。
本實施例溫度數據處理服務器部署,將負責溫度匯總、分析、報警的溫度數據處理服務器部署在用戶數據中心網絡中,保證可以和所有嵌有溫度監控芯片的服務器通訊。服務器裝有linux操作系統,并安裝mysql數據庫。溫度匯總、分析、報警分成3個linux程序運行在操作系統上,以降低耦合。
本實施例基于遠程管理通訊協議的服務器溫度監控系統包括:
溫度采集模塊,用于采集服務器溫度,將采集到的溫度值,通過遠程管理通訊協議提供給其他模塊獲取;該模塊的任務是進行服務器溫度采集,定制服務器主板上的芯片,用于采集服務器的溫度,該采集方案不依賴于操作系統,也不占用系統資源,完全硬件級,高效,穩定,即使在操作系統關機情況下依然可以正常工作。采集到的溫度值,通過遠程管理通訊協議,提供給其他子模塊獲取;
溫度數據記錄模塊,與溫度采集模塊通訊,將溫度值記錄到數據庫中;該模塊與溫度采集子模塊中的芯片通訊,將溫度值記錄到數據庫中;通訊周期可根據業務需要進行設置,周期越短溫度值的記錄密度越高,更利于迅速發現問題,但代價是對存儲空間要求也會相應的提高;該模塊記錄的數據為其他模塊進行數據分析提供數據基礎;
溫度數據分析模塊,用于提取溫度數據記錄模塊記錄在數據庫中的實時溫度值,對其進行匯總和分析;
溫度數據展示模塊,用于將溫度數據分析模塊產生的數據直觀具體的展示給用戶;溫度數據展示模塊主要通過儀表、曲線圖、報表展示給用戶。其中,所述儀表用于展示各個服務器當前的溫度值,給用戶實時、直觀的展;曲線圖用于展示歷史溫度曲線,曲線圖的粒度可以變化,可以設置為實時溫度曲線圖、小時溫度曲線圖、天溫度曲線圖,方便用戶從不同粒度了解溫度的變化情況;報表用于系統、直觀的將經過統計的溫度情況展示給用戶,每一類報表都有自己獨有的統計方法,可以根據用戶需求進行定制,展現不同維度的統計情況。
溫度數據報警模塊,用于對采集到的實時溫度值進行掃描、監控和報警,當實時溫度值異常時,及時的通過監控系統或短信通知用戶,防止溫度異常造成的進一步損失;
溫度數據分析模塊包括:
小時溫度記錄子模塊,首先每隔一個小時,將這一個小時的實時溫度值取平均值,記錄在小時溫度值表中;
天溫度記錄子模塊,每隔一天,將小時溫度值表中這一天的溫度值取平均值,記錄在天溫度值表中;
數據分析模塊子模塊,通過實時、小時、天,這3個時間維度的溫度值之后,分析一天之中的最高溫度出現在哪個時間段,意味著哪個時間段負載最高,機房中哪些位置的服務器溫度較高,哪些位置的服務器溫度較低,溫度高的說明制冷不夠,需要加強,溫度低的說明制冷過度,需要調整。
本實施例的一種基于遠程管理通訊協議的服務器溫度監控方法,包括以下步驟:
㈠采集服務器溫度,將采集到的溫度值,通過遠程管理通訊協議提供給其他模塊獲取;
㈡與溫度采集模塊通訊,將溫度值記錄到數據庫中;
㈢提取記錄在數據庫中的實時溫度值,對其進行匯總和分析;
㈣將溫度數據分析模塊產生的數據直觀具體的展示給用戶;
㈤對采集到的實時溫度值進行掃描、監控和報警,當實時溫度值異常時,及時的通過監控系統或短信通知用戶,防止溫度異常造成的進一步損失;
步驟㈢具體包括:
⑴每隔一個小時,將這一個小時的實時溫度值取平均值,記錄在小時溫度值表中;
⑵每隔一天,將小時溫度值表中這一天的溫度值取平均值,記錄在天溫度值表中;
⑶通過實時、小時、天,這3個時間維度的溫度值之后,分析一天之中的最高溫度出現在哪個時間段,意味著哪個時間段負載最高,機房中哪些位置的服務器溫度較高,哪些位置的服務器溫度較低,溫度高的說明制冷不夠,需要加強,溫度低的說明制冷過度,需要調整。
除上述實施例外,本發明還可以有其他實施方式。凡采用等同替換或等效變換形成的技術方案,均落在本發明要求的保護范圍。