專利名稱:測量具有多個網絡組件的網絡的各方面的方法和系統的制作方法
測量具有多個網絡組件的網絡的各方面的方法和系統技術領域
本發明通常涉及網絡中功率和冷卻(cooling)的監控和管理,更具體說,涉及測量具有多個網絡組件的網絡的各方面的方法和系統。
背景技術:
能耗以近年來加速的趨勢持續逐步升高。正因為此,各個行業對這些上升成本的影響日益敏感。已引起越來越多監督的一個領域是IT基礎設施。許多公司目前正著眼于他們IT系統的功率利用率從而確定是否可以減少能耗。為此,興起了集中于高能效(energy efficient)網絡的行業以從總體上處理IT設備利用率(例如,PC、顯示器、打印機、服務器、 網絡組件等)的上升成本。測量功率利用率的傳統方法使用侵入性儀器來測量每個組件。
現代網絡組件正日益實現能耗和能效(energy consumption and efficiency) (ECE)控制機制。一些ECE控制機制允許物理層組件進入和退出低功率狀態。ECE控制策略控制何時和何種情況下ECE控制使能的物理層組件進入和退出低功率狀態。設備控制策略在使節能最大化而使對網絡的性能影響最小化方面起關鍵作用。
即使當使用現代ECE機制實現網絡時,仍然沒有測量和控制各種鏈接系統設備的運行特征的非侵入性方法。發明內容
根據本發明的一個方面,提供一種系統,所述系統用于測量具有多個網絡組件的網絡的各方面(aspects),所述系統包括
監控器,所述監控器用于采集所述多個網絡組件的至少一個的運行特征;
分析器,所述分析器用于
分析從所述監控器接收的所述采集的運行特征;以及
基于所述采集的運行特征估計所述多個網絡組件中未被監控(immonitored)的一個網絡組件的特征。
優選地,所述分析器還用于生成至少一個所述特征的地圖顯示(map display)。
優選地,所述多個網絡組件中所述未被監控的一個網絡組件的特征的所述估計基于來自所述采集的運行特征的外推(extrapolation)。
優選地,所述多個網絡組件具有超額訂購(oversubscribed)的功率配置。
優選地,所述采集的運行特征包含監控組件利用低功率模式所采用的頻率的測量。
優選地,使用高能效以太網(EEE)機制實現所述低功率模式。
優選地,所述采集的運行特征包含與監控組件關聯的鏈路利用亞速率(subrated) 模式所采用的頻率的測量。
優選地,所述采集的運行特征包含與監控組件上正執行的應用程序對應的信息。
優選地,所述系統還包括日志,其中所述分析器還用于
在所述日志中存儲采集的運行特征;以及
基于所述采集的運行特征和從所述日志檢索的信息估計所述多個網絡組件中未被監控的一個網絡組件的特征。
優選地,所述系統還包括參考存儲(reference store),其中所述分析器還用于
從所述參考存儲檢索關于網絡組件的參考信息;
在存儲器中存儲所述檢索的參考信息;以及
基于所述采集的運行特征和所述存儲器中存儲的參考信息估計所述多個網絡組件中未被監控的一個網絡組件的特征。
優選地,所述關于網絡組件的參考信息包含其中之一
所述網絡組件的物理特征,
所述網絡組件的額定功率,
所述網絡組件的推薦溫區,以及
所述網絡組件的推薦濕度區。
優選地,所述系統還包括與網絡組件關聯的控制策略,其中所述分析器還用于
檢索與所述網絡組件關聯的所述控制策略,以及
基于所述采集的運行特征和所述控制策略估計所述多個網絡組件中未被監控的一個網絡組件的特征。
優選地,所述控制策略與實現高能效以太網(EEE)機制的網絡組件相關聯。
優選地,所述系統還包括與所述多個網絡組件關聯的拓撲參考(topology reference),其中所述分析器還用于
從所述拓撲參考檢索所述網絡的所述拓撲,上述拓撲與所述多個網絡組件的其中之一相關聯,以及
基于所述采集的運行特征和所述檢索的拓撲估計所述多個網絡組件中未被監控的一個網絡組件的特征。
優選地,所述系統還包括
控制器,其中所述控制器用于
基于至少一個所述采集的運行特征和所述估計特征生成配置指令,以及
向所述多個網絡組件的至少一個發送所述配置指令。
優選地,所述配置指令是控制策略調整(control policy modification)、以及所述多個網絡組件的至少一個是實現高能效以太網(EEE)機制的設備。
優選地,所述配置指令用于相對所述多個網絡組件的至少一個推廣目標(promote a goal)ο
優選地,所述目標指提高效率。
優選地,所述目標指提高性能。
優選地,所述系統還包括
與所述多個網絡組件的其中一個的特征相關聯的閾值,其中如果超出閾值,所述控制器則基于所述閾值超出特征用于生成響應配置指令。
優選地,所述響應配置指令包含具有所述閾值超出特征的所述組件的禁用功能 (disabling function)。
優選地,所述閾值是功率使用閾值。
優選地,所述生成的響應配置指令包含EEE控制策略,所述EEE控制策略用于減少具有閾值超出特征的所述組件的功率利用率。
優選地,所述多個網絡組件具有超額訂購的功率配置。
優選地,所述運行特征、所述估計特征和所述生成的配置指令涉及冷卻網絡組件。
優選地,所述分析器還用于生成地圖式的熱圖顯示(map heat map display)。
優選地,所述多個網絡組件的其中之一是交換機和路由器的其中一個。
優選地,所述多個網絡組件的其中之一是主機。
優選地,所述控制策略調整是指與交換機上的端口相關聯的能效設定。
優選地,所述控制策略調整是指提高傳輸路徑(traffic path)的能效。
優選地,將所述多個網絡設備分為兩個或多個監控組。
優選地,每個所述監控組與用戶相關聯。
根據本發明的另一方面,提供了一種方法,所述方法測量具有多個網絡組件的網絡的各方面,所述方法包括
監控所述多個網絡組件的至少一個的運行特征;以及
基于所述監控的運行特征估計所述多個網絡組件中未被監控的一個網絡組件的特征。
優選地,所述方法還包括
基于所述監控的運行特征和所述估計特征的至少一個生成配置指令;以及
向所述多個網絡組件的至少一個發送所述配置指令。
優選地,所述方法還包括從參考存儲檢索關于網絡組件的參考信息;以及
其中,所述估計包括基于所述采集的運行特征和從所述參考存儲檢索的參考信息估計所述多個網絡組件中未被監控的一個網絡組件的特征。
優選地,所述方法還包括
在所述日志中存儲采集的運行特征;以及
從所述日志檢索關于網絡組件的日志信息,
其中,所述估計包括基于所述采集的運行特征和檢索的日志信息估計
所述多個網絡組件中未被監控的一個網絡組件的特征。
以下將參照附圖結合說明書對本發明進行詳細描述,以進一步解釋本發明的原理和使本領域技術人員能夠制造和使用本發明。
圖IA是測量具有多個網絡組件的網絡的運行特征的傳統方法的框圖IB是測量具有多個網絡組件的網絡的運行特征的另一傳統方法的框圖2是根據本發明實施例的測量具有多個網絡組件的網絡的運行特征的方法的框圖3A是根據本發明實施例的在具有多個網絡組件的網絡中測量和控制運行特征的方法的框圖;3B是顯示全局(glcAal)控制策略管理器的不同實施例的框圖4是根據本發明實施例的描述用于測量、分析、外推和控制網絡運行特征的控制器的詳細視圖的框圖5是根據本發明實施例的描述網絡中多個監控組的框圖6是根據本發明實施例的描述網絡中多個監控組和全局控制策略管理器 (GCPM)的框圖7是根據本發明實施例的描述具有超額訂購的功率配置的網絡中多個監控組的框圖8是根據本發明實施例的描述具有監控冷卻系統的網絡中多個監控組的框圖9是根據本發明實施例的測量和控制具有多個網絡組件的網絡各方面的方法的流程圖。
結合附圖描述本發明。附圖標記最左邊的數字用于標識該附圖標記首次出現時的那幅附圖的編號。
具體實現方式
本發明的以下詳細描述參考附圖,所述附圖闡述與該發明一致的示例性實施例。 其他實施例是可能的,而且在本發明的精神和范圍內可對實施例進行修改。因此,詳細描述的目的不是限制本發明。相反地,本發明的范圍由附屬的權利要求進行限定。
本發明的特征和優點在以下的描述中得以闡述,從描述中其部分是顯而易見的、 或者可通過本發明的實踐來學習。本發明的優點由結構實現和達到,并在其撰寫的描述和權利要求中以及附圖中特別指出。以下詳細描述是示例性和解釋性的,并旨在為所要求保護的發明提供進一步解釋。
說明書中針對“一個實施例”、“實施例”、“一個示例實施例”等的引用,指的是描述的該實施例可包括特定的特征、結構或特性,但是不是每個實施例必須包含這些特定特征、 結構或特性。此外,這樣的表述并非指的是同一個實施例。進一步,在結合實施例描述特定的特定、結構或特性時,不管有沒有明確的描述,應該理解的是已經表明將這樣的特征、結構或特性結合到其它實施例中是屬于本領域技術人員的知識范圍內的。
概述
一般而言,這里所描述的某些實施例提供了測量和控制網絡組件的改進方法。相比上述侵入性測量方法,這里所描述的某些實施例監控網絡組件的代表性樣本、然后向網絡中的其他組件外推收集的度量值。
實施例的監控不僅包含傳統測量的環境度量值(溫度、濕度),而且包含涉及現代高效節能(energy conservation and efficiency) (ECE)機制的統計值。使用分析方法, 現代ECE-使能組件收集和利用的相同統計值(例如,利用率、空閑時間、數據流量等)可用于估計和預測網絡中不同連接組件的資源需求。這里所使用的術語“外推”、“估計”、“衍生” 和“預測”用于描述使用收集的系統特征時的相似操作。
僅通過測量數據中心組件的較少量樣本,這一發明減少了數據中心監控和控制中涉及的侵入性和支出。一旦確定資源需求,可觸發不同的動作來使能不同功能。
傳統數據中心測量
圖IA是測量具有多個網絡組件的網絡的運行特征的傳統方法的框圖。圖IA顯示服務器機柜(server rack) 190A-C、交換機160A-B、監控器120和網絡101。每個機柜190A-C分別包含主機150A-DU50E-H和150I-L。
這里與某些實施例一起使用的是,運行特征包含組件的環境特征(溫度、濕度)和功率利用。在傳統系統100中,監控器120可以是臨時地或永久放置在數據中心的簡單溫度傳感器。相關領域技術人員理解的是,特征的傳統測量可具有以下限制特征M1-M7的任一結合
Ml.測量的特征可能僅僅是環境特征(溫度、濕度),而不是與高效節能相關的全套特征。
M2.測量可能僅僅是臨時的、僅在有限時間針對特定的組件和/或空間。
M3.測量可能僅針對環境特征(例如,溫度)、而不是特定組件的特征。
M4.當特定地測量組件時,能夠測量小子集的“關鍵”組件、而不是大多數組件。
M5.盡管傳統測量設備的收集能力有限,上述設備的大規模部署過于昂貴和/或侵入性、而且通常并沒有進行。
M6.傳統測量能力不提供大部分數據中心的全局視圖和單個設備的特定視圖。如 M4中所述,許多情況下僅測量關鍵設備。
M7.傳統測量系統不會基于現代高效節能信息用于接收、分析和估計。
如這里某些實施例所使用的,每個主機150A-L可以是具有各種計算機系統配置的計算機,包含多核多處理器系統、小型計算機、大型計算機、與分布式功能鏈接或集群的計算機、以及事實上嵌入任一設備的普遍或微型計算機。在實施例中,可將較大能力和/或性能的主機150A-L叫做計算機服務器或僅叫做服務器。
如這里某些實施例所使用的,機柜190A-C是用于安裝多個設備模塊的標準化框架或外殼。在示例性實施例中,主機150A-D安裝在機柜190A中。例如,術語“機柜”在這里的使用對描述數據中心中組件的收集有益,但應該注意的是,這里描述的某些實施例的方法可以任一配置(例如,獨立或放于機柜(racked))應用于網絡硬件。
這里使用的網絡101可以是任一類型的任何一個或多個網絡,其包括但不限于局域網、中域網或廣域網(例如,因特網)。
如這里描述的某些實施例所使用的,網絡交換機160A是具有數據端口的網橋設備,所述數據端口可額外具有路由/交換能力,例如L3交換機/路由器。該交換機可具有少達兩個數據端口或多達400個或更多數據端口、并且能夠以全雙工形式從任一端口向其他端口弓丨導流量,有效地使任一端口充當輸入和任一端口充當輸出。此處,為便于討論可將數據端口和它們相應的鏈路交換地稱為數據信道、通信鏈路、數據鏈路等。
因為圖中的物理描述不應該理解為限制性的,這里使用的交換機160A和主機 150A可包含在單個物理設備(未顯示)中結合的主機150A和交換機160A。在一個實施例中,交換機160A也廣泛包含在現代分層交換架構(switching architecture)中開關邏輯的使用。在實施例中,在單個設備中,交換機160A的功能可與主機150A的功能物理結合, 例如,在服務器上集成2-端口虛擬交換(v-switch)功能。交換機160A也可利用較高層功能(layer functionality),例如訪問控制列表(ACL)和L4交換/路由方法。
圖IB是測量具有多個網絡組件的網絡的運行特征的另一傳統方法的框圖。圖IB 描述與圖IA相似的系統,其具有附加的機柜監控器125A-C且不具有監控器120。
如傳統系統110的某些實現方式所使用的,機柜監控器125A-C是用于測量系7統110運行特征的傳統儀器的實例。測量的系統特征包含溫度、濕度和功率吸收(power draw)。在方法中(未顯示),與機柜監控器125A-C相似的儀器安裝在主機150A-L上。
如以上背景部分所述,這一傳統監控方法,即單個網絡組件的粗放型 (extensive)、侵入性監控是不提供系統110資源的綜合視圖的高成本方法。外推監控
圖2是根據本發明實施例的監控和/或測量具有多個網絡組件的網絡的運行特征的方法的框圖。圖2描述監控組257中具有機柜280和機柜^OA-B、監控器255和分析器 251的系統210。交換機160A-B也與網絡101連接。系統210可能是較大的互聯數據中心的子集,所述數據中心具有由網絡101連接的、與主機150A-L相似的附加主機和與交換機 160A-B相似的附加交換機。
相比圖IA-B中詳細說明的傳統方法,圖2具有監控組257,所述監控組257具有附有連接的測量儀器(監控器25 的單個機柜280和不具有測量儀器的兩個機柜四(^-8。 監控組257可能是這里描述的某些實施例所監控的網絡組件的收集(某些未顯示)。
監控器255可測量和收集網絡組件的運行特征。分析器251可接收監控器255從網絡組件的子集收集的運行特征、分析收集的特征、并進一步將特征與參考信息結合以及衍生出關于相關網絡組件的估計特征。例如,監控器255可收集與機柜280關聯的組件的運行特征,隨后由分析器251分析所述運行特征,從而分析器251可使用參考信息(未顯示) 衍生出關于機柜^OA-B的估計特征。
運行特征
為了外推關于相關網絡組件的估計特征,分析器251從網絡組件接收各種類型的運行特征。運行特征的實例包含物理層(PHY)信息、鏈路信息、應用程序信息和高效節能 (ECE)信息。有權使用此處教條的相關領域技術人員理解的是,廣泛的信息、特征和策略等將視為這里使用的網絡組件的運行特征。
物理層(PHY)信息可涉及網絡組件自身的運行特征或能力,所述運行特征包含的特征例如網絡組件當前可用的支持鏈路速率、組件利用的當前運行模式(例如,子集模式、 低功率空閑(LPI)狀態)等。
鏈路信息可涉及網絡組件間鏈路的利用。鏈路信息的實例包含使能實際鏈路利用測量的流量緩沖器充滿程度(traffic buffer fullness)和脈沖參數(burstiness parameter)(例如,鏈路上脈沖大小(size of the bursts)、脈沖間的時間、鏈路上的空閑時間等)。另一實例是鏈路容量利用率超時的百分比,例如,如果IOG鏈路的平均利用率在一段時間總是少于1G,然后這可以是鏈路利用的有用測量。
應用程序信息可包含監控的網絡組件上當前正執行的應用程序。應用程序信息監控也可捕捉監控系統上執行的應用程序的一般類型。例如,就繁重的連續處理需求而言,監控主機150B可正在執行銀行應用程序(banking application)。替代性地,就循環的繁重交易負荷而言,主機150B可正在執行電子商務應用程序交易。通過考慮監控的網絡組件上執行的應用程序,實施例可改進估計的精度。
其他類型的應用程序信息可包含執行應用程序的時間、應用程序的輸入/輸出需求以及其他相似信息。應用程序信息也可涉及管理網絡組件運行的系統應用程序的特征。
有用的應用程序信息的另一實例包含所分析的網絡組件中通過的應用程序流 (application stream)。現代網絡組件可作用于多個應用程序流。在幫助外推關于其他網絡組件的特征時,關于執行流的類型和性能的應用程序信息可以是有益的。例如,在沒有虛擬化的L2交換機中,經過組件的以太網音視頻橋接(AVB)流的認知可與其他收集的信息相結合、從而改進這里描述的外推的精度。
在給出此處的描述后,相關領域技術人員應該理解的是,當由本發明的實施例收集和分析時,各種附加類型的應用程序信息可提供有用的運行特征。
在給出此處的描述后,相關領域技術人員應該理解的是,ECE信息可包含與高效節能(ECE)相關的各種運行特征。某些實施例受益使用的一種ECE信息是來自使用ECE控制機制來改進網絡中ECE的現代設備的信息。某些現代設備收集和存儲關于ECE機制和網絡利用率的廣泛的統計值,并且某些組件可使這些統計值對實施例實時可用。
如此處所使用的,高效節能(ECE)控制機制用于參考用于控制設備的高效節能的各種現代技術。一般而言,這些ECE機制用于減少能耗和提高效率、并維持性能的可接受水平。
ECE控制機制的一個實例是用于使用IEEE標準802. 3az -2010標準的機制,其也稱為高能效以太網(EEE)并在此處引用作為參考。EEE是在物理層(PHY)設備的選擇組中用于在以太網網絡中節能的IEEE建議標準。
EEE標準范圍內涉及的示例性PHY包含100BASE-TX和1000BASE-T PHY,以及形成 1OGBASE-T技術和背板接口,例如10GBASE-KR。
應用于EEE使能交換機的示例性ECE控制機制可監控和生成關于交換機中TX緩沖器的統計值、并在特定環境下引導交換機進入低功率空閑(LPI)狀態。這里描述的某些實施例收集和使用運行特征,所述運行特征包括從LPI使能設備生成的統計值,上述統計值對應于這些設備何時進入和退出LPI狀態。與上述鏈路容量利用率測量的百分比一起, 設備花在LPI上的時間百分比可能是有用的運行參數。
在含有具有高效節能能力的設備和不具有這種能力的設備的網絡拓撲中,可收集 ECE統計值并向非-ECE使能設備的運行外推該ECE統計值。例如,在交換機160A中,某些端口可具有使能的ECE測量,而某些端口則可能不具有使能的這些測量。
存在某些實施例可受益使用的附加類型的運行特征。
一旦實施例收集并分析運行特征,可衍生和/或生成關于非監控組件的估計特征。例如在系統210中,可分析監控器255收集的關于機柜觀0中主機150A的運行特征, 并且將結果外推至機柜^OA中未被監控的主機150E。
如以下結合圖3A的描述所討論的,分析器251可以是較大控制設備中的組件,上述設備使用估計特征來控制網絡設備。另外,如結合圖4的描述所討論的,分析器251可與參考信息和日志信息結合,上述附加信息使能附加組件特征的估計。
控制網絡組件
圖3A是測量和控制網絡中網絡組件的運行配置的方法的框圖。圖3中描述的系統與圖2中描述的系統相似,其具有顯示分別具有組件控制管理器310A-B的機柜280和 ^K)A。在圖3A描述的實施例中,分析器251的功能集成在控制器350中。以下在圖4中, 與分析器251相似的分析器描述為與控制器350相似的控制器中的組件。
根據實施例,控制器350從監控器255收集運行信息、并基于收集的運行信息的分析生成配置指令。
在實施例中,控制器350可與系統310的硬件交互并協調組件ECE機制、控制策略和其他相關控制。控制器350的實施例也可使執行的應用程序的需求和其他網絡考慮因素 (network consideration)相平衡,例如性能、安全性等。在實施例中,通常為系統以及特定為應用程序設定的其他性能特征和目標可使控制器350改善ECE性能的效應得以平衡、協調和另外改變。
在實施例中,控制器350可遵循用戶或外部自動處理手動生成的控制策略。在另一實施例中,控制器350受其(或未顯示的其他組件)自動生成的控制策略的引導,控制器 350 (或未顯示的其他組件)通過收集關于系統310運行和組件的數據生成所述控制策略。 也可結合上述手動和自動方法。如以下結合圖4-8所討論的,例如,可通過功率預算、閾值、 功率利用率限制和應用需求引導控制器350。
在實施例中,控制器350可使用ECE策略參數來改變網絡組件的配置。ECE策略參數可涉及管理控制策略的分析和/或運行的那些參數,所述控制策略為網絡組件而設定。 例如,當配置網絡組件時,策略參數可設定為管理設備的ECE運行,該策略參數包含鏈路利用閾值、IT策略、用戶參數等。
應該理解的是,將獨立實現一套特定運行特征的接收、對運行特征執行分析以及基于運行特征的分析生成配置指令的過程。不管使用的收集的數據和分析機制,明顯的是, 控制器350合并、分析并利用網絡組件的功率信息,從而引導特定組件的配置。在實施例中,控制器350可使用收集的運行特征來通常控制鏈路配置和路由/交換的各方面。
圖;3B闡述了具有替代性物理和邏輯配置的、用于與圖2-3A中監控器255和控制器350的不同實施例的系統310。每個描述的監控器355A-D和控制器350A-D的放置是非限制性的,并呈現為可單獨地或與其他各個監控器355A-D和控制器350A-D組件協調運行的放置。例如,系統310可具有單個監控器355A、兩個監控器355A-B、或者所有的四個監控器355A-D組件。實施例可使用控制器350A-D的相似結合。
在實施例中,在圖:3B中將監控器355A和控制器350A描述為部分監控組357A并在所有描述的部件之外。在另一描述的實施例中,在圖3B中將監控器355B和控制器350B分別描述為部分機柜280和^0A。在另一實施例中,在圖:3B中將監控器355C和控制器350C 分別描述為部分主機150E和150L。在最后的實施例中,將監控器355D和控制器350D分別描述為位于交換機160A和160B中。重要的應注意的是,實施例中上述監控器/控制器對不需要共同放置。在不同實施例中可使用監控器/控制器的任一結合。
圖;3B的放置圖示并不是限制性的。相關領域技術人員將理解的是,這里描述的監控器355A-D和控制器350A-D的功能可位于上述系統范圍內的各種位置,且實現為軟件或硬件或二者的結合。
運行特征分析
圖4是根據本發明實施例的描述用于測量、分析、外推和控制網絡運行特征的控制器的詳細示圖的框圖。控制器450描述為具有分析器451、數據收集器420、控制策略435 和拓撲445。參考460和日志470描述為與控制器450連接。如上所述,分析器451具有與圖2的分析器251相似的功能。
如圖2中所述,在某些實施例中,分析器251根據收集的監控網絡組件的運行特征執行分析。分析器451執行附加分析,上述分析受檢索可用的附加信息(例如,其他相關信息)通知。
在上述控制器450的運行實例中,數據收集器420從監控器255(未顯示)收集運行特征,分析器451分析該信息。在實施例中,分析器451將參考460、日志470、控制策略 435和拓撲445提供的附加相關信息與收集的運行特征相結合。
在給出此處的描述后,相關領域技術人員應該理解的是,分析器451可存儲各種類型的信息并受益地將其與收集的運行特征相結合。類型T1-T4的以下列表意圖是具有說明性討論的不同類型相關數據的非限制性示例性列表。
Tl.日志數據(log data):在實施例中,日志470可用于為后續檢索存儲收集的運行特征。例如,超時收集的不同特征(例如,功率利用率、溫度、應用程序執行)可存儲在日志470中用于檢索。例如,分析器451可將功率利用率在每天特定時間增加的確定模式 (determined pattern)與其他特征(例如該時間執行的應用程序)相結合。
T2.拓撲數據在實施例中,拓撲445存儲相關網絡(主機、交換機、鏈路)的特征, 并可為收集自監控組件的數據應用于未被監控組件的運行提供構架。
T3.參考數據在實施例中,參考460可提供具有識別的網絡組件的物理特征的參考。例如,現代服務器具有詳細的額定功率、推薦溫區和濕度區以及其他通常的物理特征, 分析器451和/或指令生成器430可將上述特征與其他信息有益結合。
T4.控制策略信息如在此通常使用的,控制策略廣泛地用于描述可控制網絡組件的指導方針(guiding policy),例如ECE控制策略。例如,交換機的控制策略可描述交換機何時和在何種情況下進入和退出節能的低功率狀態。控制器450可使用控制策略來控制系統中的一個或多個物理或虛擬設備。控制策略(也稱為物理控制策略或設備控制策略) 為EEE使能設備增加了附加層控制。
例如,控制策略435可存儲所有連接的網絡組件的控制策略。同樣地,作為網絡中的組件,控制器450也可具有引導它的節能功能的獨立控制策略。
應該注意的是,本發明的原理可廣泛應用于與這里討論的情形相似的各種情形, 例如在所有實現ECE的PHY中(例如,背板、雙絞線、光纖等)。此外,本發明的原理可應用于標準或非標準鏈路速率(例如,2. 5G、5G、100M、IG和IOG光線接口、PON等)以及未來鏈路速率(例如,406、1006、4006、兆兆位等)。還應該注意的是,本發明的原理可應用于給定的非對稱或對稱的鏈路。這里的教條并不是限制特定的媒介類型。除了這里所提及的那些, 其他存在或不存在的媒介類型(例如,結構化布線、光纜等)也可使用這里的方法。
應該理解的是,將獨立實現一套特定運行特征的接收、對運行特征執行分析以及基于運行特征控制網絡組件的過程。不管使用的收集的數據和分析機制,明顯的是,控制器 450使用收集的關于組件的信息來引導網絡組件的協同控制。
監控組
圖5是根據本發明實施例的描述網絡中多個監控組的框圖。監控組557A-B分別具有機柜590B-C和機柜590D-G。監控組557A中的機柜590B和監控組557B中的機柜590F 分別描述為具有與其連接的監控器^5A-B。機柜590A描述為不是監控組的部分。
在實施例中,每個監控組可相當于數據中心服務的特定客戶。例如,監控組557A 和557B可分別相當于使用數據中心資源來運行應用程序和監控的第一客戶和第二客戶。
這里描述的某些實施例使用測量的、與附加相關信息(以上的實例T1-T4)結合的運行特征,從而確定每個監控組557A-B的估計特征。在圖5顯示的實例中,監控器555A通過監控機柜590B的組件可向控制器550提供有用信息、從而確定監控組557A的估計特征。以下列表C1-C7意指收集的運行特征和相關附加數據的其他非限制性實例,控制器550可使用所述收集的運行特征和相關附加數據來確定監控組557A的集合特征(aggregate characteristic)。這一實例通常也可應用于這里描述的其他實施例。在這一實例中,集合特征是組內所有組件的實時功率吸收。重要的是,應注意,為了方便起見,機柜590B用作組件的示例性收集。可使用系統500組件的其他收集而不背離這里所描述的發明的精神。收集特征的實例C1-C7闡述實施例的運行,具體如下Cl.機柜590B的組件的功率吸收。在給出此處的描述后,相關領域的技術人員應理解的是,機柜590B的組件可包含主機、交換機、路由器和其他網絡組件。應該理解的是, 監控器555A可應用于不同結合的測量組件。例如,監控器555A可應用于機柜590B的單一主機組件(未顯示)、可用組件的任一結合(例如,機柜590B的所有主機)或子集。C2.機柜590B的單一主機組件(未顯示)、或可用組件的任一結合、或機柜590B 的所有主機的運行溫度。當測量溫度時,監控器陽5々可應用于圍繞機柜590B的不同物理區域。C3.圍繞機柜590B的不同物理區域的濕度。C4.機柜590B上運行的一個或多個主機當前執行的應用程序。C5.與機柜590B關聯的鏈路的特征,包含機柜590B和其他網絡組件之間鏈路的利用、流量緩沖器充滿程度、鏈路上脈沖的尺寸、脈沖間的時間、鏈路上的空閑時間等。采用這里討論的任一測量的運行特征,可超時收集并分析鏈路容量利用率的百分比。C6. ECE控制機制的狀態可由監控器555A收集。例如,可收集入口或出口鏈路是否已空閑、或是否亞速率、以及機柜590B的組件是否已經處于節能低功率模式中。C7.當前控制機柜590B的組件的ECE控制策略。在某些實施例中,至少由于它們與控制組件相關的預測值分析控制策略,例如,控制策略描述時間、觸發事件和特定行為的結果。在給出此處的描述后,相關領域技術人員應該理解的是,實施例可收集并使用相似的運行特征,從而有益地測量和控制監控組的組件。全局控制策略管理器圖6是根據本發明實施例的描述網絡中多個監控組和全局控制策略管理器 (GCPM)的框圖。GCPM 680描述為具有全局控制策略685并與監控組657A-B連接。監控組 657A-B分別描述為具有控制器655A-B。如這里所使用的,全局控制策略(GCP)685的實施例是說明單個設備控制策略的高階目標的配置策略,從而推廣與實現的網絡作業關聯的不同結果。在另一實施例中,GCP 685可具有設定,所述設定是指推廣與不同組件、通常與主機和虛擬化作業的結合相關聯的結果。獲得此處教導的相關領域技術人員應該理解,GCP 685中概述的全局系統控制策略可具有不同的細節層次、并可應用于不同類型的相關考慮因素。根據實施例,GCPM 680可與實現的網絡作業的需求交互、與系統600的硬件交互并使用GCP685來協調它們的ECE機制、控制策略和其他相關控制。GCP 685的實施例也可使實現的網絡作業的需求和其他網絡考慮(例如,性能、安全性等)得以平衡。在實施例中, 通常為系統以及特定為虛擬化作業設定的其他性能特征和目標可使GCPM 680改善ECE性能的效應得以平衡、協調和另外改變。2010年6月10日申請的、申請號為No. 12/813,085 (律師事務所案卷號為 #2875. 3940000)、題為“全局控制策略管理器”的美國專利申請中公開了全局控制策略管理器(GCPM) 680的實例,該專利申請在此全文引用(“GCPM申請”),以供參考。在實施例中,GCP 685可由用戶或外部自動處理手動生成。在另一實施例中,GCP 685由GCPM 680通過收集關于實現的網絡作業和系統600組件的數據自動生成,并且其自動選擇有益的全局策略。上述手動和自動方法還可結合。在實現GCP 685時,GCPM 680可接收關于網絡組件的各種類型的ECE/功率相關信息(功率信息)。在實施例中,GCPM 680還可指導配置改變從而影響這一功率信息接收自的組件。這一功率信息的實例包含物理層(PHY)信息、鏈路信息、ECE控制策略信息和應用程序信息。獲得此處教導的相關領域技術人員應該理解,廣泛的信息、特征和策略等將量化為這里使用的功率信息。在實施例中,控制器250、450可與GCPM 680交換信息,GCPM680可使實施例的數據收集和分析并入各種控制策略功能中,GCPM 680采用所述控制策略功能分派任務。例如, GCPM 680可使用不同實施例的監控器255來監控功率、鏈路和應用程序信息。相反地,根據 GCP 685,控制器350、450可使用由GCPM 680中繼轉發的確定功率閾值和/或預算分析收集的運行特征。在另一實施例中,GCPM 680實現的控制策略可影響不同實施例的運行。例如,基于控制策略,可結合描述的測量系統使用不同的報警閾值。同樣地,根據控制策略和這里描述的實施例所生成的測量/估計,使用限制可強加于(Place on)測量組件。相關領域的且熟悉本申請和GCPM應用程序的技術人員應當理解,這里描述的實施例的各方面可以附加有益方式與GCPM應用程序的實施例交互。超額訂購圖7是根據本發明實施例的描述網絡中具有多個監控組的系統710的示意圖。監控組757A-B分別描述為具有機柜790A-B和機柜790A-B。監控組757A中的機柜790A和監控組757B中的機柜790E分別描述為具有連接其上的監控器755A-B。許多數據中心具有為中央組件提供動力的超額容量。測量數據中心中功率利用率的某些傳統方法利用數據中心的總功率需求的集中式測量。這一集合測量不包含關于單個數據中心組件的特定信息。以上的圖2-6概述的測量、分析和控制方法提供了系統組件的詳細、實時視圖。通過使用實施例提供的詳細信息,可超額訂購服務數據中心的電路,從而與初始設計相比、電路可服務更多數據中心組件。通過監控數據中心中單個組件的能量策略控制統計值,可監控超額訂購、并且如果需求增加則減少超額訂購。返回圖7,在實例中,每個機柜790A-F擁有10個主機組件(未顯示),每個主機具有300瓦的最大功率吸收。因此,機柜790A-F的總功率吸收為18千瓦㈩個機柜*10個主機/機柜*300瓦每主機)。相關領域技術人員理解的是,最大冷卻瓦數估計為最大系統710吸收的20%。因此,冷卻系統740可供給使用了 3. 6千瓦的冷卻(18千瓦的20% )。因此,在這一實例中, 系統710的總估計最大功率吸收為21. 6千瓦。例如,這一實例不考慮其他功率需求。在實例中,系統710設計成具有可提供16. 2千瓦、即比總估計功率吸收少20%的電源73(K21. 6千瓦-20% = 16. 2千瓦)。實施例連接設備與電勢從而吸收比電源730可提供的更多能量的這一方法稱為“超額訂購”。在這一實例中,系統710定期地在它最大功率吸收的40%運行。通過這里描述的方法,控制器750和監控器755Α-Β提供系統710的綜合、精確和實時監控。這一詳細監控使能系統710維持有上述超額訂購水平。為了使能超額訂購,某些實施例采集如以上圖2-7描述的運行特征,并管理ECE控制策略、從而完全降低確定超過系統710內功率預算的應用程序的數據中心資源。例如,數據中心客戶可能低估了它們利用的資源上安裝的應用程序的能量需求。 在這一實例中,實施例可使用結合上圖2描述的測量技術來確定哪一個資源已超過功率預算。與相關信息和分析結合的運行特征的實時收集允許某些實施例響應超額功率需求。其他實施例可記錄信息并在稍后呈現考慮的分析。一旦確定已超過功率預算,結合上圖3的描述而描述的控制特征可允許某些實施例使用各種機制來降低超額組件的功率吸收。由于穿過數據中心的ECE控制策略和/或機制的顆粒性質(granular nature),這一性能降低可選擇性地應用于確定具有超額功率利用率的應用程序所利用的那些組件。例如,可通過增加侵犯性(offending)應用程序所使用的資源的等待時間、或者完成使主題資源(subject resource)空閑、和/或采取降壓性能(st印-down performance)的其他措施來減少功率消耗從而實現降低。超額應用程序可包含超過鏈路利用率或其他網絡資源、以及超額功率利用率的應用程序。在實施例中,可逐漸完成特定資源利用率的減少,從而允許系統管理員采取替代措施、重分配資源或購買附加的數據中心資源。在實施例中,由于特定應用程序功能的靶向和逐步減少,將該響應效應稱為超額數據中心應用程序的“逐步降低”。當系統利用率接近最大吸收的預設閾值(例如,75% )時,實施例可結合圖7中的上述實例使用不同選項。其中一個選項是根據需要使用ECE控制機制來減少網絡組件的功率吸收。在給出此處的描述后,相關領域技術人員應該理解的是,ECE控制機制可通過ECE 控制策略得以實現,其中上述策略通常用于平衡競爭性能(competing performance)和功率需要。例如,當功率吸收超過預設閾值時,為了減少監控組757B中組件的功率吸收,可在交換機760B上實現用于延長交換機內的空閑時間的集合控制策略。參考結合上圖5的描述討論的實例,在第一客戶(具有監控組757A中的應用程序)超過功率吸收閾值的情況下,實施例可以各種方式減少客戶的功率吸收。列表Dl-DX 意圖是某些實施例使用的、減少資源利用率的不同方法的非限制性列表Dl.可以使鏈路速度和數據速率增量式減速(incrementally slowed),從而減少機柜790A-B的處理。例如,交換機760A中的ECE控制機制可用于使監控組757A的連接速度亞速率。D2.可以選擇性禁用監控組757A中資源的功能。應該理解的是,可為節能使某些具有現代ECE控制機制的PHY資源空閑。這里描述的實施例使用這一空閑功能來限制或控
14制系統710特定部分的資源利用率。D3.可選擇性地禁用或限制具有使能的ECE控制機制的端口。圖7中的這一實例包含機柜790A-B中主機的端口和交換機760A的端口。在給出此處的描述后,相關領域技術人員應該理解的是,對實施例而言,存在許多不同方式來減少監控組757A中資源的特定收集的資源利用率。應該理解的是,資源“完全”降低的特定方法取決于實現方式。不管用于實現降低過程的收集數據或機制,有益的是,控制器750使用系統方法來分配網絡中的受限資源。進一步地,在一個實施例中,控制器750優選地使用ECE控制機制來實現資源降低過程。冷卻圖8是根據本發明實施例的描述網絡中具有冷卻系統和多個監控組的系統810的示意圖。監控組857A-B分別描述為具有機柜890A-B和機柜890C-F,監控組857B具有控制器850。監控組857A中的機柜890A和監控組857B中的機柜890E分別描述為與其連接的監控器855A-B。同樣的,圖8中顯示與網絡101連接的冷卻系統840、電源830和交換機 860A-B。在某些數據中心實現方式中,冷卻系統840可消耗所有數據中心組件的大多數功率。監控數據中心冷卻需求的傳統方法可涉及每個數據中心組件的溫度測量設備的昂貴和侵入性安裝,例如,如圖IB中描述的每個服務器機柜的熱傳感器。使用以上圖2-7討論的監控方法,監控器850的某些實施例可接收運行特征、使該特征與參考信息結合并向系統810 中的其他非儀表化組件外推測量。就這個實例而言,監控器855A-B收集的至少一個運行特征涉及環境因子,例如熱量和濕度。在這一實例中,如圖2-7中所描述的,某些實施例監控的運行特征不僅包括環境度量值,而且包括與能量控制策略實現方式相關的ECE統計值和網絡運行特征(例如數據
流量度量值)。使用結合圖2-7討論的分析方法,收集的并用于能量控制策略的相同統計值(例如,利用率、空閑時間、數據通信量(data traffic volume)等)可用于估計和預測數據中心內不同組件的冷卻需求,其中收集的ECE統計值是系統810中熱量于何處產生的代表。通過測量數據中心組件的少量樣本,圖8中顯示的系統可減少監控數據中心溫度和確定數據中心“熱點”涉及的侵入性和支出。圖8中顯示的以及這里描述的冷卻方法的實施例還可以促進結合圖7的描述討論的超額訂購方法。某些時候,資源可具有功率需求方面的兩種限制。如上所述,組件可具有它可以吸收的功率量的限制。進一步地,資源還可具有它可以冷卻到多少的限制。通常地,不是資源自身的功率吸收、而是網絡資源的充分冷卻與冷卻組件的功率需求一起成為限制因子。通過提供數據中心組件的改良監控,系統810可使能結合圖7的描述的上述冷卻資源和能源的超額訂購。通過這里描述的方法,控制器850和監控器855A-B提供系統810的綜合、精確和實時監控。與上述功率利用率的估計相似,實施例提供的詳細監控使能確定的系統810的冷卻需求。如果實施例確定應用于系統810的冷卻資源超過系統810的確定冷卻需求,可通過控制器850實現應用的冷卻資源的減少。在給出此處的描述后,相關領域技術人員應該理解的是,這一減少的冷卻配置通常可促進改善系統810的ECE的總體目標。在設計系統810時,這里描述的監控方法還使能冷卻資源的超額訂購,而不會受合并組件的潛在冷卻需求的限制。方法900通過呈現測量和控制具有多個網絡組件的網絡各方面的示例性方法900的流程圖,這一部分和圖9總結了這里描述的技術。盡管參考本發明的實施例描述方法900,但是方法900并不是限制性的、而可能在其他應用程序中得以使用。如圖9中所示,方法900的實施例開始于步驟910,其中監控多個網絡組件的至少一個的運行特征。在圖2描述的實施例中,監控器255測量機柜觀0中主機150A的運行特征。一旦步驟910完成,方法900前進至步驟920。在步驟920,基于監控的運行特征估計多個網絡組件中未被監控的一個網絡組件的特征。在圖2描述的實施例中,分析器251基于監控器255從主機150A收集的運行特征估計未被監控主機150E的特征。一旦步驟920完成,方法900前進至步驟930。在步驟930,基于監控的運行特征和估計特征的至少一個生成配置指令。在圖3和 4描述的實施例中,控制器350基于監控器255收集的運行特征和分析器251確定的估計特征生成主機150E-H的配置指令。一旦步驟930完成,方法900前進至步驟940。在步驟940,生成的配置指令發送至多個網絡組件的至少一個。在圖3和4描述的實施例中,控制器350向主機150E-H發送為主機150E-H生成的配置指令。上述配置指令由控制器350生成。一旦步驟940完成,方法900結束。這里的監控、分析和控制功能(例如,監控器255、分析器251、控制器350等)可在硬件、軟件或其某些結合中得以實現。例如,基于這里給定的討論,本領域技術人員將理解的是,可使用計算機處理器、計算機邏輯、特定用途集成電路(AHC)等實現控制器350的功能。 因此,執行這里描述的數據收集、策略管理、協調和分析功能的任一處理器在本發明的范圍和精神內。例如,主機150A-L的實施例是使用處理器來執行主機功能的計算機服務器。進一步地,這里描述的控制器350的功能可體現為由計算機處理器或以上列舉的任意一種硬件設備執行的計算機程序指令。計算機程序指令使處理器執行這里描述的控制器350的功能。計算機程序指令(例如,軟件)可存儲在可由計算機或處理器存取的計算機可用介質、計算機程序介質或任一計算機可讀的存儲介質中。上述媒介包含例如RAM、R0M 或其他類型計算機存儲介質(例如計算機磁盤或CD ROM或等同物)的存儲器。因此,具有使處理器執行這里描述的數據收集、策略管理、協調、分析功能和其他相關功能的計算機程序代碼的任一計算機存儲介質在本發明的范圍和精神內。應該理解的是,圖2-8中描述的和這里參考的任一組件可在上述硬件和軟件技術中得以實現。結論雖然以上描述了本發明的各種實施例,應當理解,其目的僅在于舉例說明,而沒有限制性。本領域的技術人員知悉,在不離開本發明的精神和范圍情況下,在形式上和細節上還可做各種的改變。因此,本發明的保護范圍不當僅局限于以上描述的任一實施例,而應該依照權利要求及其等同來限定。
權利要求
1.用于測量具有多個網絡組件的網絡的各方面的系統,其特征在于,所述系統包括 監控器,所述監控器用于采集多個網絡組件的至少一個的運行特征;分析器,所述分析器用于分析從所述監控器接收的所述采集的運行特征;以及基于所述采集的運行特征估計所述多個網絡組件中未被監控的一個網絡組件的特征。
2.根據權利要求1所述的系統,其特征在于,所述分析器還用于生成至少一個所述特征的地圖顯示。
3.根據權利要求1所述的系統,其特征在于,所述多個網絡組件中所述未被監控的一個網絡組件的所述特征的所述估計基于來自所述采集的運行特征的外推。
4.根據權利要求1所述的系統,其特征在于,所述采集的運行特征包含監控組件利用低功率模式所采用的頻率的測量。
5.根據權利要求1所述的系統,其特征在于,所述采集的運行特征包含與監控組件關聯的鏈路利用亞速率模式所采用的頻率的測量。
6.根據權利要求1所述的系統,其特征在于,所述系統還包括日志,其中所述分析器還用于在所述日志中存儲采集的運行特征;以及基于所述采集的運行特征和從所述日志檢索的信息估計所述多個網絡組件中未被監控的一個網絡組件的特征。
7.根據權利要求1所述的系統,其特征在于,所述系統還包括參考存儲,其中所述分析器還用于從所述參考存儲檢索關于網絡組件的參考信息; 在存儲器中存儲所述檢索的參考信息;以及基于所述采集的運行特征和所述存儲器中存儲的參考信息估計所述多個網絡組件中未被監控的一個網絡組件的特征。
8.根據權利要求7所述的系統,其特征在于,所述關于網絡組件的參考信息包含其中之一所述網絡組件的物理特征, 所述網絡組件的額定功率, 所述網絡組件的推薦溫區,以及所述網絡組件的推薦濕度區。
9.根據權利要求1所述的系統,其特征在于,所述系統還包括與網絡組件關聯的控制策略,其中所述分析器還用于檢索與所述網絡組件關聯的所述控制策略,以及基于所述采集的運行特征和所述控制策略估計所述多個網絡組件中未被監控的一個網絡組件的特征。
10.用于測量具有多個網絡組件的網絡的各方面的方法,其特征在于,所述方法包括 監控所述多個網絡組件的至少一個的運行特征;以及基于所述監控的運行特征估計所述多個網絡組件中未被監控的一個網絡組件的特征。
全文摘要
本發明涉及測量具有多個網絡組件的網絡的各方面的系統和方法。其中所述測量具有多個網絡組件的網絡的各方面的系統包含監控器和分析器,該監控器用于采集多個網絡組件的至少一個的運行特征。該分析器用于分析從監控器接收的采集的運行特征,并基于采集的運行特征估計多個網絡組件中未被監控的一個網絡組件的特征。
文檔編號H04L12/26GK102546288SQ201110361040
公開日2012年7月4日 申請日期2011年11月15日 優先權日2010年11月16日
發明者韋爾·威廉·戴博 申請人:美國博通公司