重新發現遠程管理和監控的價值
By Calvin Nicholson, Legrand
COVID-19 封鎖迫使組織重新考慮他們開展業務和教育的方式,因為他們接受了遠程工作工具。工作環境的這種近乎即時的轉變給 IT 和數據中心管理人員帶來了新的數據中心挑戰,因為許多人無法親自動手進行故障排除。
由于對物理 IT 基礎設施的訪問受限,網絡管理員比以往任何時候都更傾向于使用遠程網絡管理和監控工具來幫助重啟服務器和其他設備,關閉未使用的網點,這樣就不能在不知情的情況下安裝新設備,也不能收集一般數據。
盡管2020年數據中心的規模沒有增加太多,Gartner表示,2020年的支出下降了10%,但許多設施確實實現了指數級的服務需求,部分原因是大量遠程工作者使用新應用程序。這給IT管理帶來了很大的壓力,因為許多數據中心在 IT 人員減少和人力資源要求減少的情況下運行,從而限制了人員進入設施。
國際正常運行時間協會(Uptime Institute)的一項調查強調了這一問題,他們詢問了全球200多家關鍵IT/設施基礎設施運營商,“在未來90天內,COVID-19對貴公司的關鍵IT基礎設施運營構成的頭號風險是什么?”多達32%的人選擇:減少IT基礎設施運營人員的級別。
遠程管理的價值
雖然IT和數據中心管理人員在物理上距離其數據中心很遠,但他們也轉向了電源設備,如直接連接到網絡的Switched PDUs,因此他們可以遠程管理設備。這些switch pdu提供的一些最有價值的功能是遠程命令和控制電源負載的功能,例如:
- 遠程重啟和啟動順序。重新啟動并不總是容易的——特別是對于多站點數據中心或托管設施。重新啟動可以從web界面遠程執行,無需部署服務技術人員。
- 電力負載調度。不可否認的事實是,數據中心運行的服務器實際上什么都不做,這是在浪費能源。Switched PDU提供了在每個插座/設備基礎上遠程管理電源計劃的能力。
- 鎖定可用的插座。有時機架沒電或相位需要重新平衡。使用Switched PDU提供了將插座從“斷電”模式切換到“通電”狀態的能力,這對于管理臨界負載和確保正常運行時間非常重要。
環境監測的價值
不用說,如果您不了解其環境和相關元素,就很難遠程管理數據中心。靜態且以孤島模式工作的可視化建模工具與其他關鍵工具(如數據中心基礎設施監控 (DCIM))幾乎沒有集成。這通常迫使管理人員梳理 CAD 圖紙以查明故障設備。然而,在大流行期間,數據中心經理開始更深入地研究設備和工具,這些設備和工具提供了大量的運營可見性。
在數據中心使用的設備中,環境監測傳感器發揮著重要作用。就像眾所周知的礦工的金絲雀一樣,環境傳感器一直在幫助IT和數據中心專業人員監控機柜周圍的健康狀況,并對可能危及IT資產性能和壽命的潛在問題發出警報。所有類型的數據中心(edge、core和colo)都依賴智能傳感器工具,提供對IT設備機架內部和周圍環境健康狀況的準確洞察。
如今,大部分 IT 設備都經過優化,可以檢測和報告不利的操作條件,因此管理人員可以在代價高昂的問題出現之前迅速采取行動——甚至是在家中遠程管理。此外,智能傳感器還可以通過以下方式幫助 IT 和數據中心專業人員:
- 防止過冷、冷卻不足、靜電放電、腐蝕和短路。
- 降低運營成本、推遲資本支出、延長正常運行時間并提高未來增長的能力。
- 提供環境監測并提醒管理人員注意潛在問題,例如存在水、煙霧和打開柜門。
- 基準溫度(也稱為設定點)每向上變化度數,最多可節省 4% 的能源成本。
- 幫助填充 AI、ML 和其他未來計劃。
- 為分布式數據中心運營的多維視圖提供有價值的信息。
真正重要的數據饋送儀表板
大多數數據中心使用某種類型的網絡運營中心 (NOC) 儀表板運行,該儀表板可聚合多個來源的信息,但這有時會導致不準確。如果數據不可信,決策就會有缺陷,如果決策有缺陷——需要到機架上驗證信息。獲取準確的信息不是火箭科學,可以由設備級別的智能傳感器和智能 PDU 自動收集,以提供那些值得信賴的環境洞察力。
真正重要的數據將產生可靠的運營洞察力,如果以用戶友好的格式顯示,管理人員將參與其中。數據中心信息管理 (DCIM) 解決方案通過獲取豐富的實時測量數據并將其與詳細的資產管理(包括完整的電力鏈連接可配置性)相結合,提供了輕松的交互。無論是否因為疫情封鎖,使用 3D 儀表板,數據中心管理人員可以從遠程位置查看其設施的環境條件——比實際在現場要好。
向DCIM儀表板中提供的聚合數據允許IT和數據中心管理人員查看服務器機架和通往機柜的路徑,并可以很容易地深入到單個機柜中,以獲得所有計算設備的視圖,包括名稱、型號和狀態。
但它并不僅僅停留在機架層面,它的可見性延伸到機柜之上,深入到分接箱關鍵電源監控,可以用作軌道母線槽系統的一部分,也可以作為一個獨立的解決方案。在3D儀表板上簡單地雙擊一個關閉框,就會顯示出瓦、安培、伏特或千瓦的實時信息。所有這些詳細信息都保存在一個模型庫中,以消除冗余數據輸入,包括:哪些協議在新單元上啟用;DCIM集成信息和負載均衡數據。
從 PDU 獲取的遠程監控數據使 DCIM 儀表板能夠顯示電源資源的運行情況以及它們在機架級別的消耗情況。憑借這種洞察力,IT 和數據中心經理可以更好地規劃容量變化。此外,通過 PDU 和傳感器的數據饋送,他們還可以接收到以下信息:
- 內閣的溫度。
- 智能機架式pdu或母線槽分接箱電流異常。
- 濕度的波動。
一個好的經驗法則是始終尋找能夠與所有 BMS、DCIM 或其他工具(如 Splunk 或 Tableau)集成的智能 PDU。
結論
如果說數據中心和IT經理曾經有過擁抱他們的遠程管理和監控工具的時候,那就是在大流行開始的時候。即使是現在,疫苗接種正在遏制COVID-19的傳播,很大比例的工作人員仍將留在或部分留在偏遠地區。在Gartner最近的一項調查中,90%的人力資源主管表示,即使COVID-19疫苗廣泛可用,員工也將被允許遠程工作,是的,這包括IT專業人士。
在可預見的未來,數據中心將繼續提供高需求的服務。但是,為了滿足需求,管理這些關鍵任務服務的人員還必須使用工具,使日益增長的遠程工作人員能夠不斷監控閾值、預測容量利用率、設置電壓陷阱,并平衡數據中心的環境條件。部署智能傳感器、傳感器管理、PDU、分接箱和DCIM解決方案來實現3D儀表盤,將使遠程工作者能夠進行他們的工作——通常比走在服務器島或電源路徑上進行實際評估更快。