環境監控功能是數據中心的重要組成部分,通過監控系統可以對數據中心整體運行情況有全面的瞭解,並進行有效控制與管理。雖然無人值守數據中心、軟件定義數據中心等新的概念涌現出來,但只是將控制權交給了機器,系統中依然需要對數據中心監控,採集各種運行參數,提供給控制中心,所以監控系統要完成數據採集、分析處理、存儲、展示、使用戶能實時掌握數據中心的基礎設施運行情況。由於數據中心自身大規模高動態的特點,監測數據中心收集也面臨着一些挑戰,要不斷豐富監測手段,採集到能夠真實反映數據中心運行狀態的數據,而不是獲取假象。

環境監控
數據中心要做好監測,需要具備三個特性:實時性,數據中心監測數據應當被實時地收集到,以便於數據中心及時地控制管理,這個實時性包括週期性輪詢採集數據的時間,這個輪詢週期越短實時性越高,週期越短,單次採集的數據不宜過大,還有部分數據是靠各種運行設備實時上報。可擴展性,在整個生命週期中,數據中心不可能一成不變,而且隨着業務量的擴大,也有不斷擴容的需求。監測數據收集系統應該方便調整,爲現有的或是增加的新設備添加新的監測指標,根據數據中心變化,不斷調整監測系統,不要讓監測系統成爲了擺設。智能性,監測系統不是採集完數據就了事,要具備數據分析能力,還要將採集的無效數據過濾掉,利用大樹法則獲得最有效的數據。比如採集機櫃環境溫度,在一個機房裏會有成百個機櫃,每個機櫃溫度不可能相同,有的差別甚至很大,這時就不能以點蓋面,需要多采集不同機櫃溫度,同時反覆多次採集,根據採集的數據再增加一些權重算法,從而計算得出合理數據。
數據中心內部各種系統很多,這也使得監測系統非常龐大,監測系統的設計異常複雜。以一個普通數據中心的監測系統來說,要包括供配電監控、環境空調監控、安防監控、運行數據監控、屏顯中心、管理監控等等,可靠性越高的數據中心,監測系統越完善,監測的項目非常繁多。在表1裏,列舉了供配電監控的部分內容。
通過對供配電的監控,及時瞭解數據中心供電系統的運行情況,一旦市電發生斷電,可以及時切換到蓄電池或者備用發電機組上,避免業務長時間中斷。也可以將監測數據發到運行數據中心,由運維人員根據數據進行工作部署。在表2裏,列舉了空調環境監控主要內容。
通過對空調環境的監控,及時瞭解數據中心製冷情況,內部運行環境情況,爲運行設備提供良好的運行環境,避免過冷或過熱的環境影響到運行設備的使用壽命。數據中心裏設備產生的熱量非常大,需要空調及時將熱空氣排出去,否則對數據中心危害很大,甚至可能引發火災事件,這方面已經有過歷史教訓。一個封閉性很好的數據中心機房,空調停轉半小時,部分設備就可能出現宕機情況,有些設備自動保護不夠好,持續的高溫就可能造成線路短路,產生火花,引發火災。擁有全面的空調監控系統,就可以避免這種情況發生。
在表3裏,列舉了數據中心屏顯中心監測主要內容,一個往往是有個巨大的會議大廳,前面有一幅超大的屏幕,上面會顯示各種各樣的數據,這些數據代表了各個系統和業務的運轉情況,一旦有故障可以及時地在屏幕上顯示出來。屏顯中心的所有數據都採集各個監測系統。一般屏顯中心也是各路領導經常光顧的地方,通過屏顯中心瞭解整個數據中心的運行狀況以及數據中心的各種運行設施。
還有一個環境監測系統非常重要,就是管理監控,這主要是對數據中心進行有效管理時做參考。在表4裏,列舉了管理監控涉及的主要內容,這部分一般是由管理人員來控制,對數據中心進行全面管理,不僅僅業務層面,還有人員的培訓、考覈、考勤等等。
除了以上這些監測指標,還有消防、安防、日誌管理、視頻監控、門禁系統、賬號管理等等,數據中心需要監測的內容非常多,上面只是將最爲關鍵的部分拿出來做了介紹。這些監測系統涉及很多專業技術,有些設計還非常複雜,需要由專業團隊才能完成部署,做一套完整的數據中心監測系統難度不亞於建造數據中心本身。一個數據中心監測系統做得好壞也直接決定了這個數據中心的運營水平。所以如果要對數據中心進行評價,監測系統往往是被考察的重要部分,這是數據中心水平的直接體現。
數據中心監測的根本目標是用盡可能少的運營成本獲得儘可能高的系統可用性。高可用性是數據中心水平表現最爲重要的標準,而監測系統就像高可用性管理的一雙眼鏡,有了它整個數據中心運行情況才能一目瞭然,高可用性的目標才具備實現的管理基礎。

arrow
arrow
    文章標籤
    環境監控
    全站熱搜
    創作者介紹
    創作者 hank 的頭像
    hank

    websitedesign

    hank 發表在 痞客邦 留言(0) 人氣()