夏季機房,IT經(jīng)理如何確保安全運維?
硅谷動力 發(fā)表于:13年07月19日 13:31 [轉(zhuǎn)載] DOIT.com.cn
據(jù)新華社電,近期暴雨侵襲全國,21個省份遭遇洪澇災(zāi)害,已致33人死亡、14人失蹤。昨日6時,河北省氣象臺繼續(xù)發(fā)布暴雨藍(lán)色預(yù)警,預(yù)計承德中南部、唐山、秦皇島、廊坊等多地區(qū)有大雨,局部有暴雨,為防止城市內(nèi)澇、中小河流洪水和山洪地質(zhì)災(zāi)害,提醒相關(guān)部門及廣大群眾做好防御工作。顯然,進入盛夏極端多變性的天氣,已向人們拉響了預(yù)警。
面對多變性天氣,企業(yè)IT機房和數(shù)據(jù)中心同樣面臨管理、安全等多方面考驗。而隨著信息化技術(shù)迅猛發(fā)展,中國已經(jīng)成為全球數(shù)據(jù)中心。4月17日,亞馬遜Cloud Drive云存儲河北廊坊數(shù)據(jù)中心提前完工,該項目總投資98億元,將為亞馬遜購物網(wǎng)站提供數(shù)據(jù)存儲和云計算服務(wù);6月6日,戴爾宣布其在成都的全球運營基地正式投產(chǎn),占地面積達(dá)3萬平方米,總產(chǎn)能可達(dá)每年700萬臺(戴爾臺式機產(chǎn)品),助力戴爾為本地和歐洲及美國等海外客戶提供產(chǎn)品和服務(wù),而如此龐大的生產(chǎn)流程,背后的英雄卻是數(shù)據(jù)中心。
IT機房和數(shù)據(jù)中心對企業(yè)業(yè)務(wù)發(fā)展尤為重要,由于國內(nèi)氣候環(huán)境的多變性,為IT運維管理帶來了巨大挑戰(zhàn)。夏季機房,IT經(jīng)理不僅要解決機房溫度濕度、保障服務(wù)器設(shè)備穩(wěn)定運行及確保數(shù)據(jù)安全等問題,還要承受降低企業(yè)總體擁有成本的壓力。
我們知道大多數(shù)機房都建有制冷系統(tǒng),來保證內(nèi)部溫度在22℃的安全線以內(nèi)。但是,夏季持續(xù)性高溫會多引發(fā)系統(tǒng)、硬件異常工作,甚至是癱瘓罷工,且機房和數(shù)據(jù)中心的內(nèi)部溫度比平均水平每升高10度,數(shù)據(jù)中心“融化”的風(fēng)險就會提高5%。如何確保機房或數(shù)據(jù)中心在高溫多雨天氣下安全、穩(wěn)定的運維,成為眾多IT經(jīng)理當(dāng)下迫切希望解決的問題。
作為企業(yè)的CIO或IT管理者如何解決這些“熱”煩惱、“雨”擔(dān)憂,不妨從以下幾方面著手做起。
強化數(shù)據(jù)中心制冷系統(tǒng)
數(shù)據(jù)中心,支撐整個企業(yè)IT系統(tǒng)正常運轉(zhuǎn)的后臺架構(gòu),其包含計算、存儲、網(wǎng)絡(luò)等多種高性能、高密度硬件設(shè)備。如服務(wù)器、存儲設(shè)備在作為動力源同時也成為熱源的生產(chǎn)者,再加之夏季溫度一再攀升,IT經(jīng)理不得不采取措施,強化制冷系統(tǒng),確保內(nèi)部溫度在安全線以內(nèi)。
第一,結(jié)合企業(yè)自身數(shù)據(jù)中心架構(gòu)布局,建設(shè)可隨負(fù)荷變化的管理制冷系統(tǒng)。在滿負(fù)載工作情況下,可提供足夠的冷量和風(fēng)量;不滿負(fù)荷情況下,制冷系統(tǒng)可提供恰當(dāng)?shù)娘L(fēng)量,在保證精確調(diào)節(jié)同時,也能更好的綠色節(jié)能,節(jié)約成本。
第二,根據(jù)數(shù)據(jù)中心不同密度區(qū)域,采用不同的制冷形式。例如,可在刀片服務(wù)器高密度區(qū)域采用水冷機柜等。
第三,可選用氣流送風(fēng)技術(shù),但要做到非常均勻的送風(fēng),實際操作則具有一定難度,在此不建議中小企業(yè)采用。
小結(jié):數(shù)據(jù)中心制冷系統(tǒng)強化,需CIO依據(jù)內(nèi)部設(shè)施布局進行慎重建設(shè)。
選擇合適的服務(wù)器設(shè)備
除了通過強化數(shù)據(jù)中心制冷系統(tǒng)外,從硬件基礎(chǔ)設(shè)施出發(fā)同樣能做到節(jié)能降耗、平臺正常運轉(zhuǎn)功效。面對極端環(huán)境或特殊應(yīng)用的需求,設(shè)備生產(chǎn)商精益求精,針對高溫環(huán)境推出耐高溫服務(wù)器或自帶降溫技術(shù)設(shè)備的整體解決方案,例如戴爾PowerEdge服務(wù)器就可在-5℃到45℃之間正常運行。
戴爾為了確保企業(yè)數(shù)據(jù)中心的服務(wù)器、存儲等設(shè)備能夠在高溫環(huán)境正常運行,降低額外的維護和基礎(chǔ)設(shè)施成本,在研制耐高溫服務(wù)器同時,為企業(yè)數(shù)據(jù)中心打造新風(fēng)冷卻解決方案。借助該解決方案組合不僅具備高散熱能力和可靠性等優(yōu)勢,還使得方案中的服務(wù)器、存儲和網(wǎng)絡(luò)設(shè)備允許在更高溫度條件下安全、穩(wěn)定的運行,避免因高溫宕機“罷工”現(xiàn)象。
小結(jié):IT機房或數(shù)據(jù)中心擁有良好的服務(wù)器、存儲設(shè)備不僅能降低IT故障率,更重要的是降低了企業(yè)TCO。
建立設(shè)備實時監(jiān)控機制
企業(yè)IT機房設(shè)備(服務(wù)器、存儲、交換機等)絕大部分是24×7小時運行,面對高溫、多雨季節(jié),企業(yè)應(yīng)建立設(shè)備實時監(jiān)控機制。監(jiān)控機制包括兩部分:員工實時檢查和網(wǎng)絡(luò)實時監(jiān)測。
企業(yè)部署相關(guān)員工對服務(wù)器設(shè)備運行數(shù)據(jù)進行按日分析,并整理出服務(wù)器工作日志,以便第一時間處理異,F(xiàn)象;同時對服務(wù)器機房進行按日檢查,避免人為諸如機房亂堆放雜物、有灰塵等情況干擾服務(wù)器正常運行。另一方面,企業(yè)選擇一套服務(wù)器監(jiān)控解決方案,對服務(wù)器進行實時監(jiān)控,一旦出現(xiàn)宕機、存儲硬盤受損及時發(fā)出警報,第一時間安排相關(guān)技術(shù)人員進行整修。
服務(wù)器、存儲提供商在保障產(chǎn)品品質(zhì)外,還會為其定制或添加多功能工具和軟件,以應(yīng)對企業(yè)多方面需求。而戴爾作為中國服務(wù)器第一大提供商,在產(chǎn)品日常維護方面更是行業(yè)第一。戴爾12G服務(wù)器內(nèi)置硬件診斷工具Diagnostics,且無需依賴操作系統(tǒng),若診斷出硬件不能正常工作,會自動發(fā)出警報;同時,戴爾為用戶提供OpenMange Essentials系統(tǒng)管理軟件,提供免代理監(jiān)控服務(wù)。
除戴爾服務(wù)器外,IBM、HP、華為等服務(wù)器均有類似診斷工具或管理軟件。
小結(jié):人無遠(yuǎn)慮,必有近憂。企業(yè)亦如此,單純依靠人工進行設(shè)備實時監(jiān)控,必將投入大量人力物力。因此,選擇成套的服務(wù)器監(jiān)控解決方案才是最佳監(jiān)控措施。
制定災(zāi)難備份修復(fù)方案
夏季機房突發(fā)情況有許多,諸如機房斷電、服務(wù)器宕機、存儲硬盤損壞等等,為保證機房正常運行,防患于未然,企業(yè)在夏季做好相應(yīng)的災(zāi)備措施具有重大意義。
既然設(shè)備故障問題(服務(wù)器宕機等)不可避免, IT經(jīng)理就需在購買設(shè)備時與相關(guān)IT專家進行討論,分析企業(yè)可能會出現(xiàn)故障的情況,并將這些情況分析結(jié)果形成意見,制定一套災(zāi)備修復(fù)方案,以減少因故障而帶來的損失。具體方案有:
加強設(shè)備維護檢查,制定設(shè)備在夏季運行方案;儲備或協(xié)調(diào)后備應(yīng)急水源及燃料,保證在斷電、斷水情況發(fā)生時有足夠的備用資源;以主動措施應(yīng)對被動狀況,例如儲備應(yīng)急冰塊、購置通風(fēng)用軸流風(fēng)機、水噴淋措施等。
小結(jié):做好災(zāi)備修復(fù)方案對企業(yè)來講至關(guān)重要,不僅保證了平臺正常運行,還進一步確保了數(shù)據(jù)的安全性。
做好防水、防雷安全措施
IT機房或數(shù)據(jù)中心做好上述幾點就萬無一失了嗎?答案顯然是否定的,企業(yè)機房還需做好防水、防雷等安全措施。
機房內(nèi)擺放著大量的精密、貴重計算機及網(wǎng)絡(luò)設(shè)備,其均具備高密度、高速度、低電壓和低功耗等特性,不僅怕水,還對各種諸如雷電過電壓、電力系統(tǒng)操作過電壓、靜電放電、電磁輻射等電磁干擾非常敏感。如果防護措施不力,企業(yè)隨時可能遭受重大損失。
夏季多雨,機房更應(yīng)防止漏水事故發(fā)生。IT經(jīng)理可直接通過降低機房空調(diào)供水管道的壓強來解決漏水隱患。通過對機房專用空調(diào)加濕器的供水系統(tǒng)的分析,專家認(rèn)為機房專用空調(diào)加濕罐補水時并不需要過高的供水壓力,相反降低了機房空調(diào)供水管道的壓強,可使供水管道中的閥門、接頭、彎頭、管壁所承受的壓力降低,安全系數(shù)提高,有利于機房空調(diào)安全供水的實現(xiàn)。
有雨必有雷。為了保護建筑物和建筑物內(nèi)各項電子網(wǎng)絡(luò)設(shè)備不受雷電損害或使雷擊損害降低到最低程度,應(yīng)從整體防雷的角度來進行防雷措施的設(shè)計。IT機房主要應(yīng)從UPS電源系統(tǒng)防雷保護、通訊系統(tǒng)的防雷與過電壓保護及防雷器的安裝與接線著手做起。
小結(jié):盡管IT機房在建設(shè)之初已經(jīng)做過防水、防雷、防震等突發(fā)災(zāi)難措施,但在夏季多雨時節(jié),仍需做好檢查和防御措施,防患于未然。
隨著大數(shù)據(jù)崛起、云計算漸成企業(yè)寵兒,各類計算越來越依賴數(shù)據(jù)中心;業(yè)務(wù)的多樣化,也對IT機房的設(shè)備管理、運維以及安全等多方面提出了更高要求。面對故障多發(fā)期,夏季對機房和數(shù)據(jù)中心來講均是一個嚴(yán)峻的考驗。因此,IT經(jīng)理做好夏季機房故障防御措施十分重要。
寫在最后
面對夏季對機房多方面影響,IT經(jīng)理除了采取一定有效措施防御故障發(fā)生外,更希望在保證平臺正常運維下降低企業(yè)TCO,來提升整體能效。據(jù)DataCenterUsersGroup調(diào)查顯示,數(shù)據(jù)中心能效已迅速成為業(yè)界優(yōu)先考慮事項。絕大多數(shù)受調(diào)查者認(rèn)為,數(shù)據(jù)中心在制冷設(shè)備(49%)、服務(wù)器(46%)、電源設(shè)備(39%)和存儲設(shè)備(21%)等方面存在巨大的能效改善機會。由此可見,企業(yè)迫切降低投入、運維等成本。而最直接、最有效做到這一點的方案就是,企業(yè)在為機房采購設(shè)備時,從一開始就選擇具備低能耗、耐高溫等特性設(shè)備或成套解決方案,不僅可以有效減少故障率,亦能夠降低企業(yè)整體擁有成本。
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.