當(dāng)前,數(shù)字化轉(zhuǎn)型已進(jìn)入深水區(qū)。對(duì)于數(shù)據(jù)中心運(yùn)維管理來(lái)說(shuō),如何深化應(yīng)用,并獲得跨越式發(fā)展,是企業(yè)需要深入思考的問題。
本期大咖說(shuō)為您分享安超數(shù)據(jù)中心管理軟件ArcherDCM(以下簡(jiǎn)稱安超DCM)如何幫助用戶通過(guò)帶外管理的方式對(duì)數(shù)據(jù)中心硬件設(shè)備進(jìn)行全生命周期管理,從而達(dá)到簡(jiǎn)化運(yùn)維方式、提升運(yùn)維效率的目標(biāo)。
核心內(nèi)容
1.2013年以來(lái),我國(guó)數(shù)據(jù)中心總體規(guī)??焖僭鲩L(zhǎng),其中,大型以上數(shù)據(jù)中心是增長(zhǎng)主力,年規(guī)模增速約68%,占數(shù)據(jù)中心總體數(shù)量規(guī)模近50%。隨著數(shù)據(jù)中心成為為5G、物聯(lián)網(wǎng)、AI等提供有力的基礎(chǔ)設(shè)施保障,對(duì)設(shè)備功耗、運(yùn)維部署、安全審計(jì)等有極高的要求。
2.數(shù)字化時(shí)代下,數(shù)據(jù)中心IT設(shè)備數(shù)量呈現(xiàn)出爆發(fā)式增長(zhǎng),人均管理設(shè)備臺(tái)數(shù)由以前的幾十臺(tái),發(fā)展到現(xiàn)在的人均幾百甚至更多的設(shè)備管理臺(tái)數(shù)。目前,數(shù)據(jù)中心管理遇到了人工巡檢、節(jié)能要求、資產(chǎn)盤點(diǎn)、遠(yuǎn)程運(yùn)維等挑戰(zhàn)。
3.安超DCM是一款跨廠商、跨平臺(tái)的全方位硬件監(jiān)控平臺(tái)軟件,通過(guò)帶外的方式實(shí)現(xiàn)所有硬件設(shè)備的統(tǒng)一管理,實(shí)時(shí)高效主動(dòng)地監(jiān)控硬件設(shè)備的狀態(tài),及時(shí)發(fā)現(xiàn)故障、定位故障,替代人工巡檢,有效的解決人工巡檢發(fā)現(xiàn)問題不及時(shí),且需要頻繁進(jìn)出機(jī)房的弊端。
4.安超DCM實(shí)現(xiàn)對(duì)數(shù)據(jù)中心硬件設(shè)備統(tǒng)一集中管理,從硬件設(shè)備實(shí)時(shí)狀態(tài);設(shè)備配置信息自動(dòng)獲取、部件變更信息自動(dòng)獲取、維保信息、固件版本管理、機(jī)柜空間容量;設(shè)備級(jí)實(shí)時(shí)能耗、溫度及遠(yuǎn)程管理;遠(yuǎn)程管理多個(gè)維度實(shí)現(xiàn)硬件設(shè)備的全生命周期管理,做到設(shè)備狀態(tài)實(shí)時(shí)可查、可知、可追蹤、可視化管理。
5.安超DCM主要擁有四個(gè)功能,包括無(wú)人值守、能耗管理、資產(chǎn)管理、遠(yuǎn)程管理。無(wú)人值守方面,不需要人工去做巡檢,只要坐在辦公室,就可以看到哪一個(gè)機(jī)房里的哪個(gè)機(jī)架上的哪一個(gè)U位上的哪一個(gè)設(shè)備里的哪一個(gè)部件,發(fā)生了什么樣的問題,可以清晰的去定位他的故障。同時(shí)在定位故障的同時(shí)還進(jìn)行自動(dòng)化的提示。比如硬盤預(yù)警功能,能夠提早發(fā)現(xiàn)問題,把故障扼殺在搖籃里。
6.能耗管理功能主要就是通過(guò)帶外管理的方式去獲取我們?cè)O(shè)備的事實(shí)的功率。在機(jī)房層面,安超DCM對(duì)機(jī)房機(jī)構(gòu)實(shí)時(shí)空間容量、能耗數(shù)據(jù)進(jìn)行統(tǒng)計(jì),實(shí)時(shí)統(tǒng)一展現(xiàn)機(jī)房空間、電力資源使用情況、運(yùn)行狀態(tài),確保機(jī)房用電安全,有效預(yù)防因電壓不足而導(dǎo)致硬件設(shè)備宕機(jī)問題。在機(jī)柜層面,安超DCM自動(dòng)采集X86服務(wù)器實(shí)時(shí)功率、溫度,無(wú)需增加硬件設(shè)施,實(shí)現(xiàn)各機(jī)柜能耗數(shù)據(jù)精準(zhǔn)收集。對(duì)機(jī)柜電力負(fù)荷進(jìn)行實(shí)時(shí)統(tǒng)計(jì)與自動(dòng)報(bào)警。在設(shè)備層面,安超DCM支持實(shí)時(shí)采集服務(wù)器進(jìn)風(fēng)口溫度。通過(guò)進(jìn)風(fēng)口溫度,主動(dòng)發(fā)現(xiàn)過(guò)載服務(wù)器、僵尸服務(wù)器,根據(jù)策略進(jìn)行負(fù)載優(yōu)化。
7.資產(chǎn)管理功能,能夠從采購(gòu)到上線到管理再到下線,實(shí)現(xiàn)全生命周期的追蹤管理。這個(gè)功能能夠幫助用用戶實(shí)現(xiàn)設(shè)備從采購(gòu)、安裝使用,再到運(yùn)維、報(bào)廢的全過(guò)程服務(wù)。并對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析、管理,為日常運(yùn)營(yíng)提供支持。
8.遠(yuǎn)程管理功能就是遠(yuǎn)程的KVM的功能。這個(gè)功能可以幫助用戶實(shí)現(xiàn)無(wú)需進(jìn)出機(jī)房,遠(yuǎn)程管理異地多機(jī)房。支持開機(jī)、關(guān)機(jī)、重啟操作,實(shí)現(xiàn)數(shù)據(jù)中心異構(gòu)設(shè)備的遠(yuǎn)程控制。
9.安超DCM是通過(guò)帶外管理口的方式,能夠?qū)缙放?、全類型硬件進(jìn)行全生命周期自動(dòng)化運(yùn)維和可視化展現(xiàn)的數(shù)據(jù)中心管理平臺(tái)。在設(shè)備層,實(shí)現(xiàn)對(duì)計(jì)算資源、網(wǎng)絡(luò)資源、存儲(chǔ)資源、動(dòng)環(huán)、安防等設(shè)備進(jìn)行跨品牌、跨平臺(tái)的統(tǒng)一監(jiān)控。在數(shù)據(jù)采集層,支持主動(dòng)采集(SNMP、SSH、HTTPS、CLI)、被動(dòng)采集(SNMPTrap、Syslog)與第三方系統(tǒng)數(shù)據(jù)整合等多種數(shù)據(jù)采集手段。在數(shù)據(jù)處理層,實(shí)現(xiàn)對(duì)設(shè)備硬件狀態(tài)的實(shí)時(shí)分析:資產(chǎn)分析、故障分析、能耗數(shù)據(jù)、空間數(shù)據(jù),等等。在展現(xiàn)層:支持在統(tǒng)一的Portal界面展現(xiàn)設(shè)備的運(yùn)行情況、告警等信息。支持分級(jí)分權(quán)限管理,運(yùn)維人員只看自己關(guān)注的信息。
10.目前,安超DCM已經(jīng)支持了政府、金融、證券等眾多用戶有效減少繁瑣、重復(fù)、費(fèi)時(shí)的各項(xiàng)運(yùn)維工作,保障數(shù)據(jù)中心設(shè)備安全、穩(wěn)定運(yùn)行,同時(shí)降低數(shù)據(jù)中心運(yùn)營(yíng)成本,實(shí)現(xiàn)節(jié)能增效、無(wú)人值守、綠色環(huán)保、安全的AI數(shù)據(jù)中心,全面為數(shù)字化轉(zhuǎn)型保駕護(hù)航。