51CTO 發(fā)表于:13年11月25日 17:29 [轉(zhuǎn)載] DOIT.com.cn
目前,F(xiàn)acebook 已經(jīng)憑借它在網(wǎng)絡(luò)基礎(chǔ)建設(shè)上的可擴(kuò)展能力成為了行業(yè)的領(lǐng)軍者。Facebook 數(shù)據(jù)中心運(yùn)維主管 Delfina Eberly 在“7x24 Exchange 2013 秋季會(huì)議”上的演講中為我們透露了 Facebook 部分內(nèi)部運(yùn)維數(shù)據(jù),下面我們來(lái)具體了解下。
服務(wù)器數(shù)量驚人,一人管理 2 萬(wàn)臺(tái)
Facebook 服務(wù)器數(shù)量驚人,其硬件方面的工作重點(diǎn)主要放在“可服務(wù)性”上,內(nèi)容也涉及服務(wù)器的初期設(shè)計(jì),一系列工作的目標(biāo)就是為了保證數(shù)據(jù)機(jī)房的設(shè)備維修最簡(jiǎn)單、最省時(shí)。她介紹說(shuō),每個(gè) Facebook 數(shù)據(jù)中心的運(yùn)維工作人員管理了至少 20,000 臺(tái)服務(wù)器,其中部分員工會(huì)管理數(shù)量高達(dá) 26,000 多個(gè)的系統(tǒng)。
近期 Facebook 的服務(wù)器與管理人數(shù)比又創(chuàng)下了新高,目前已經(jīng)超過(guò) 10000:1,可以查看文章高擴(kuò)展性對(duì)此進(jìn)行更加詳細(xì)的了解。
大數(shù)據(jù)洶涌,運(yùn)維工作不輕松
在 Facebook 數(shù)據(jù)中心做運(yùn)維工作并不輕松,對(duì)工作人員的能力要求很高。他們每天面對(duì)的是海量數(shù)據(jù)。
據(jù)統(tǒng)計(jì),F(xiàn)acebook 目前擁有 11.5 億用戶,日常登錄用戶約 7.2 億。每天 Facebook 用戶分享的內(nèi)容達(dá)到 47.5 億條,“贊”按鈕點(diǎn)擊次數(shù)近 45 億次。Facebook 目前存儲(chǔ)了 2400 億張照片,每月照片存儲(chǔ)容量約增加 7 PB(注,單位換算:1PB=1024TB)。
自動(dòng)故障診斷系統(tǒng):原為留住人才
為了管理運(yùn)維工作,F(xiàn)acebook 已經(jīng)開發(fā)了相應(yīng)軟件來(lái)自動(dòng)化處理日常運(yùn)維任務(wù),如 CYBORG 可自動(dòng)檢測(cè)服務(wù)器問(wèn)題并進(jìn)行修復(fù)。如果 CYBORG 無(wú)法自動(dòng)修復(fù)檢查出的問(wèn)題,系統(tǒng)將自動(dòng)給訂單系統(tǒng)發(fā)送警告,并分派給數(shù)據(jù)中心工作人員,以對(duì)相應(yīng)問(wèn)題進(jìn)行詳細(xì)追蹤與分析。
Eberly 提到,自動(dòng)化工作的目標(biāo)是盡量避免將技術(shù)人員派往現(xiàn)場(chǎng)解決問(wèn)題,除非必須對(duì)服務(wù)器進(jìn)行現(xiàn)場(chǎng)處理。強(qiáng)調(diào)自動(dòng)化不是因?yàn)?Facebook 對(duì)打造無(wú)人數(shù)據(jù)中心感興趣,原因在于 Facebook 重視自己的員工。
Eberly 解釋說(shuō):我們要留住人才,因?yàn)榇蠹腋矚g高水平的任務(wù),公司希望讓他們留下來(lái)與我們一起進(jìn)步成長(zhǎng),這對(duì) Facebook 來(lái)說(shuō)至關(guān)重要。
“可服務(wù)性”主導(dǎo)服務(wù)器設(shè)計(jì):節(jié)時(shí) 54%
在 Facebook,運(yùn)維團(tuán)隊(duì)的時(shí)間與工作量是根據(jù) Facebook 硬件設(shè)計(jì)來(lái)安排的。比方說(shuō),全部服務(wù)器從頭開始就堅(jiān)持“可服務(wù)性”這一原則來(lái)進(jìn)行設(shè)計(jì),那么數(shù)據(jù)中心的工作人員就沒(méi)有必要老鉆機(jī)房了;服務(wù)器被設(shè)計(jì)成無(wú)需工具就可以對(duì)磁盤和組件進(jìn)行替換。這樣做的結(jié)果就是:Facebook 用來(lái)修理服務(wù)器的時(shí)間減少了 54%。
Eberly 介紹說(shuō),F(xiàn)acebook 運(yùn)維團(tuán)隊(duì)會(huì)仔細(xì)跟蹤設(shè)備故障率,這一數(shù)據(jù)會(huì)為公司的采購(gòu)提供參考。公司的財(cái)產(chǎn)管理和訂單系統(tǒng)用序列號(hào)來(lái)跟蹤硬盤和其他組件,這方便完整了解每個(gè)硬件的生命周期。
Eberly 還提到,雖然這些系統(tǒng)很復(fù)雜,但并不需要太多開發(fā)者。Facebook 的運(yùn)維團(tuán)隊(duì)僅有 3 名軟件工程師,但他們對(duì)數(shù)據(jù)中心的工作來(lái)講至關(guān)重要。
最后
從 Eberly 的介紹中,我們可以看到 Facebook 在可擴(kuò)展性網(wǎng)絡(luò)建設(shè)上的實(shí)力。同時(shí),這也為行業(yè)提供了一些可參考的經(jīng)驗(yàn),如:開發(fā)自動(dòng)故障系統(tǒng),根據(jù)“可服務(wù)性”設(shè)計(jì)基礎(chǔ)架構(gòu)。同時(shí),運(yùn)維也是一個(gè)系統(tǒng)工程,需要得到其他部門的配合支持才行。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.