“你們還有什么問題嗎?”
9月初,在百度云計算(陽泉)中心的會議室里,百度云計算(陽泉)中心負責人,百度系統(tǒng)部高級經(jīng)理顧鵬微笑著向媒體朋友們投過來關(guān)切但充滿自信的目光。
三周前,新華三在呼倫貝爾舉行“互聯(lián)網(wǎng)夏季論壇”,百度云一名管理人員在主題演講中對與會者說,公司位于陽泉的數(shù)據(jù)中心單模組PUE值已經(jīng)達到了1.1,引著不小的轟動,而筆者當時發(fā)布微信朋友圈后,朋友們也紛紛表示懷疑甚至不信任。
2014年,綠色網(wǎng)格發(fā)布的國際數(shù)據(jù)中心PUE能效值為1.7,目前國內(nèi)新建的數(shù)據(jù)中心大多為1.73,少數(shù)實現(xiàn)了1.4~1.5,而百度云計算(陽泉)中心竟然能達到單模組1.10。
憑什么?
百度云計算(陽泉)中心負責人,百度系統(tǒng)部高級經(jīng)理顧鵬
借由“數(shù)字中國萬里行”這個機會,筆者也抱著嚴重不相信的的態(tài)度,走進了這座數(shù)據(jù)中心。
眼見為實。在全面了解之后才發(fā)現(xiàn),包括筆者在內(nèi)的所有人的疑惑,被徹底地打消了。
在剛剛過去的整整一個上午,顧鵬先是向這支風塵仆仆的團隊對位于陽泉的這座數(shù)據(jù)中心的基本情況做了介紹,而后又花了將近4個小時陪同大家參觀了數(shù)據(jù)中心所有模組及配電、制冷等重要場所。
此刻,面對顧鵬探詢的目光,除了專家級的資深媒體同行海峰、大兔,大名鼎鼎的狒哥也保持了半分鐘的沉默。
百度云計算(陽泉)中心坐落于山西省陽泉市開發(fā)區(qū),園區(qū)占地面積360畝,由八個模組樓,一個ECC綜合樓、兩個柴發(fā)樓以及總調(diào)倉庫、配套的餐飲樓、活動室以及休息區(qū)等組成,整體建筑面積達到12萬平米,共分四期建設(shè),于2012年啟動,設(shè)計裝機容量為12萬臺,其設(shè)計標準采用T3+級,2014年9月第一期建成投入運行至今已經(jīng)1500多天,今年最后一期完成后將全部投入運營,投用后實際裝機容量將達到16萬臺,成為亞洲規(guī)模最大的數(shù)據(jù)中心之一。
百度云計算陽泉中心的效果圖。其設(shè)計靈感來源于百度的logo(形似熊掌)
據(jù)介紹,陽泉數(shù)據(jù)中心承載了百度的搜索、地圖、網(wǎng)盤、人工智能、智能云、自動駕駛技術(shù)等業(yè)務(wù)海量數(shù)據(jù)的處理,每天處理的數(shù)據(jù)為數(shù)百PB,相當于成千上萬國家圖書館的容量。
2015年,陽泉數(shù)據(jù)中心獲得了國內(nèi)首家的運行和設(shè)計雙五A認證、數(shù)據(jù)中心年度的能效獎和中國企業(yè)領(lǐng)導力獎;2016年獲得了山西省的五一勞動獎狀;AHU、整機柜、OCU和市電+UPS/HVDC供電架構(gòu)入選工信部的先進技術(shù)名錄,風電、光伏和污水回用等綠色節(jié)能技術(shù)應(yīng)用,也使百度成為了唯一一家獲得了2017年國際“碳金獎-社會公民獎”的互聯(lián)網(wǎng)企業(yè)。
2017年,陽泉數(shù)據(jù)中心獲得了中華總工會“全國五一勞動獎狀”,成為目前國內(nèi)數(shù)據(jù)中心唯一獲得過此項大獎的數(shù)據(jù)中心。
在六年的建設(shè)和運營中,陽泉數(shù)據(jù)中心積累了400多項國際和國內(nèi)的專利,如采用HVDC(高壓直流) Offline與鋰電池機柜,供電效率達到99.5%;OCU、AHU、水冷精密空調(diào)等多種空調(diào)末端技術(shù)并行應(yīng)用,同時將機房送風溫度提升到27℃,搭配百度高溫服務(wù)器,全年自然冷卻時間延長到96%以上;光伏和風力發(fā)電相結(jié)合,每年實現(xiàn)CO2減排達2.6萬噸,污水回收利用,年節(jié)約用水48萬噸。
數(shù)據(jù)中心主要由電氣系統(tǒng)、暖通系統(tǒng)、監(jiān)控及運維管理系統(tǒng)組成。
在電氣架構(gòu)方面,傳統(tǒng)的數(shù)據(jù)中心多是采用雙路UPS的設(shè)計方式,其效率可以達到90%。
百度率先于2010年在國內(nèi)使用了“市電+UPS”這種當時國內(nèi)最先進的架構(gòu),其效率可達到95%,而陽泉數(shù)據(jù)中心總共采用了四種架構(gòu),即“市電+UPS”、“市電+UPS ECO”、“市電+HVDC在線”以及“市電+HVDC離線”的形式,其中“市電+HVDC離線”是世界首例采用這種供電架構(gòu),其供電效率由原來的雙路UPS的90%一躍提升到99.5%。
也就是說,按傳統(tǒng)雙路UPS方式,100度電可能有10度電由UPS損耗掉了,但現(xiàn)在陽泉數(shù)據(jù)中心做到了只有0.5度電被損耗。可以說,“市電+HVDC離線”是做到了極致。
在暖通架構(gòu)方面,在陽泉數(shù)據(jù)中心除了采用CRAH(水冷精密空調(diào)),還采用了高溫服務(wù)器及零功耗新型空調(diào)末端,充分利用了天然的冷源,合理化應(yīng)用機械制冷、預冷和自然冷卻,全年免費冷卻效率達到96%以上,相當于每年用冷機制冷的時間只有兩周約300個小時。
另外,架空地板這種傳統(tǒng)的架構(gòu)在陽泉數(shù)據(jù)中心已經(jīng)被摒棄,取而代之的是無架空地板與側(cè)送風相結(jié)合的方式,在保證氣流組織最優(yōu)、冷量高效輸送的同時,與整機柜服務(wù)器協(xié)同,日峰值交付服務(wù)器能力達1萬臺,交付效率提升20倍。采用百度自研的OCU(頂置冷卻單元)冷卻技術(shù)空調(diào)末端與預制化模塊技術(shù)相結(jié)合,冷卻模塊垂直安裝在機架上方,空調(diào)末端無風扇、零功耗,利用空氣對流原理,可以抽走“熱通道”的熱空氣的同時,還可以送出冷空氣給“冷通道”;AHU(Air Handle Unit)風墻冷卻技術(shù),通過與高溫耐腐蝕服務(wù)器配合,采用全新氣流組織方案,解決了空氣污染及腐蝕難題;IDEC即間接風側(cè)制冷,抽取室內(nèi)空氣和部分新風以控制出風溫度和風量來維持室內(nèi)溫度。
AHU(Air Handle Unit)風墻冷卻技術(shù)
在監(jiān)控與運維方面,多數(shù)數(shù)據(jù)中心的運營都具備有一定的自動化能力,但是陽泉數(shù)據(jù)中心已經(jīng)在向智能化進行轉(zhuǎn)變,比如巡檢全部采用無紙化智能巡檢,將相關(guān)數(shù)據(jù)上傳到遠端電腦,專家系統(tǒng)通過對現(xiàn)場運行數(shù)據(jù)分析來保障系統(tǒng)穩(wěn)定性將AI技術(shù)引入了數(shù)據(jù)中心后,通過建立數(shù)據(jù)中心深度學習模型,如冷水機組三種模式的運行,將根據(jù)室外天氣的濕度、溫度和負荷,自動完成制冷模式、預冷模式或節(jié)約模式的切換,并且根據(jù)設(shè)備的總體運行時間提示維修或更新,智能預警可能出現(xiàn)的故障,同時根據(jù)設(shè)備的負載量自動調(diào)配,實現(xiàn)負載均衡。
“結(jié)合AI的智能化是數(shù)據(jù)中心后續(xù)運營的方向,最終將實現(xiàn)無人值守?!鳖欩i說。
這也是陽泉數(shù)據(jù)中心裝機量從12萬臺擴升至16萬臺的根本原因。
二是水冷背板。無風扇的零功耗模塊化的設(shè)計,全面支持天蝎整機柜服務(wù)器,就近冷卻、彈性部署,最直接地接近熱源服務(wù)器。
三是間接蒸發(fā)冷卻的模塊化設(shè)計方式。除了高度的自動化,交付效率比原先冷水系統(tǒng)提升50%,運維效率提升了60%,節(jié)水達到70%。
四是冷板式液體冷卻方式。針對高功率密度能效提升約50%,TCO降低了30%。全球首例采用液冷GPU集群在百度成功上線,化解了遠高于傳統(tǒng)計算方式高能耗的問題,為后續(xù)的智能化和AI提供更大的便利和應(yīng)用無法想象的空間。
節(jié)能環(huán)保在數(shù)據(jù)中心,是一個永恒的話題。陽泉數(shù)據(jù)中心已經(jīng)將風電、太陽能等各種綠色能源資源的利用實現(xiàn)了最大化。
例如,陽泉數(shù)據(jù)中心在模組樓頂?shù)氖S嗫臻g安裝了太陽能電池板,光伏發(fā)電即發(fā)即用,成為國內(nèi)首個應(yīng)用光伏發(fā)電的數(shù)據(jù)中心。
在陽泉數(shù)據(jù)中心,除了電源,消耗最大的就是水資源。因為機房熱量要靠冷塔蒸發(fā)傳遞到室外,蒸發(fā)掉大量的水份,加上要清除沉淀到冷塔和管路中水中的鈣鎂離子等各種雜質(zhì),每天的耗水達到上千噸。陽泉數(shù)據(jù)中心對排污水進行了收集并通過酸堿中和,稀釋其中的鈣鎂離子,對污水再回收利用,數(shù)據(jù)中心全部設(shè)施投產(chǎn)以后,每年回收水將達到48萬噸水的量。
在整機柜方面,陽泉數(shù)據(jù)中心將近96%服務(wù)器采用了百度北極2.0整機柜服務(wù)器,北極2.0采用了共享電源和風扇的架構(gòu),供電實現(xiàn)標準化、模塊化、一體化,總成本降低15%左右,值得一提的是自研服務(wù)器平均每臺耗電量比普通的服務(wù)器下降12%,交付率反而提升了20倍。
機房全景
百度應(yīng)用GPU等異構(gòu)計算,引入深度的學習和異構(gòu)的計算集群,成為百度大腦的動力引擎。陽泉數(shù)據(jù)中心GPU集群承載了公司幾乎所有AI業(yè)務(wù),融入先進設(shè)計理念和語音、圖像、搜索、無人車、加速計算等一流技術(shù),具有高性能,高效率、低功耗的特點,保證了AI業(yè)務(wù)長期穩(wěn)定,高效運行。
一名工作人員告訴我們,人們所知曉的PUE值1.1,那還是2016年的數(shù)據(jù)。
筆者在ECC控制中心的大屏上看到有一模組的PUE實時值是1.07。這一模組囊括了百度所有最先進的架構(gòu),如高壓直流,空調(diào)末端使用OCU及水冷背板。而在9月份訪談期間,室外溫度超過27度;在即將到來的11月至來年的3月期間,實時PUE還將會更低!
離開陽泉之前,筆者又發(fā)了一條微信:“年均PUE值為1.11,真相大白!占地12萬平米的百度云計算(陽泉)中心(最優(yōu)PUE1.07)。先進的電氣架構(gòu),用電效率超過99.5%,定制化的高溫服務(wù)器,風電、太陽能(首家采用)等自然能量供應(yīng)超過整體供電量的23%,模塊化的頂置空調(diào)、首家采用鋰電機柜、將AI引入數(shù)據(jù)中心……節(jié)省機房面積25%,年節(jié)電2.5億度、節(jié)水48萬噸。真是不看不知道!”
這次,不少朋友紛紛點下了珍貴的“贊”。筆者相信,此文的發(fā)布,還將會贏得更多的認同和點贊。