IBM藍(lán)色基因/Q 17核計(jì)算節(jié)點(diǎn)

該計(jì)算節(jié)點(diǎn)中間的芯片就是BGQ處理器,有Power核心、內(nèi)存控制器和各種連接特性。該計(jì)算節(jié)點(diǎn)并未滿(mǎn)配DDR3主內(nèi)存,這也是為什么上面覆蓋有藍(lán)色的材料,是用來(lái)覆蓋內(nèi)存插槽的。

藍(lán)色基因/P有一個(gè)亮點(diǎn),那就是它采用了水冷方式,有一個(gè)水冷彈簧加載鋁護(hù)套環(huán)繞著計(jì)算節(jié)點(diǎn)的正面和背面,接入兩個(gè)銅管之間的中板插槽。

當(dāng)你將BGQ計(jì)算節(jié)點(diǎn)接入插槽,按壓鋁套相對(duì)BGP處理器和節(jié)點(diǎn)內(nèi)存芯片與兩個(gè)相鄰的銅水管。這里沒(méi)有特別的熱接觸材料防止芯片接觸鋁片或者鋁片接觸銅管。

藍(lán)色基因/Q的計(jì)算抽屜

Smith表示,該系統(tǒng)的設(shè)計(jì)將使藍(lán)色基因/Q可以通過(guò)水冷達(dá)到60至65華氏度,相當(dāng)于誰(shuí)冷系統(tǒng)的溫度,這將越來(lái)越常見(jiàn),因?yàn)橄到y(tǒng)制造商開(kāi)始意識(shí)到,他們對(duì)數(shù)據(jù)中心組件有些過(guò)于冷卻了。這個(gè)計(jì)算抽屜里沒(méi)有風(fēng)扇,只有兩個(gè)電源和進(jìn)出水管道。

這個(gè)計(jì)算抽屜中有來(lái)自每個(gè)計(jì)算節(jié)點(diǎn)的光纖連接,通向中板以便與藍(lán)色基因/Q集群中的其他計(jì)算抽屜和計(jì)算節(jié)點(diǎn)相連接。水流進(jìn)來(lái),首先冷卻互連芯片,然后通過(guò)計(jì)算節(jié)點(diǎn)交換熱量。

藍(lán)色基因/Q計(jì)算抽屜有32個(gè)計(jì)算模塊(集群中每個(gè)服務(wù)器有一個(gè)計(jì)算模塊),每個(gè)計(jì)算節(jié)點(diǎn)將配置16GB DDR3主內(nèi)存(每個(gè)核心1GB)。一個(gè)計(jì)算抽屜有512個(gè)核心、2048個(gè)線程和512GB內(nèi)存。一個(gè)藍(lán)色基因/Q機(jī)架有32個(gè)(前端16個(gè)后端16個(gè))半深的計(jì)算抽屜,也就是一個(gè)機(jī)架內(nèi)有1024個(gè)服務(wù)器節(jié)點(diǎn)以及157萬(wàn)個(gè)專(zhuān)門(mén)用于處理計(jì)算的核心,另外98304個(gè)核心用于運(yùn)行藍(lán)色基因設(shè)備中的Linux內(nèi)核。另外一個(gè)有趣的事實(shí):IBM將采用5D網(wǎng)狀/環(huán)面互連以連接藍(lán)色基因/Q節(jié)點(diǎn)。

Smith表示,其實(shí)從5D互連可以想到,你在節(jié)點(diǎn)之間創(chuàng)建一個(gè)超立方體連接,然后連接這些超立方體以構(gòu)成5D環(huán)面網(wǎng)。

通過(guò)藍(lán)色基因/Q的設(shè)計(jì),IBM分開(kāi)了I/O節(jié)點(diǎn)與計(jì)算節(jié)點(diǎn)。這其中有兩個(gè)原因,首先,通過(guò)分離可以獨(dú)立進(jìn)行擴(kuò)展,那些不需要太多I/O的用戶(hù)可以向某個(gè)機(jī)架中增加更多計(jì)算任務(wù),利用更少的空間做更多的事。而且,I/O處理器同樣是基于BGQ模塊的,封裝密度并不高,所以不需要用水冷的方式。

  

細(xì)說(shuō)IBM藍(lán)色基因/Q之前世今生

藍(lán)色基因/Q的I/O節(jié)點(diǎn)

藍(lán)色基因/Q的I/O抽屜有8個(gè)節(jié)點(diǎn)和8個(gè)插槽用于添加10Gb以太網(wǎng)或者InfiniBand PCIe外設(shè)卡接口(見(jiàn)左上方)。

勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室的Sequoia超級(jí)計(jì)算機(jī)將在2012年安裝就緒,它由96個(gè)機(jī)架構(gòu)成,性能達(dá)20.13 petaflops。美國(guó)阿貢國(guó)家實(shí)驗(yàn)室(Argonne National Laboratory)曾在今年8月表示,他們也需要一臺(tái)藍(lán)色基因/Q,將有48個(gè)機(jī)架,總浮點(diǎn)性能達(dá)到10 petaflops。

前日公布最新一期高性能計(jì)算TOP500榜單中,IBM拿出了一個(gè)半機(jī)架的藍(lán)色基因/Q系統(tǒng),該設(shè)備的Linpack測(cè)試性能為65.3 teraflops,理論峰值可達(dá)到104.9 teraflops。

我們不知道藍(lán)色基因/Q在帶寬和延遲方面是否有所降低,但是據(jù)推測(cè)在平衡額外處理器性能方面還有很多工作要做。目前藍(lán)色基因/Q中的一個(gè)機(jī)架的峰值性能大約在209.7 teraflops,而藍(lán)色基因/P大約是13.9 teraflops,這是在原始性能方面的一個(gè)巨大跨越,大概需要一個(gè)更快的互連解決方案使其更高效。

如果IBM沒(méi)有對(duì)互連技術(shù)做實(shí)質(zhì)性的改變,那這也許會(huì)解釋勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室的藍(lán)色基因/L的效率是為80.2%,阿貢國(guó)家實(shí)驗(yàn)室的藍(lán)色基因/P效率為82.3%。

安裝在德國(guó)Forschungszentrum Juelich代號(hào)為“Jugene”的825.5 teraflops藍(lán)色基因/P超級(jí)計(jì)算機(jī)在Linpack測(cè)試中也得到了82.3%效率的成績(jī),相比之下,藍(lán)色基因/Q并非令人驚訝地高效,但在最早設(shè)計(jì)的時(shí)候的確是這樣的。當(dāng)然,畢竟藍(lán)色基因/Q還是一款原型機(jī),就像2005年的藍(lán)色基因/L和2007年的藍(lán)色基因/P。

分享到

wanglin

相關(guān)推薦