法國的Curie thin nodes以1.36PFLOP的運算能力位列TOP500的第9名,這同樣是一臺基于至強E5的超級計算機。和SuperMUC一樣,它也是采用了Xeon E5-2680 8C處理器,主頻為2.7GHz,共計77184個內(nèi)核。Curie thin nodes的內(nèi)存為308736GB,整體功耗為2251kW,采用了Infiniband QDR高速互聯(lián)網(wǎng)絡。
SuperMUC和Curie thin nodes都采用Xeon E5-2680作為節(jié)點計算平臺,很難說是巧合。因為在首批發(fā)布的Xeon E5-2600處理器家族中,Xeon E5-2680屬于其中的高規(guī)格產(chǎn)品,它為8核心16線程結構,三級緩存為20M,QPI速度為8.0GT/s,功耗是130W。從整體上看,Xeon E5-2680是作為節(jié)點機較為合理的計算平臺選擇。
而事實上,從Nahalem架構的至強5500到Sandy Bridge架構的至強E5,至強處理器在高性能計算能力方面獲得了不斷的加強。新一代至強處理器已經(jīng)成為了TOP500超級計算機中的主流選擇。因為近年來每年2次的TOP500榜單中,基于英特爾至強處理器的系統(tǒng)均超過了70%。
本屆TOP500榜單中,共有372套系統(tǒng)采用了英特爾處理器,這個比例超過了74%。而即使是新入榜的系統(tǒng),采用英特爾處理器的系統(tǒng)占據(jù)了超過78%的份額。這意味著未來英特爾在TOP500中的份額還會有所提升。
新一代至強發(fā)力高性能計算
英特爾對于高性能計算的全力支持,可謂是源遠流長。以Nahalem架構的至強5500為標志,英特爾至強處理器進入了全新的時代。新架構對內(nèi)存帶寬的大幅增加,快速通道互聯(lián)技術、智能加速技術以及英特爾超線程技術等的采用,使得至強5500相比于上一代產(chǎn)品,在制造、建模、地震模型等方面可以獲得超過3倍以上的性能提升。
基于32納米工藝制程的至強5600處理器,除了性能比上一代的至強5500提升60%左右為,更是在綠色節(jié)能方面頗有建樹,為降低高性能計算機的整體功耗立下了汗馬功勞。
在自適應能效方面,至強5600主要在4個方面進行了改進:包括CPU功耗更低,每瓦特性能更高,六核版本至強5600的最低功耗為60W,四核版本至強5600的最低功耗只有40W;增強了智能節(jié)能技術,可以調(diào)節(jié)六個內(nèi)核的能耗狀態(tài),性能功耗比更接近理想的線性狀態(tài);處理器內(nèi)核的能耗管理算法進行了更新,可以讓Turbo Boost睿頻更高效,同時對內(nèi)存的能耗管理做到更精細化。此外,至強5600所集成的內(nèi)存控制器提供了對1.35v低電壓DDR3內(nèi)存的支持,而標準的DDR3電壓為1.5v。支持低電壓內(nèi)存的實際效果是在不犧牲性能的前提下可以降低20%的熱量。
除了不斷提供更高性能更低功耗的處理器給高性能計算用戶外,值得一提的是,英特爾早就提出了“Cluster Ready”計劃,對許多硬件廠商和軟件廠商的產(chǎn)品進行兼容性認證,讓用戶在搭建集群方面不用在選型方面費心思。英特爾“Cluster Ready”可以幫助用戶在采購和使用新平臺時更加簡單——選購經(jīng)過Intel Cluster Ready 認證的應用軟件和集群系統(tǒng),可以確保硬件平臺和軟件應用之間的互操作性,獲得性能提升和穩(wěn)定可靠的平臺。
至強E5為高性能而生
2012年3月,英特爾按照“鐘擺”理論,推出了全新的基于Sandy Bridge架構的至強E5-2600 處理器。新架構的采用使得至強E5仿佛是為高性能計算而生,它在眾多方面的特殊設計和優(yōu)異表現(xiàn),使得很多用戶立刻將高性能計算平臺的選擇轉(zhuǎn)向了至強E5,這也使得其上市僅3個月就有45套系統(tǒng)沖進了第39屆TOP500排行榜。
首先,至強E5具有8個核心,相比上一代的至強5600多出兩個內(nèi)核,具備20MB L3緩存,平均每核心2.5MB,這比上一代的每核心2MB要多25%,核心和緩存的增強對計算能力的提升明顯。因而至強E5在性能上比上一代的至強5600有80%的性能提升。
其次,至強E5在帶寬方面采用了環(huán)形鏈路總線,提升了帶寬降低了延遲。在QPI總線上,至強E5具備兩條最高8GT/s的QPI,相比至強5600家族每條鏈接帶寬增加了25%;在內(nèi)存支持上,至強E5具有四個內(nèi)存通道,內(nèi)存規(guī)格支持也提升到了DDR3-1600,而至強5600最高支持DDR3-1333。從這些規(guī)格來看,E5在數(shù)據(jù)帶寬上要明顯領先于至強5600,更加適合HPC苛求高帶寬的應用。
第三,至強E5還引入了專門針對HPC應用的AVX高級向量擴展指令集,來加強浮點運算性能。AVX技術是加大計算密度的起點,AVX指令集將現(xiàn)存的浮點向量指令從128位擴展到256位,這種改進可以讓每核每時鐘浮點運算峰值翻倍。
此外,英特爾還在5月推出了至強E5-4600處理器,這是針對緊湊型4路服務器的新平臺。至強E5-4600能在單個系統(tǒng)中最多可提供32個內(nèi)核和48個DIMM,適用于諸如科學研究和金融服務等各種廣泛的技術計算應用,適合做大規(guī)模集群的“胖”節(jié)點使用。
當前,云計算正快馬加鞭地走進人們的工作和生活,高性能計算也因此被賦予了新的使命。隨著應用的日益豐富和海量數(shù)據(jù)處理需求的增加,高性能計算已經(jīng)從原有的科研、氣象、工程、開發(fā)等領域,逐漸向更為廣闊的商業(yè)計算和信息化服務擴展。英特爾至強E5應需而生,其獨特的創(chuàng)新設計,已日漸被高性能計算用戶所認可。相信,在下一屆全球TOP500中,一定會有更多的至強E5系統(tǒng)上榜。