現(xiàn)在,我們的“IT號(hào)外”將進(jìn)入對(duì)用戶更具現(xiàn)實(shí)指導(dǎo)意義的篇章,本文就將探討HPC用戶在服務(wù)器硬件選型中需要重點(diǎn)關(guān)注的方面,并對(duì)基于至強(qiáng)5500的相關(guān)產(chǎn)品進(jìn)行一番介紹和點(diǎn)評(píng)。

眾所周知,選購(gòu)HPC系統(tǒng)產(chǎn)品,絕不可能像購(gòu)買一臺(tái)PC,或是一臺(tái)普通的服務(wù)器那樣輕松,鑒于HPC系統(tǒng)高昂的投資,HPC用戶在選購(gòu)其硬件平臺(tái)時(shí),通常都會(huì)先對(duì)待選產(chǎn)品進(jìn)行認(rèn)真且詳細(xì)的測(cè)試與評(píng)估,并以此為基礎(chǔ)做出決策。對(duì)此,我們建議用戶在這一環(huán)節(jié)中要盡量確定適于目標(biāo)應(yīng)用,也就是自己真實(shí)應(yīng)用軟件的測(cè)試指標(biāo)和方法,在評(píng)估中則要從CPU、內(nèi)存帶寬及其最佳配置、內(nèi)存和QPI的參數(shù)配合選擇、存儲(chǔ)子系統(tǒng)及節(jié)點(diǎn)間互聯(lián)等對(duì)HPC系統(tǒng)性能至關(guān)重要的幾個(gè)方面來考慮,以下就是我們與之相關(guān)的六頂主要建議,謹(jǐn)供大家參考:

1.HPC選型測(cè)試不要只看Linpack值

在確定HPC待購(gòu)產(chǎn)品的測(cè)試指標(biāo)和方法時(shí),用戶一定要切記不要太看重Linpack值。雖然HPC的全球TOP500排行榜和中國(guó)TOP100排行榜都是以它為標(biāo)準(zhǔn)對(duì)HPC系統(tǒng)進(jìn)行排名,但這并不意味著它可作為具體用戶評(píng)估和測(cè)試HPC系統(tǒng)的惟一標(biāo)準(zhǔn)。由于Linpack只是一個(gè)出好的壓力測(cè)試軟件,可通過簡(jiǎn)單的求解線性方程組,能夠給出足夠的壓力,來測(cè)試高性能計(jì)算機(jī)系統(tǒng)的浮點(diǎn)性能和擴(kuò)展性,還可用來對(duì)機(jī)器進(jìn)行“體檢”——烤機(jī)、查錯(cuò),并在測(cè)試和優(yōu)化Linpack過程中也會(huì)發(fā)現(xiàn)一些系統(tǒng)Bug。但它卻無法反映出HPC系統(tǒng)的實(shí)際應(yīng)用性能。

例如,3.2GHz的至強(qiáng)5482和新一代的2.93GHz至強(qiáng)5570,由于后者的時(shí)鐘頻率略低,因此在Linpack測(cè)試中并不占優(yōu),但對(duì)于石油油藏模擬、氣象等對(duì)內(nèi)存較敏感的應(yīng)用來說,由于至強(qiáng)5570采用了QPI和集成內(nèi)存控制器,能提供更大的內(nèi)存容量和內(nèi)存帶寬,總體應(yīng)用性能卻有2-3倍的提升,而這是Linapck測(cè)試所無法體現(xiàn)的,因此用戶如只憑Linpack來選型,就難免會(huì)誤入歧途。

從更加科學(xué)的角度來說,用戶在對(duì)HPC系統(tǒng)進(jìn)行選型測(cè)試時(shí),應(yīng)使用貼近自身實(shí)際應(yīng)用特征的工具和方法,從內(nèi)存帶寬占用、內(nèi)存使用量、CPU利用率、存儲(chǔ)I/O、網(wǎng)絡(luò)帶寬等多個(gè)指標(biāo)進(jìn)行應(yīng)用特征分析。

2.從應(yīng)用出發(fā)實(shí)現(xiàn)系統(tǒng)最優(yōu)化均衡配置

目前的HPC應(yīng)用,一般最倚重的指標(biāo)有三,即CPU浮點(diǎn)計(jì)算能力、內(nèi)存帶寬及容量和I/O的帶寬,一般來說,它們都會(huì)在兼顧三者的同時(shí)偏重其中某一項(xiàng),例如石油行業(yè)HPC系統(tǒng)上運(yùn)行的地震資料處理軟件是浮點(diǎn)計(jì)算密集型應(yīng)用,而油藏模擬類應(yīng)用軟件則對(duì)內(nèi)存帶寬要求較高,因此如能選到一個(gè)在這三方面均有出色表現(xiàn)的平臺(tái),那就是最為理想的結(jié)果了。

在選擇了一個(gè)均衡平臺(tái)的基礎(chǔ)上,用戶還要在采購(gòu)HPC系統(tǒng)前再對(duì)自己的主要應(yīng)用軟件的特性進(jìn)行一些分析,看看自己的應(yīng)用對(duì)硬件平臺(tái)那一項(xiàng)性能或能力最為偏重,最好是確定一個(gè)適合于自己應(yīng)用的測(cè)試指標(biāo),借試用廠商新服務(wù)器產(chǎn)品的機(jī)會(huì)測(cè)試一下,以求的配置上進(jìn)行精準(zhǔn)的調(diào)整,達(dá)到最合理或優(yōu)化的效果。

比如,我們將HPC選型按應(yīng)用分成四個(gè)類型:一類是只跑一種應(yīng)用,如氣象領(lǐng)域的HPC系統(tǒng),這時(shí)最關(guān)鍵的就是要對(duì)應(yīng)用進(jìn)行專門調(diào)優(yōu),選擇最匹配的機(jī)器;第二種是運(yùn)行某一類型的應(yīng)用,英特爾就曾對(duì)12種生命科學(xué)軟件的應(yīng)用特征進(jìn)行了分析,找出其共同的特點(diǎn)和性能瓶頸,然后給出了對(duì)應(yīng)的系統(tǒng)配置,以幫助OEM廠商和用戶在進(jìn)行系統(tǒng)設(shè)計(jì)和選型時(shí)有更加科學(xué)的參考;第三種則是運(yùn)行幾類不同的應(yīng)用,如由多個(gè)院系共享的校級(jí)計(jì)算中心,這時(shí)同樣需要對(duì)多種應(yīng)用軟件的應(yīng)用特征進(jìn)行分析,找到盡可能適合這幾種應(yīng)用的系統(tǒng)配置;第四種是完全對(duì)外提供服務(wù)的公共計(jì)算中心,要求什么應(yīng)用都可以運(yùn)行,這需要進(jìn)行綜合的性能測(cè)試,以找到一個(gè)平衡的通用系統(tǒng)。

3.盡量實(shí)現(xiàn)單節(jié)點(diǎn)性能最大化

具體到HPC系統(tǒng)應(yīng)該選擇什么樣的CPU方面,我們建議用戶可根據(jù)所要達(dá)到的峰值計(jì)算能力選擇相應(yīng)檔次的CPU,通常主流HPC應(yīng)用在至強(qiáng)5500系列里可選5520、5550和5570等幾個(gè)型號(hào),但需要注意的是CPU在運(yùn)行實(shí)際應(yīng)用時(shí),其能否發(fā)揮峰值計(jì)算能力還要考慮內(nèi)存帶寬的限制。

在此基礎(chǔ)上,我們還是建議大家要盡量實(shí)現(xiàn)單節(jié)點(diǎn)性能最大化,這意味著我們應(yīng)該根據(jù)需求,盡量選擇較為高端的至強(qiáng)5500處理器,表面上這確實(shí)是會(huì)增加一些硬件采購(gòu)成本,但是它們可以讓單個(gè)節(jié)點(diǎn)的計(jì)算性能更強(qiáng),從而可以減少節(jié)點(diǎn)的總數(shù)量,大大節(jié)省在節(jié)點(diǎn)間互聯(lián)、軟件授權(quán)、系統(tǒng)運(yùn)維上的成本,還能夠讓系統(tǒng)的計(jì)算效率更高。英特爾將于明年推出的Nehalem-EX多路處理器就將讓四路、八路以上的“胖節(jié)點(diǎn)”構(gòu)建起來更加容易,用戶屆時(shí)可以根據(jù)應(yīng)用來實(shí)現(xiàn)“胖節(jié)點(diǎn)”、“瘦節(jié)點(diǎn)”的混合搭配。

要實(shí)現(xiàn)單節(jié)點(diǎn)性能的最大化,在選擇內(nèi)存系統(tǒng)時(shí),同時(shí)需要注意這樣一些指標(biāo)和關(guān)系:如內(nèi)存和QPI之間的配合,每通道的內(nèi)存插座數(shù)量。比如,1333MHz的內(nèi)存,需要QPI帶寬達(dá)到6.4T/s為最佳配置,而1066MHz則可和5.87T/s的QPI配置配合;每個(gè)內(nèi)存通道的DIMM越少越好,已避免資源競(jìng)爭(zhēng)和峰值內(nèi)存帶寬限制。

4.互聯(lián)選擇,要在端口數(shù)量和價(jià)格之間平衡

千兆以太網(wǎng)、Infiniband都是目前HPC系統(tǒng)內(nèi)部主要的互聯(lián)網(wǎng)絡(luò)標(biāo)準(zhǔn)。隨著Infiniband的普及,主流HPC集群的節(jié)點(diǎn)間互聯(lián)基本都采用DDR 2x 或QDR 4x 的Infiniband交換機(jī)和接口。由于Infiniband交換機(jī)的配置和價(jià)格隨支持端口數(shù)的增加有較大變化,所以用戶可以通過設(shè)計(jì)合理的網(wǎng)絡(luò)拓?fù)鋪頊p少投資,同時(shí)可通過采用較高主頻的CPU來增加單節(jié)點(diǎn)性能,減少集群總節(jié)點(diǎn)數(shù)量。

5.考慮用固態(tài)硬盤突破存儲(chǔ)I/O瓶頸

從全球和部分國(guó)內(nèi)HPC用戶的反饋來看,無論是對(duì)HPC領(lǐng)域還是一般數(shù)據(jù)中心用戶來說,使用SSD(固態(tài)硬盤)和SSD陣列的服務(wù)器設(shè)計(jì)來突破存儲(chǔ)I/O瓶頸都已成為一種趨勢(shì)。在這方面,較為流行的做法是可以使用SSD作為本地快速、臨時(shí)的存儲(chǔ)池,加速對(duì)本地盤的臨時(shí)快速讀寫。

6.待選系統(tǒng)是否能夠滿足限定的供電和散熱條件

雖然HPC用戶和潛在的用戶對(duì)于系統(tǒng)的總功耗還不是特別敏感,但其技術(shù)人員還是要保證待選產(chǎn)品的功耗和散熱能夠滿足既有條件的限制,尤其是那些升級(jí)HPC系統(tǒng)時(shí)可能要延用原有機(jī)房的用戶。而對(duì)于那些新建HPC系統(tǒng),同時(shí)也將為該系統(tǒng)新建其周邊基礎(chǔ)設(shè)施的用戶來說,他們就應(yīng)該在設(shè)定系統(tǒng)性能目標(biāo)的同時(shí)也確定其功耗和散熱的目標(biāo)值,并以此為基準(zhǔn)設(shè)計(jì)和配置其機(jī)房、供電和散熱設(shè)備。當(dāng)然,這個(gè)目標(biāo)值是必須要兼顧到未來系統(tǒng)升級(jí)的需求,擁有一定彈性的。

以上這六條建議,只是我們對(duì)HPC系統(tǒng)采購(gòu)過程中一些關(guān)鍵環(huán)節(jié)的淺見,事實(shí)上,用戶考慮的方面還遠(yuǎn)遠(yuǎn)不限于此。我們想強(qiáng)調(diào)的,就是用戶不論做出什么樣的決策,其基礎(chǔ)都應(yīng)該是從實(shí)際應(yīng)用和實(shí)際需求出發(fā)。接下來,我們想再介紹六款基于英特爾至強(qiáng)5500處理器的、適用于HPC系統(tǒng)的服務(wù)器精品,希望能為用戶在具體產(chǎn)品的選擇上提供一些幫助。

1、IBM HS22刀片,領(lǐng)軍網(wǎng)游行業(yè)HPC應(yīng)用

提到IBM的高性能計(jì)算產(chǎn)品,就不得不提到HS22這款刀片服務(wù)器。在今年最新的中國(guó)TOP100排行榜上,前十名中有六臺(tái)機(jī)器清一色使用的都是這款刀片服務(wù)器。他們也都是網(wǎng)絡(luò)游戲運(yùn)營(yíng)商,因?yàn)榫W(wǎng)絡(luò)游戲?qū)Ω咝阅苡?jì)算的需求而組建了超級(jí)計(jì)算機(jī)——不約而同選用IBM HS22的原因又是什么呢?

簡(jiǎn)單來說,HS22與上一代刀片HS21比較起來,其處理器更新?lián)Q代為最新的至強(qiáng)5500系列,計(jì)算性能相對(duì)HS21有2倍以上的提升(得益于至強(qiáng)5500的QPI總線和集成的內(nèi)存控制器)。另一方面,我們認(rèn)為HS22刀片擁有多達(dá)4組10Gb以太網(wǎng)和總共8個(gè)I/O端口才是其優(yōu)勢(shì)所在。其8個(gè)萬兆交換所帶來的負(fù)載均衡極大的滿足了高性能計(jì)算的延遲問題。這也是眾多網(wǎng)絡(luò)游戲公司選擇它的原因之一。此外,HS22還憑借至強(qiáng)5500出色的功耗控制,在效能比上優(yōu)勢(shì)明顯,對(duì)運(yùn)營(yíng)成本很敏感的網(wǎng)游公司自然也會(huì)考慮這個(gè)因素。

2、輕巧而強(qiáng)大,戴爾R410專為HPC而生

戴爾的產(chǎn)品一直以來都有其獨(dú)到之處,其R410就憑借至強(qiáng)5500處理器的超強(qiáng)性能和戴爾本身對(duì)系統(tǒng)帶寬的良好把控——DDR3內(nèi)存的采用及可選的多種網(wǎng)絡(luò)接入方式,使得其性能相比上一代產(chǎn)品提升了80%。另一方面,預(yù)裝的戴爾管理控制臺(tái)(DMC)和戴爾生命周期管理器則可幫助管理者簡(jiǎn)化原先繁瑣的管理流程。

戴爾方面表示,客戶在構(gòu)建HPC基礎(chǔ)架構(gòu)時(shí)的需求除了性能外,主要集中在以下幾個(gè)方面:簡(jiǎn)易性、成本和可擴(kuò)展性。戴爾將最簡(jiǎn)單的1U機(jī)架服務(wù)器做成HPC節(jié)點(diǎn),一方面就是從管理和維護(hù)的簡(jiǎn)易性去考慮,另一方面是從成本來考慮的——相比刀片要便宜很多。而相比刀片服務(wù)器的高密度環(huán)境來說,R410擁有者更靈活的擴(kuò)展空間,單位功耗上也要比刀片低得多。

3、惠普DL360 G6,強(qiáng)調(diào)容錯(cuò)與冗余備份

如果說至強(qiáng)5500是為HPC而生,那么惠普的HP DL360 G6就是為至強(qiáng)5500而設(shè)計(jì)的一款集高密度計(jì)算、基本容錯(cuò)和HP Insight Control于一體的1U機(jī)架服務(wù)器?;萜沼?8根內(nèi)存插槽配合雙路至強(qiáng)5500處理器,最多可以打造一個(gè)144GB寄存式內(nèi)存的強(qiáng)大計(jì)算環(huán)境。網(wǎng)絡(luò)方面惠普采用了帶TCP/IP卸載引擎的雙端口多功能千兆網(wǎng)卡,與其智能陣列配合,使得DL360 G6在硬盤I/O和網(wǎng)絡(luò)I/O上都不會(huì)出現(xiàn)瓶頸。

在做科學(xué)計(jì)算或復(fù)雜的工程運(yùn)算時(shí),用戶通常都難以承受系統(tǒng)在運(yùn)算過程中出錯(cuò)——那意味著前功盡棄。HP DL360 G6以冗余風(fēng)扇+冗余電源的雙冗余備份設(shè)計(jì)以及智能陣列RAID控制器的便攜式電池允許將高速緩存寫入另一臺(tái)服務(wù)器中做冗余備份,大大降低了在高性能計(jì)算中因?yàn)橐粋€(gè)節(jié)點(diǎn)宕機(jī)造成的損失。

4、五大優(yōu)勢(shì),曙光I610r-G可擔(dān)大任

曙光I610r-G相比上一代產(chǎn)品主要在處理器、芯片組和內(nèi)存方面有所升級(jí),因而上市之初就被認(rèn)為是未來云計(jì)算、高性能計(jì)算的節(jié)點(diǎn)組成部分。其五大優(yōu)勢(shì)主要是:“高性能”、“高可靠性”、“高可擴(kuò)展性”、“高可管理性”以及“高性價(jià)比”。

高性能自然毋庸置疑,雙路至強(qiáng)5500保證了1U機(jī)架內(nèi)的出色計(jì)算密度,而12根內(nèi)存槽也保證了最大96GB的海量?jī)?nèi)存配置。高可靠性方面,I610r-G主要擁有BIOS保護(hù)恢復(fù)、網(wǎng)卡自動(dòng)切換、電源自檢報(bào)警等功能,使得系統(tǒng)從底層BIOS到上層網(wǎng)絡(luò)任何一方面出現(xiàn)問題,都可以及時(shí)轉(zhuǎn)移工作負(fù)載,不會(huì)影響使用。擴(kuò)展性和管理性方面,I610r-G可以擴(kuò)展1個(gè)半高的PCI-E x16的擴(kuò)展卡和一個(gè)全高的PCI-E x8的擴(kuò)展卡,并且由于集成了曙光智能硬件監(jiān)控系統(tǒng),其內(nèi)部電流、風(fēng)扇轉(zhuǎn)速等都可以得到監(jiān)控和調(diào)整,方便了管理員在高性能計(jì)算集群中對(duì)某一節(jié)點(diǎn)的單獨(dú)調(diào)整。

5、挖掘聯(lián)想深騰7000背后的節(jié)點(diǎn)信息

今年國(guó)內(nèi)的TOP100排行榜上,聯(lián)想深騰7000系統(tǒng)以145.2萬億次的計(jì)算速度排名第三。但是由于聯(lián)想的策略和深騰7000在中科院超算中心的應(yīng)用較機(jī)密。我們并不能在聯(lián)想官方網(wǎng)站上看到有關(guān)深騰7000節(jié)點(diǎn)的有關(guān)信息。不過我們知道,深騰7000的主要計(jì)算節(jié)點(diǎn)是深騰B714R刀片服務(wù)器,7U高度的刀片機(jī)箱內(nèi)部可以插14片雙路計(jì)算刀片,也就是一個(gè)42U的標(biāo)準(zhǔn)機(jī)柜內(nèi),最多可以裝84個(gè)計(jì)算刀片,配備接近672個(gè)計(jì)算核心。

據(jù)聯(lián)想展示的資料表示,深騰B714R刀片服務(wù)器完全可以支持雙路至強(qiáng)5500處理器,盡管深騰7000超級(jí)計(jì)算機(jī)中的節(jié)點(diǎn)采用了至強(qiáng)5400處理器——當(dāng)時(shí)還未推出至強(qiáng)5500。除了對(duì)最新處理器的支持外,深騰B714R還擁有轉(zhuǎn)換效率達(dá)93%的高效電源,且所有模塊全部支持熱插拔,關(guān)鍵部件,如網(wǎng)絡(luò)模塊、電源模塊也配備了冗余。

6、浪潮天梭TS30000 ,實(shí)力勝于一切

浪潮的天梭TS30000一經(jīng)推出就先后 6次打破SPECjAppServer應(yīng)用性能測(cè)試、SPECpower節(jié)能測(cè)試、TPC-E數(shù)據(jù)庫性能測(cè)試等全球權(quán)威測(cè)試紀(jì)錄。這也是在早先使用至強(qiáng)5400處理器時(shí)的情況,現(xiàn)在的TS30000已經(jīng)可以支持最新的至強(qiáng)5500處理器,其高速Q(mào)PI互聯(lián)完全消除了北橋和處理器之間的帶寬瓶頸,浪潮認(rèn)為其系統(tǒng)帶寬至少提高了50%以上。

值得一提的是,TS30000去年還通過了OVM測(cè)試,其整個(gè)測(cè)試是對(duì)包含數(shù)據(jù)庫、操作系統(tǒng)、服務(wù)器、存儲(chǔ)產(chǎn)品在內(nèi)的綜合平臺(tái)進(jìn)行測(cè)試,強(qiáng)調(diào)了系統(tǒng)性、嚴(yán)酷性和高仿真性,而浪潮TS30000劃分了8個(gè)虛擬機(jī)順利通過了這些測(cè)試,等同于是經(jīng)受住了8次Oracle VC的測(cè)試考驗(yàn)。

以上6款HPC精品,均可發(fā)揮英特爾至強(qiáng)5500的強(qiáng)大性能、智能計(jì)算功能和出色的能效,同時(shí),得益于開放的架構(gòu),這款處理器也能為其他眾多品牌及型號(hào)的HPC系統(tǒng)注入充沛的活力,我們相信,這些產(chǎn)品將為HPC用戶及潛在用戶帶來充裕的選擇空間,用戶也完全可以根據(jù)自己的需求,在它們之中挑選到最合適自己的產(chǎn)品。

在下一篇“IT號(hào)外之HPC應(yīng)用指南”中,我們就將告別選購(gòu)環(huán)節(jié),切入到應(yīng)用階段,為用戶如何用好基于至強(qiáng)5500平臺(tái)的HPC系統(tǒng),充分挖掘它們的潛力獻(xiàn)計(jì)獻(xiàn)策,這篇文章將于12月29日發(fā)布,敬請(qǐng)留意。

分享到

cuihao

相關(guān)推薦