“兩全其美”的至強(qiáng)融核
  
其實,早在至強(qiáng)融核還不是一個成熟可用的產(chǎn)品,而是以其核心技術(shù)——英特爾集成眾核(MIC)架構(gòu)在兩年多前初次亮相時,它就理所當(dāng)然地成為了焦點,原因就在于它是現(xiàn)階段惟一一個能夠帶來“兩全其美”應(yīng)用體驗的解決方案。

所謂兩全之一,就是具備較高的并行處理性能。有別于通用用途的至強(qiáng)處理器,至強(qiáng)融核協(xié)處理器是專為高性能計算中應(yīng)用越來越普遍的高并行化工作負(fù)載而開發(fā),旨在全力加速這類應(yīng)用負(fù)載處理速度的產(chǎn)品。在最新款至強(qiáng)處理器浮點計算能力還停留在約150 GFLOPS時,至強(qiáng)融核旗下兩個產(chǎn)品家族——3100和5110的雙精度浮點運算性能已分別達(dá)到了1,000 GFLOP以上和1,011 GFLOPS,而設(shè)計熱功耗則分別為300瓦和225瓦。前者可以用于運行計算密集型工作負(fù)載,如生命科學(xué)應(yīng)用和金融模擬,后者則適用于數(shù)字內(nèi)容創(chuàng)建和能源研究等內(nèi)存密集型工作負(fù)載,可以說,在日常運行這些應(yīng)用負(fù)載的用戶面前,它們在性能方面都有著難以抵擋的誘惑力。

而兩全之二,則是能夠讓用戶能夠更為輕松、容易地對其現(xiàn)有的針對英特爾架構(gòu)開發(fā)的高性能應(yīng)用軟件進(jìn)行優(yōu)化,使之能充分利用自己的性能潛力。這一點要得益于它采用了人們熟悉的和廣為接受的英特爾架構(gòu),可以充分利用英特爾公司為這一架構(gòu)提供的、應(yīng)用已經(jīng)非常普及的編程語言、并行模式、技術(shù)和開發(fā)人員工具,來支持用戶優(yōu)化已有的、構(gòu)建于英特爾架構(gòu)平臺之上的高性能計算應(yīng)用代碼。

以上這“兩全”兼顧,就形成了至強(qiáng)融核獨一無二的應(yīng)用優(yōu)勢——其性能和能效既出眾,針對它優(yōu)化現(xiàn)有應(yīng)用的成本又低、耗時又短,見效又快,這就使得眾多高性能計算用戶開始對它產(chǎn)生強(qiáng)烈的興趣,并開始進(jìn)行相關(guān)的測試和應(yīng)用。在今年11月與至強(qiáng)融核同期發(fā)布的最新高性能計算機(jī)500強(qiáng)排行榜上,就有7套上榜系統(tǒng)采用了這一創(chuàng)新產(chǎn)品,而且其中既包括了排名前十的系統(tǒng),也包括了本屆TOP500榜單上能效最高的系統(tǒng)。

中國用戶見證至強(qiáng)融核優(yōu)勢
 
就在至強(qiáng)融核亮相于新一期TOP500榜單的同時,四家來自中國的重量級高性能計算用戶也發(fā)布了他們對于這款協(xié)處理器的測試心得,這還是中國用戶首次就其應(yīng)用體驗發(fā)表見解。

這四家用戶中,有兩家是國內(nèi)石油勘探領(lǐng)域中應(yīng)用高性能計算技術(shù)的翹楚,即中國石化石油物探技術(shù)研究院和中國石油東方地球物理勘探有限責(zé)任公司。另外兩家則是國內(nèi)權(quán)威的科研機(jī)構(gòu)——中國科學(xué)院計算技術(shù)研究所和中國科學(xué)院過程工程研究所。

兩家石油行業(yè)的用戶都使用了各自最新的石油勘探用高性能計算應(yīng)用和算法對至強(qiáng)融核進(jìn)行了測試,結(jié)果是:中國石化石油物探技術(shù)研究院的疊前深度偏移應(yīng)用在單個至強(qiáng)融核計算節(jié)點(雙路至強(qiáng)E5+雙至強(qiáng)融核協(xié)處理器)上運行時的性能,要比在優(yōu)化后的單個雙路至強(qiáng)E5計算節(jié)點上運行時提升高達(dá)2.53倍,而與未經(jīng)優(yōu)化的單個雙路至強(qiáng)E5計算節(jié)點相比,兩個至強(qiáng)融核計算節(jié)點則可實現(xiàn)相當(dāng)于其10.3倍的性能;中國石油東方地球物理勘探有限責(zé)公司的疊前時間偏移應(yīng)用在單個至強(qiáng)融核計算節(jié)點上的運行性能,也是其在單個優(yōu)化后雙路至強(qiáng)E5計算節(jié)點上運行時的3.86倍。
  
值得一提的是,在至強(qiáng)融核上獲得上述性能提升并沒有讓這兩家用戶付出更多的軟件調(diào)優(yōu)成本,中國石化石油物探技術(shù)研究院副院長兼總工程師趙改善就指出,在測試時他們在至強(qiáng)融核計算節(jié)點上沿用了與至強(qiáng)E5計算節(jié)點相同的編程方法、MKL庫、DFT程序和源代碼。因此這一成績的獲得進(jìn)一步展示了至強(qiáng)融核優(yōu)良的擴(kuò)展性能,證明它可“大大提升中石化的iCluster地震資料成像系統(tǒng)的處理能力”。 中國石油東方地球物理勘探有限責(zé)任公司物探技術(shù)研究中心副總工程師陳維也斷言:“至強(qiáng)融核處理器將會在地震勘探數(shù)據(jù)處理中具有廣闊的應(yīng)用前景”。
  
上述兩家來自科研領(lǐng)域的用戶,也在至強(qiáng)融核協(xié)處理器的測試中獲得了與石油行業(yè)用戶類似的體驗。中科院計算所所做的測試是基于時域有限差分法的電磁仿真計算,它在單個至強(qiáng)融核PCI-E插卡上實現(xiàn)的性能,相當(dāng)于單個優(yōu)化后雙路至強(qiáng)E5平臺的1.28倍,比未經(jīng)優(yōu)化的雙路至強(qiáng)E5平臺,其性能提升更是高達(dá)3.2倍。中科院過程所進(jìn)行的測試則是用于化學(xué)、生物物理領(lǐng)域,旨在分析粒子間相互作用的IPE分子動力學(xué)模擬,結(jié)果發(fā)現(xiàn)單個至強(qiáng)融核PCI-E插卡的性能表現(xiàn),相當(dāng)于優(yōu)化后雙路至強(qiáng)E5平臺的1.98倍,而與未經(jīng)優(yōu)化、單路單線程的至強(qiáng)E5平臺相比,性能提升更是高達(dá)157.76倍。

同樣,在領(lǐng)略了至強(qiáng)融核帶來的性能優(yōu)勢的同時,兩家科研領(lǐng)域用戶也對其軟件優(yōu)化的便利性大加贊賞。中科院計算所高性能計算機(jī)研究中心主任張佩珩表示:“時域有限差分算法通過輕松的移植和簡單的并行優(yōu)化,在英特爾至強(qiáng)融核協(xié)處理器上獲得了很好的擴(kuò)展性和較高的性能提升,同時保證了代碼一致性和可維護(hù)性,大大節(jié)約了時間和人力成本。”中科院過程所身兼中國顆粒學(xué)會理事一職的研究員、博士生導(dǎo)師葛蔚則指出:“MIC作為一種x86架構(gòu)的眾核處理器,其編程模式能夠大大減少串行程序到眾核程序移植的工作量,對于一些簡單移植甚至能夠接近‘0工作量’,并且可以利用大量CPU上原有的調(diào)優(yōu)工具,為用戶移植代碼提供了很大方便。”

相信上述用戶對于至強(qiáng)融核的測試,以及對其應(yīng)用優(yōu)勢的見證將掀開這款創(chuàng)新產(chǎn)品在中國廣泛應(yīng)用的開端,或許在未來一兩年內(nèi),就會有更多中國用戶分享它們在至強(qiáng)融核上獲取的出色體驗,他們還很可能于2020年前,在英特爾公司的支持下,通過采用至強(qiáng)處理器平臺、至強(qiáng)融核產(chǎn)品線和與之相配套的更多先進(jìn)技術(shù),順利跨入百億億級高性能計算的時代。(IT168)

分享到

xuzhenxin

相關(guān)推薦