James Reinders談到,英特爾服務于兩類開發(fā)群體的兩條開發(fā)產(chǎn)品線分別面向獲取最大并行性能和獲取最大并行開發(fā)效率的用戶,而獲取最大并行開發(fā)效率的用戶,如在Windows平臺上開發(fā)VC++應用的Intel Parallel Studio已經(jīng)進行了Beta測試,預計在2009年上半年發(fā)布。

他應用高性能計算快速特征分析,如Cycle統(tǒng)計、CPI值、內(nèi)存訪問、緩存效率、NUMA、SMT、IO粒度/延遲、MPI粒度/擴展性等方面來評價HPC平臺,并以如下圖的性能特征雷達圖來綜合比較不同處理器對應用的適用性。

在至強5500上,英特爾采用了SSE4.2,該新的指令集被嵌入在Nehalem何新忠,包括STTNI、ATA、POPCNT、CRC32等新特性。用以加速字符和文本處理器、加速搜索、加大在大型數(shù)據(jù)庫中搜索數(shù)據(jù)的速度,并支持了新的通信領域的指令。

英特爾智能加速、超線程及NUMA特性也是Nehalem平臺的優(yōu)異特性,打開NUMA開關(guān)之后,James表示可以提高大部分高性能計算的性能,而智能加速技術(shù)的Turbo開關(guān)可以提高CPU密集型(100%CPU使用率)高性能計算程序的性能。

下圖為典型數(shù)字氣象預報應用特征(應用雷達圖):

James在演講中同時談到了如何對MPI進行性能調(diào)優(yōu)、根據(jù)應用通信模式調(diào)整MPI拓撲(粗粒度調(diào)優(yōu))、通過ITAC函數(shù)分析精確優(yōu)化MPI性能(細粒度調(diào)優(yōu))等調(diào)優(yōu)方法。

在萬兆以太網(wǎng)的優(yōu)勢部分,他談到,至強5500可擴展支持多個萬兆以太網(wǎng)端口(10GbE),而新的英特爾82599萬兆網(wǎng)控制器芯片+至強5500能夠提供更低的總體成本,82599萬兆網(wǎng)控制器芯片提供了雙端口的全萬兆帶寬、I/O虛擬化、對FCoE的支持及iSCSI的硬件加速以及LAN主板集成設計。

James表示,英特爾的以太網(wǎng)技術(shù)支持iWARP技術(shù),NerEffect的iWARP技術(shù)為服務器集群保證了高吞吐、低延遲的以太網(wǎng)絡連接,他同時介紹了iWARP在石油行業(yè)應用的優(yōu)勢。

在最后的總結(jié)中,他表示,至強5500的用戶需要充分考慮SSE4.2的向量優(yōu)化實現(xiàn)以優(yōu)化關(guān)鍵循環(huán)、而集群性能很大程度上取決于MPI優(yōu)化的粒度,并建議使用英特爾Cluster Tools進行調(diào)優(yōu),同時,萬兆以太網(wǎng)將推動HPC擴展發(fā)展。

分享到

cuihao

相關(guān)推薦