顧凡認為,HPC應(yīng)該回歸“工具”的本質(zhì)
與此同時,基于我們都了解“永遠希望同樣的任務(wù)算的時間越短越少,同樣的模型能夠解決更多的問題。”的HPC“剛性需求”——因此,顧凡表示,高性能計算要充分的去考慮“來自HPC的挑戰(zhàn)”在增大問題規(guī)模、縮短運算時間和增大物理復雜度的方面因素,而不是單純的去追求浮點運算量的提升——“因為這三個方面,哪個方面可以提升都對HPC是有益處的。”
顧凡表示,這也就是說,要想讓高性能計算回歸本質(zhì),成為“工具”,在提升浮點運算、追求單節(jié)點性能最高的同時,需要同時考慮總線速度、內(nèi)存帶寬,而對于英特爾來說“英特爾始終不遺余力的做系統(tǒng)、產(chǎn)品和軟件編譯器。”就是為了滿足這樣的一個需求——“所有的包括多核、眾核、AVX都是為了提高浮點計算能力,提高總線速度。QPI解決處理器喂飽的問題,總線帶寬、內(nèi)存帶寬能夠匹配的上。”
英特爾全面化高性能計算戰(zhàn)略
也正是基于此,在本次ChinaGrid2009學術(shù)年會上,英特爾方面不斷的提出“英特爾所提供的是“平臺”而不是單純提供處理器”的概念——“英特爾核心價值在于處理器、編譯器以及生態(tài)環(huán)境的相關(guān)部分,英特爾在進入酷睿架構(gòu)之后,走向了一個正確的方向,選擇了四核的階段去做了更新(QPI)。隨著核心越來越多,內(nèi)存通道、QPI的帶寬也要越來越大,進行匹配。”顯然,顧凡認為,正是基于對整體、對平臺以及除浮點計算之外的更多應(yīng)用需求的認知,英特爾能夠滿足“讓HPC回歸本質(zhì),變成工具”的要求。
所以,在演講開始之前,顧凡展示了一副三年前用的PPT:英特爾希望,在數(shù)模優(yōu)化、并行化、數(shù)值計算、數(shù)據(jù)管理、結(jié)果可視化方面能夠為高性能計算用戶提供支持,讓他們能夠減少在這方面的壓力,將更多的精力放在“物理模型、數(shù)學模型、理性分析”上面。
何萬青:基于特征分析的評價標準
在年初的文章中,我曾多次分析了目前高性能計算的評價體系,尤其是TOP500所采用的Linkpack,并一直期待能夠出現(xiàn)一個或是一種更加客觀、貼近用戶應(yīng)用的高性能計算系統(tǒng)性能評價方法,而在本次ChinaGrid2009學術(shù)年會上,何萬青的演講因此也就對我產(chǎn)生了極大的吸引。
對于TOP500所采用的Linkpack,何萬青卻在演講開始時給予了肯定,這顯然出乎我的意料——他表示:“專門來測試浮點性能的,能夠榨取最后一點性能,驗證系統(tǒng)進行“體驗”,簡單和趁手的工具進行系統(tǒng)性能的測試。很多系統(tǒng)的bug都是Linkpack找到的。”
何萬青認為,Linpack還是有用的,可以做TOP500的指標,但是不適合實際應(yīng)用中的系統(tǒng)評價
因此,“本身作為TOP500的指標是非常好的。”——這句話的意思再簡單不過:對于TOP500有用的Linkpack,對于在實際中評價高性能計算系統(tǒng)或許是不合適的。
何萬青所提出的面向?qū)ο蟮腂enchmark,基本可以理解為“針對不同的應(yīng)用,把應(yīng)用特征摘取出來,進行針對性的測試。”對此,何萬青舉例表示,在香港天文臺,采用Linkpack進行測試其應(yīng)用的時候,hypertown和Nehalem是一樣的,但是具體到三個特殊的針對應(yīng)用的測試,Nehalem的提升是非常高的,在氣象上這一點非常常見,因為氣象應(yīng)用往往更多是對內(nèi)存敏感型的,而不是頻率敏感型的——當然,這個問題我已經(jīng)在此之前在文章《Nehalem:改變千萬億次計算的未來》討論過。
言歸正傳,我們回到對何萬青對高性能計算的評價標準上。
何萬青將高性能計算的應(yīng)用場景劃分為四個,分別為:單一應(yīng)用程序、多個同類型應(yīng)用程序針對特別的應(yīng)用程序、通用的高性能計算中心(HPC Center),因此,測試應(yīng)該根據(jù)不同的應(yīng)用場景和應(yīng)用特征來設(shè)定——四類測試方法為:針對應(yīng)用程序的特點來進行Benchmark測試、根據(jù)一類應(yīng)用程序的共同特點來進行針對性的測試、運行就緒的系統(tǒng)選擇正確的Benchmark子集、運行通用的HPC Benchmark獲得平均的指標。
何萬青的“雷達圖”其實道理很簡單:看明白某一個應(yīng)用在哪方面最敏感,一方面可以用來進行優(yōu)化,另一方面可以評價高性能計算系統(tǒng)的性能——當然是針對某一個或一類特定的應(yīng)用。
因此,我們在何萬青的四個例子上,都看到了由多種應(yīng)用特性組成的“雷達圖”:在一個雷達圖上,各個方向上都代表了一個特性,或者說是特征,這正是讓應(yīng)用顯示出其“特性”的地方——就此,用戶可以根據(jù)這個特性來完成對高性能計算系統(tǒng)的針對應(yīng)用特征,或者說針對實際情況的測試,而不是無論在何時何地都是用Linpack,畢竟并不是所有的,甚至不能說大多數(shù)高性能計算應(yīng)用都是浮點敏感占主要地位的。
何萬青的方法簡述起來就是找到影響應(yīng)用性能的幾個重要技術(shù)指標,設(shè)計相應(yīng)的性能評估模型(變動某個指標會對性能造成什么樣的影響),確定合適的測試應(yīng)用和負載,而不是單純的使用Linpack,