高性能計(jì)算歷史上重點(diǎn)用于解決解釋物理系統(tǒng)的微分方程,如地球的大氣層或者氫彈的裂變觸發(fā)器。這些系統(tǒng)把自己分為許多網(wǎng)格,這樣,物理系統(tǒng)在這種程度上就能夠映射到處理器或者處理器內(nèi)核的物理位置上,從而最大限度地減少移動(dòng)數(shù)據(jù)中的延遲。
但是,重要的科學(xué)和工程問題(更不用說國家安全問題了)數(shù)量的增加是不同的。這些問題數(shù)據(jù)通用類型的信息學(xué),并且包括計(jì)算在一個(gè)自然災(zāi)害期間運(yùn)輸網(wǎng)絡(luò)可能發(fā)送什么事情,以及尋找預(yù)測恐怖主義襲擊或者核擴(kuò)散失敗的方式。這些操作通常需要通過詳審大量的信息數(shù)據(jù)庫。
根據(jù)Sandia國家實(shí)驗(yàn)室的模擬,對(duì)于信息學(xué)來說,更多的內(nèi)核并不意味著更好的性能。Sandia的計(jì)算、計(jì)算機(jī)、信息和數(shù)學(xué)主任James Peery說,超過8個(gè)內(nèi)核之后,性能沒有改善。在使用16個(gè)內(nèi)核的時(shí)候,計(jì)算機(jī)看起來與2個(gè)內(nèi)核的計(jì)算機(jī)一樣。在過去的一年里,Sandia團(tuán)隊(duì)與芯片廠商、計(jì)算機(jī)設(shè)計(jì)者和高性能計(jì)算機(jī)用戶廣泛地討論了這個(gè)結(jié)果。除非計(jì)算機(jī)設(shè)計(jì)師找到一個(gè)解決方案,否則,Peery和其他人都預(yù)計(jì)超級(jí)計(jì)算機(jī)程序員將關(guān)閉多余的內(nèi)核或者使用多余的內(nèi)核處理解決主要問題之外的輔助的事情。
這個(gè)難題的核心是所謂的內(nèi)存墻:處理器能夠操作數(shù)據(jù)的速度與處理器能夠得到它需要的數(shù)據(jù)的速度之間的日益加大的差距。Sandia的高級(jí)技術(shù)人員 Richard C. Murphy解釋說,雖然每個(gè)處理器上的內(nèi)核數(shù)量在增長,但是,芯片連接到計(jì)算機(jī)其它部分的連線數(shù)量沒有增加。因此,讓所有的內(nèi)核都獲得充足的數(shù)據(jù)是一個(gè)問題。在信息學(xué)應(yīng)用中,問題更糟糕,因?yàn)樘幚砥髡谔幚淼臄?shù)據(jù)和下一套數(shù)據(jù)所在的地方?jīng)]有相互之間的物理聯(lián)系。數(shù)據(jù)不是在隔壁的內(nèi)核的緩存中,而是有可能在20米之外的一個(gè)機(jī)架的DRAM內(nèi)存芯片中,并且需要離開那個(gè)芯片通過一個(gè)或者更多的路由器和光纖找到通向處理器的道路。
為了使事情重回正軌,美國能源部今年組建了高級(jí)架構(gòu)和算法研究所。這個(gè)研究所在Sandia并且在田納西州的橡樹嶺國家實(shí)驗(yàn)室,其工作是找出未來五年之十年將需要什么高性能計(jì)算機(jī)架構(gòu),并且?guī)椭笇?dǎo)這個(gè)行業(yè)向那個(gè)方向發(fā)展。
Peery說,解決這個(gè)瓶頸的關(guān)鍵是把內(nèi)存和處理器更緊密地(也許是更聰明地)結(jié)合在一起。因此,Sandia正在探索處理器上面的堆疊內(nèi)存芯片的影響以便改善內(nèi)存帶寬。