至頂網(wǎng) 發(fā)表于:13年09月18日 10:17 [轉(zhuǎn)載] DOIT.com.cn
大家可能還記得,英特爾公司曾提出一項極具野心的發(fā)展目標:在2020年之前以20兆瓦功率支撐起百億億次級別的芯片處理性能。但這一目標正面對一道難以逾越的障礙——物理定律。
當英特爾于2011年首次公布該宣言時,芯片巨頭提出了一系列技術(shù)方案,旨在彌合當前處理器與發(fā)展目標高達多個數(shù)量級的性能差距,并提高執(zhí)行效率。
已經(jīng)被英特爾成功攻克的技術(shù)難題包括利用近閾值電壓處理器(簡稱NVP)實現(xiàn)超低功耗,通過Hybrid Memory Cube等系統(tǒng)構(gòu)建的內(nèi)存堆疊機制,以及已經(jīng)被英特爾用于大規(guī)模多核心至強Phi平臺的異步處理系統(tǒng)等。
但隨著英特爾在技術(shù)領(lǐng)域的步步深入,他們開始遭遇更多新難題與新挑戰(zhàn),這一切讓前行中的每一小步都變得無比艱辛。
“目前新技術(shù)可謂層出不窮,而這些技術(shù)都將給我們建議系統(tǒng)的方式產(chǎn)生深遠影響,”英特爾公司百億億次系統(tǒng)首席架構(gòu)師Al Gara在本屆IDF的一場主題演講中表示。
他解釋稱,其中最大的變數(shù)在于英特爾所采用的內(nèi)存類型,不同的選擇將帶來完全不同的結(jié)果。
他表示:“說起高性能計算與內(nèi)存工作機制的發(fā)展方向,目前擺在我們面前的道路有兩條:其一是繼續(xù)堅持DRAM路線不動搖,并且在未來很長一段時間內(nèi)始終以DRAM為首選方案,”另一條則是“如果新的內(nèi)存技術(shù)之一迎來實質(zhì)性進化,那么以此為基礎(chǔ)構(gòu)建起的新體系將讓設(shè)計方案走向完全不同的軌道。”
這些新型技術(shù)包括自旋轉(zhuǎn)移力矩內(nèi)存、納米機構(gòu)RAM、相變存儲器以及其它新興的非易失性記憶體技術(shù)。所有這些方案都承諾帶來五到十倍的性能提升,其中某些還會帶來新的計算可能性。
但問題在于,英特爾還不清楚這些技術(shù)能否及時發(fā)展成熟,從而扮演新一代標準化內(nèi)存方案的重要角色。而在此之前,芯片巨頭不可能投入大量人力物力來研究和實施這些技術(shù)。
有鑒于此,我們詢問Gara:英特爾還要等待多久才會押下這一輪賭注——即在DRAM與新興內(nèi)存技術(shù)之間做出選擇。他回應(yīng)道:“也許一年半到兩年。在這樣的時間框架中,大家將看到這些技術(shù)逐步轉(zhuǎn)化為實際產(chǎn)品。也許到時候它們還不足以徹底取代DRAM,但至少我們會將其視為切實可行的備選機制。”
“在這些技術(shù)迎來進一步簡化并投放市場之前,我們無法給出確切結(jié)論。”
這意味著英特爾的超級計算機之夢目前面對著兩條截然不同的路線:要么繼續(xù)死抱DRAM不放,將其作為創(chuàng)建系統(tǒng)的最佳方案。這當然有些棘手,因為“如果我們?nèi)匀谎赜肈RAM,那么隨著計算性能的提升、我們將必須要步步下調(diào)內(nèi)存容量來保證性能不受影響,”Gara指出,“到那個時候,我們會考慮增加線程數(shù)量。”
這樣一來,我們必須要創(chuàng)建各種新的編程方式來實現(xiàn)隱式并行,同時通過光學(xué)連接等高速互連與芯片數(shù)據(jù)總線系統(tǒng)來構(gòu)建大部分低內(nèi)存容量、高計算性能的環(huán)境。
如果內(nèi)存?zhèn)溥x技術(shù)之一迎來跨越式發(fā)展,情況則大大不同。舉例來說,假設(shè)自旋力矩內(nèi)存能夠成為新時代標準,那么計算的執(zhí)行方式也將書寫出新的篇章。
“我們可以利用該材料的磁特性,”Gara表示。這樣我們就能夠利用新內(nèi)存技術(shù)的物理屬性代替以往的傳統(tǒng)邏輯門,進而將設(shè)計方案的尺寸縮小25%,Gara如是說。
不過如果采用此類形式的內(nèi)存方案,英特爾需要做出一系列努力才能真正發(fā)揮其實際效果。“這些存檔系統(tǒng)的訪問時間在經(jīng)過優(yōu)化后仍有幾十毫秒,但在非易失性記憶體技術(shù)的支持下,訪問時間可降低至幾十納秒,”剛剛離開英特爾公司的前實驗室首席科學(xué)家Justin Rattner在去年IDF中指出。
雖然內(nèi)存方案的選擇給英特爾提出了難題,但芯片巨頭同時也把注意力放在其它存在發(fā)展?jié)摿Φ念I(lǐng)域——例如光子技術(shù)。
從目前來看,該公司正借助四種不同波長的光線實現(xiàn)50Gbps的互連傳輸能力,并有意通過八種不同波長的光線帶來100Gbps帶寬。英特爾認為只要不斷增加波長類型與傳輸效率,Tb級別的帶寬也將最終成為現(xiàn)實。
遺憾的是光子機制在傳輸時所需要的能量比傳統(tǒng)銅纜更多。“雖然在很多領(lǐng)域確實擁有巨大優(yōu)勢,但光學(xué)傳輸帶來的耗電增量也是我們必須留意的關(guān)鍵之一,”Gara解釋道。
但這些與高速內(nèi)存介質(zhì)(也包括參數(shù)更出色的DRAM方案)相結(jié)合的帶寬意味著英特爾需要拿出與之相匹配的新一代CPU。為了達成這一目標,芯片巨頭專注于線程擴展,同時在緩存共享、啟動成本、同步成本以及負載/執(zhí)行平衡等多個領(lǐng)域做出改進。
單靠提升時鐘速率還不足以實現(xiàn)改進目標。“我們在主頻方面已經(jīng)達到極限,”他表示。即使英特爾能夠在這方面再做出小幅提升,情況也不會出現(xiàn)實質(zhì)性變化:“如果我突然拿出一塊主頻達到THz級別的處理器,內(nèi)存系統(tǒng)的滯后將導(dǎo)致速度表現(xiàn)仍然無法令人滿意。”
替代方案之一在于約束性規(guī)劃模型,它能夠為架構(gòu)相對簡單的核心帶來更高主頻,他解釋稱。這一成果與專注于調(diào)整電壓供給的近閾值電壓處理器(于去IDF上首次亮相)相結(jié)合能夠有效降低產(chǎn)品的額定功率,從而幫助英特爾成功擺脫功耗膨脹的難題。“難點在于,在降低電壓的同時、芯片主頻也會隨之降低。”
英特爾當前面對的最大障礙正是在于這里:隨著向目標的不斷前行,物理定律總是一次又一次給芯片巨頭施以重擊——這種壓力有時來自材料本身、有時則源自信息的物理傳輸機制。想用更精密的芯片工藝解決問題?電壓分耗令人頭痛不已。想利用光學(xué)機制提升速率?夸張的功耗又讓人難以接受。
不過英特爾始終沒有放棄追尋方案的努力。根據(jù)Gara的說法,在電路中塞進更多計算能力的方法之一,在于以邏輯為核心實施信息交付,從而利用時間間隔傳輸計算性能。
“決定能源效率的關(guān)鍵因素在于線纜的具體長度以及我們需要使用的線纜數(shù)量。事實上,我們所使用的并非時間資源——及時構(gòu)建起編碼信息并不是問題,”他指出。“如果我在單一線纜中發(fā)送一條信號,時間將被消耗在傳輸?shù)倪^程中——這就是我們對信息進行編碼的方式。目前信息編碼需要消耗芯片主頻,同時帶來理想的能耗水平。問題是,同樣的機制是否也能作用于邏輯層面?”
面對這個問題,英特爾也沒能找到正確的答案,但他們無疑正在努力探索——試圖拋開某些看似無法克服的阻礙,從而在追尋百億億次解決方案的道路上更進一步。
不過就算英特爾成功在規(guī)定時間框架內(nèi)實現(xiàn)百億億次目標,整個過程也將再次循環(huán),Gara表示。因為根據(jù)蘭道爾原則——這一理論為計算成本設(shè)定了下限——英特爾仍有很長的道路要走。
“事實證明,百億億次計算性能的最低額定功率為16瓦;有趣的是,16瓦正是人類大腦的運作功率。因此從計算科學(xué)的理論角度看,16兆瓦功率應(yīng)該足以支持yottaflop(即每秒1024次)級別的浮點運算能力。”他無奈地表示。
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.