相比桌面運算系統(tǒng),Intel早就給服務(wù)器系統(tǒng)準備了1333MHz總線,至強5335不僅總線速度高,價格甚至還要比頻率稍低的至尊版更便宜。
可能是因為服務(wù)器領(lǐng)域?qū)偩€的要求更高,大量的數(shù)據(jù)請求需要在同時并發(fā),這樣,1333MHz總線就能夠體現(xiàn)出優(yōu)勢來了。服務(wù)器領(lǐng)域嘗了鮮,但要付出的卻不會因為處理器價格便宜而有所收斂,不同的芯片組加上內(nèi)存等,一系列算下來,成本可要高上很多。
有沒有別的辦法呢?最簡單的就是等待,Intel預(yù)計在今年的第三季度推出1333MHz總線的桌面產(chǎn)品,為了凸顯與以前產(chǎn)品的不同,在處理器的型號上做了一些改動,改為EXX50。這好像是Intel的慣用伎倆,升級改動比較小的或者不是頂級系列的產(chǎn)品,往往就在后面添加一個類似5的后綴,這樣的事情在主板領(lǐng)域就更是不計其數(shù)了。只提高總線的運行頻率,并不會帶來太多的性能提升,所以Intel還是很乖巧的,并沒有使用更為激進的命名方式,尤其是一些對數(shù)據(jù)交換不是很敏感的應(yīng)用。這個名字的改變,其實還代表了不同頻率產(chǎn)品的出現(xiàn),號稱總線為1333MHz的產(chǎn)品,基頻已經(jīng)達到了333MHz,所以按照以前的倍率,處理器的頻率會稍有些提升,計算能力也會得到提高。
不過Intel也發(fā)現(xiàn),單純提高處理器的頻率,效果已經(jīng)不是很明顯了。每年幾十億美元的研發(fā)所帶來的性能和架構(gòu)的改變,很容易就被微軟這樣的軟件廠商浪費掉了,一些不知名的軟件也很可能讓它的英名掃地。改進架構(gòu)是一個方面,而提高電腦系統(tǒng)里面真正的瓶頸??存儲是另一個好方案。尤其是Intel最近也比較專注混合磁盤的研究,估計等非易失性存儲設(shè)備成為內(nèi)存之后,這方面的擔(dān)心會少一些。
可這些都是遠水,真正讓我們提前進入這個時代的是超頻。我們想辦法把手頭的QX6700外頻提到了1333MHz,最后居然還成功登上了1400MHz的頂峰,這讓我們興奮不已??蛇x的精英主板倒是挺多,電壓甚至可以按照0.0125V的幅度調(diào)整,不過就是有些不準,比如電壓調(diào)整,有時候通過BISO把電壓調(diào)整上去了,但實際結(jié)果卻是降低了。
還有一點很麻煩的是,要調(diào)整內(nèi)存的參數(shù)以及不同頻率之間的搭配,不能僅僅考慮處理器,還要考慮到周邊的一些情況,一旦某個條件無法滿足都會讓我們前功盡棄。且不說為了讓系統(tǒng)能夠正常運行,就是為了能夠讓處理器進入Windows就已經(jīng)是很讓我們高興的了,然后再繼續(xù)慢慢一步一步地調(diào)整,不僅需要耐心,還要慢慢地思索一些變化。
實際上,到了1333MHz已經(jīng)差不多觸頂了,處理器開始變得不夠穩(wěn)定,一些測試也是莫名其妙地過不去,要么是因為過熱,要么是因為內(nèi)存錯誤,煩不甚煩。每次失敗之后,還得重新來過,時間就這樣被浪費掉了。問題是,各種參數(shù)的搭配相當(dāng)多,我估計試驗了上百次才捉摸到了一點門道,提高了內(nèi)存和處理器的電壓,而把總線的終端截止電壓降低,總算成功了,此后諸事順利。1333MHz之旅從此展開……
提前感受1333MHz
先說平臺,我們選擇的是精英NF650iSLIT-A,只能算是一個二流的產(chǎn)品。本來沒有想到能夠?qū)崿F(xiàn)總線的超頻,卻是源于這個主板居然不支持倍頻往高處調(diào)整,只有往低調(diào),這點連Intel的原裝主板都比不上,好歹它都允許電壓倍頻調(diào)整,把處理器超頻到3.43GHz是一點問題都沒有,難道這個板子這么一點能耐都沒有?沒有這個能耐,但卻有另外一個能耐,最大外頻能夠達到的是處理器所達不到的,內(nèi)存支持也是相當(dāng)了得,是市面上的產(chǎn)品幾乎都達不到的。
且不管它。最重要的是,它提供了完善的手動選項。我還在暗想,nVIDIA的芯片組就是不一樣,做出的板子都與眾不同,不過要是想充分利用其中的選項,沒有幾天幾夜的仔細搭配估計也是白搭,偶爾玩玩到是沒什么問題。像我們這樣超頻之后還要經(jīng)歷測試,估計就不行了。
這讓我們看到了一絲曙光。Intel的這塊QX6700能不能順利實現(xiàn)我們的愿望呢?看看它的同胞兄弟,都能在速度更快的總線上運行,估計這個余量是沒有問題的。而我擔(dān)心的是四個核心超頻之后,主板供電應(yīng)付不了,所以在電壓調(diào)整上都比較謹慎。Intel的原裝主板都能夠?qū)崿F(xiàn)四核和雙核的轉(zhuǎn)變,而精英的這款就差點意思了,居然沒有。這就是差異,最初X6800測試的時候,能夠勉強到3.73GHz,這應(yīng)該是Intel現(xiàn)在的頻率極限。不過,Intel倒是不太在意處理器的頻率提升,盡管IBM放出話來,要超過4GHz,達到5GHz甚至6GHz,不過這個離桌面運算還是遠了點。
1333MHz總線的確是很快,不過由于內(nèi)存不同步,貌似需要做一些緩沖,因而一般來說第二次測試的成績會相對好一些。另外,我們還是用了DDR2 800,表面看來有些寒磣,不過對處理器的性能影響并不大。Core2架構(gòu)以計算為中心,頻率的變化對計算能力的影響更為顯著。不過,也出了一個小意外,由于1400MHz總線并不標(biāo)準,我們發(fā)現(xiàn)測試商用性能的時候,系統(tǒng)得分反而更低了,最初還懷疑是硬盤的問題,結(jié)果發(fā)現(xiàn)是因為系統(tǒng)總線不同步,導(dǎo)致的同步時間消耗過多,得分也就降低了。
而對渲染這樣的運算,倒是很需要強大的前端總線,讀寫的東西變得相當(dāng)快,尤其是四核協(xié)同作戰(zhàn)的時候,效率提升了很多。我們也發(fā)現(xiàn)了不同的算法對處理器利用率是不同的:基于循環(huán)式的運算,對處理器的利用率幾乎是100%,多核性能的提升基本上是100%;而基于遞歸方式的運算,處理器的利用率要打折扣,這也與操作系統(tǒng)的任務(wù)調(diào)度有關(guān)。
另外,我們還注意到,QX6700的巨大緩存還是起到了很大的作用,四個核心,一共8MB緩存,對測試的第一次和第二次的結(jié)果影響巨大,尤其是隨機讀取比較多的測試。而對循環(huán)套用比較多的測試,也因為緩存巨大而有所收獲。
這樣看來,1333MHz總線似乎更適合四核以上的處理器。一方面是因為Intel總線架構(gòu)決定了處理器之間的通信也必須通過總線實現(xiàn),總線速度提高,核越多效果越好;并且這也將影響處理器的使用方式,只能是盡量減少對總線的依賴,降低處理器之間的通信,盡量減少遞歸的應(yīng)用。
所以,1333MHz首先出現(xiàn)在服務(wù)器領(lǐng)域還是有道理的,它們服務(wù)的對象都是多線程,因而差距可能就會有25%的樣子,就像我們測試的Cinebench和POVWin的差距。至于我們通常的應(yīng)用,可能是在打開電源的那一剎那,感覺進入系統(tǒng)似乎快了一些,至于其他的,總線能夠帶給我們的就很少了。
測試情況解析
在這次測試中,主要是得益于處理器頻率的大幅度提升,從而使得整體性能得到了躍升。比如,特別仰賴處理器頻率的渲染,以及一些多媒體的應(yīng)用,因為處理器頻率的提升,性能差異比較明顯。另一方面則是因為有些項目數(shù)據(jù)交換比較多,所以仰賴操作系統(tǒng)進行調(diào)度,加上Intel處理器的核之間通信需要與芯片組溝通,導(dǎo)致了一些阻塞問題,也因為總線速度的提高而有所改變。
在四核處理器的運算中,核間通信問題對系統(tǒng)性能的影響較大。這也是因為Cinebench這樣的渲染軟件,比較仰賴處理器之間的通信,使得多核性能提升的幅度大大減小。比如,在雙核條件下,它的最大性能提升能夠達到1.87倍,這是考慮到操作系統(tǒng)所能夠?qū)崿F(xiàn)的最大倍率提升。而四核最多就是3倍的水平,也就是說大約有一個核的計算能力被消耗在任務(wù)分配方面了,損失還是相當(dāng)慘重的,這樣對總線的依賴就比較大了,總線的快慢將很大程度地影響最后的測試得分。
POVwin就不同了,它預(yù)先做好了分配,并且很少有處理器之間的通信,每個核預(yù)先分配好一定的工作量,讓它們各自把自己的工作運行完,這樣反而多核的性能提升得非常快。它的重點是在任務(wù)的提前分配上,因而這個階段耗時比較多,不過與單核比較起來,性能的提升幅度就比較大了,達到了4倍,簡直就是一個倍增器,一般很少能夠看到這么大幅度地性能提升。
不過,這也暴露了一個問題:看待多核與單核,還需要注意不同的軟件和不同的算法帶來的差異。當(dāng)然,Intel沒有在處理器內(nèi)部集成內(nèi)存控制器,在一定程度上影響了核與核之間的通信,也就是說,Intel處理器的核心缺乏核與核之間的通信機制。根據(jù)規(guī)劃,在不久的將來,Intel可能首先在服務(wù)器端推動集成內(nèi)存控制器的處理器,相信它們也將會在處理器內(nèi)部實現(xiàn)核與核之間的通信機制,因為如果不很好地解決這個問題,將很難應(yīng)付未來的多核時代。
IBM的做法就聰明多了,也把這一招仍給了AMD。加上AMD數(shù)次攻擊Intel假多核,使得Intel也反唇相譏,說AMD是自取滅亡,原生多核處理器的生產(chǎn)風(fēng)險太高,導(dǎo)致成品率無法大幅度提高。所以,不管是何種機制,有一點很明確,就是Intel處理器的核間通信問題必須解決。
AMD的架構(gòu)很適合多數(shù)據(jù)量在多核之間的穿行,因而更適合服務(wù)器領(lǐng)域的應(yīng)用。在這種條件下,計算的重要性可能放在次席,相比之下,處理器的通信能力更為重要。
這讓我們感受到,不同的軟件對處理器的不同應(yīng)用方式可能帶來不同的功率消耗。為了對比不同軟件對處理器的應(yīng)用情況,我們拿來了海韻電子的功率表,發(fā)現(xiàn)功率之間的差異,籍此,我們也看到了軟件利用處理器之間的效率差異。結(jié)果很有意思,像Cinebench對處理器的利用率明顯比POVWin低,全功率下要低10多瓦;而在單核條件下,操作系統(tǒng)對處理器功耗影響比較大,因此效率相差不大。另外,Cinebench對處理器資源利用不足還來自它利用處理器時候的功率波動,POVWin卻要穩(wěn)定得多,這種巨大的差異是一個很明顯的暗示,POVWin的算法要更優(yōu)秀。但對多核的應(yīng)用,軟件的分量似乎更大。
我們還需要注意的是,Intel的四核處理器本身給操作系統(tǒng)的認知就是一個遞歸的過程,它是通過類似HT的技術(shù),通過兩個核再虛擬出兩個核,以便取得操作系統(tǒng)的識別,而這兩個核與HT技術(shù)不同的是,它是實實在在的,這也在一定程度上影響了Cinebench的性能。
附件功不可沒
除了精英主板這樣的主力悍將,散熱器和電源也是功勛卓著。精英這款板子已經(jīng)讓我們對它刮目相看了,最近也從同事嘴里聽到了對它的認可,很難得,精英逐漸得到了認同。而精英也在逐漸改變以前只做廉價產(chǎn)品的形象,像NF650iSLIT-A這款板子這么出色,也是我沒有料到的,可以把QX6700從2.66GHz沖上3.5GHz,內(nèi)存調(diào)整功能的豐富加上選項的繁多,已經(jīng)足夠了。
不過也存在問題,這款板子啟動特別慢,尤其是在更改BIOS之后,很讓人心懸,總讓人懷疑是不是不成功了,不過它帶給我的還是喜悅多于失望,值得推薦。
話又說回來,因為處理器頻率的提升,功耗就提高了,就需要增加電壓以彌補標(biāo)準電壓下功率的不足,這就會對主板提出相當(dāng)苛刻的要求。QX6700標(biāo)稱最大功耗為125W,超頻之后,頻率提升了30%多,而功率提升一定超過了30%,這就意味著主板的供電必須接近200W的峰值,同時散熱器如果不夠好,也可能就烤糊了。
我們選擇的是海韻電子的600W電源,效率超過80%,功率因素在324W的時候達到了98%;散熱器則是華碩的新款SilentKnight,全銅制造,熱管加風(fēng)扇,十分安靜,最重要的是,散熱能力很強。在QX6700默認頻率、室內(nèi)溫度20℃下,處理器溫度只有22℃,超頻到3.5GHz,溫度也就上升3度,這是風(fēng)冷方式中相當(dāng)驚人的成績。
這一套東西搭配下來,實現(xiàn)了我們的超頻夢想,也讓我們提前感受到了1333MHz的威力。而海韻電子的600W電源也相當(dāng)安靜,如果不是華碩顯卡的散熱風(fēng)扇太大,這幾乎是一個完美的組合了,如果封裝在機箱里面,我們將幾乎聽不到任何噪音。
這次測試也讓我們看到Core2架構(gòu)的潛力,不僅頻率潛力驚人,就是外頻的變化也讓我們刮目相看,尤其是一些渲染類的軟件,對外頻的仰賴還是很大的。1333MHz對于那些經(jīng)常需要視頻處理的用戶來說,是相當(dāng)好的消息。可是,什么時候才能把硬盤這個瓶頸解決呢?這不是僅僅通過改接口就能解決的問題,說不定,在1333MHz總線之后,這是下一個議題吧。
鏈 接:總線頻率與處理器頻率
總線頻率一般是低于處理器頻率的,處理器與總線之間通過倍頻實現(xiàn)同步??偩€頻率就如同整個系統(tǒng)的基準頻率一樣,實現(xiàn)I/O、內(nèi)存等與處理器之間的數(shù)據(jù)交換。
既然外頻跟前端總線的頻率是呈倍頻關(guān)系,知道了總線頻率,也就知道了處理器的運行頻率(在倍率一定的情況下)。處理器的頻率就是CPU頻率=FSB頻率×倍率。同一級別的處理器,處理器廠商往往通過設(shè)定不同的倍頻,實現(xiàn)頻率差異,從而制造出不同的處理器,從本質(zhì)上說可能基本一樣的,只是品質(zhì)上略有差異而已。
這就直接導(dǎo)致了超頻。超頻專家認為,只要是同批次的產(chǎn)品、同樣的工藝、同樣的體系結(jié)構(gòu),那么處理器的最大工作頻率就是相當(dāng)?shù)?,只不過有些能夠更穩(wěn)定一些,而大部分在這個頻率下可能不能用。
在處理器的制造過程中,可以利用新的工藝逼近硅材料的極限,比如Intel的拉伸硅技術(shù),還有未來的high K技術(shù),都會讓處理器的功耗和頻率帶來變化。但是,頻率高的處理器面臨的問題更多,它們的發(fā)熱量更大,功耗并不與處理器的頻率完全成正比。一般來說,處理器的功耗大部分是被緩存消耗的,它們需要通過持續(xù)的電流保證數(shù)據(jù)的存儲,而計算邏輯的開關(guān)模式跟頻率成正比,這是理想的情況;而超頻之后,泄漏電流增加,無用功耗增加直接導(dǎo)致處理器發(fā)熱大大增加,使得繼續(xù)超頻成為不可能。
這就要加強散熱,但是一定材質(zhì)和體積的晶體管密度的產(chǎn)品,散熱的能力就確定了,為了獲得更多的超頻能力,需要采取極限措施,比如液氮、半導(dǎo)體以及干冰等制冷,把處理器頻率提升到新的水平。
頻率增加、制造工藝提高,這就會帶來新的干擾,雖然工作電壓降低了,但是降低到一定程度硅也就不可用了。比如,硅的開關(guān)電壓是0.7V左右,現(xiàn)在處理器最低工作電壓已經(jīng)在1V左右,空間已經(jīng)很小。而超頻過程中增加電壓,按道理對提高處理器的頻率是不利的,這么做主要是為了提供給處理器足夠的、在高頻率下的功率。
Intel目前使用的是QDR數(shù)據(jù)傳輸觸發(fā)形式,也就是說,把地址尋找和數(shù)據(jù)傳輸分開,在一個周期的4個拐點進行數(shù)據(jù)觸發(fā),從而把實際的數(shù)據(jù)傳輸4倍乘積,1333MHz的總線頻率對應(yīng)的實際頻率為333MHz。
AMD采取了不同的策略,它把總線內(nèi)建于處理器,使得處理器成為信息交換的中心,這能夠大大提高數(shù)據(jù)交換的效率,使得它能夠特別適合服務(wù)器應(yīng)用,并且處理器之間的直接通信也成為可能。
從現(xiàn)在來看,Intel處理器在計算能力上還有很大的空間,因而提升總線頻率意義重大,還會讓未來的四核主流處理器的性能得到大幅度地提升,同時也為未來強悍的集成圖形芯片提供了很好的空間。