就像一個(gè)人要提升工作效率就必須采用更為先進(jìn)的工作方法一樣,從處理器的設(shè)計(jì)角度來說,要想提升其效率,主要途徑就是必須采用新的、在IPC上表現(xiàn)更佳的微架構(gòu)(Microarchitecture,或稱微體系架構(gòu))。
從理論上來說,處理器微架構(gòu)就是對(duì)處理器所采用的指令集體系結(jié)構(gòu),如x86、PowerPC的一種邏輯實(shí)現(xiàn)。處理器微架構(gòu)的設(shè)計(jì),實(shí)際上涵蓋了對(duì)處理器中所有模塊,如控制單元、指令預(yù)取單元、高速緩存單元、分支預(yù)測(cè)單元、運(yùn)算單元、總線接口單元及這些模塊的連接和協(xié)作方式的設(shè)計(jì),其目標(biāo)則是一方面要使指令集體系結(jié)構(gòu)定義的功能能夠得以實(shí)現(xiàn),另一方面就是要不斷提升整個(gè)處理器的工作效率。
與發(fā)展緩慢、甚至是許多年穩(wěn)固不變的指令集體系結(jié)構(gòu)不同,處理器微架構(gòu)幾乎每隔幾年就會(huì)有升級(jí)換代。如人們所熟悉的英特爾奔騰處理器家族,從奔騰、奔騰2、奔騰3再到奔騰4,他們的換代就主要是源于微架構(gòu)的改進(jìn)。而去年英特爾推出的酷睿2與之前的奔騰4及奔騰D的差別,也在于它使用了效率更高、耗能更低的酷睿(Core)微架構(gòu),而不是后者所用的NetBrust微架構(gòu)。
我們或許可以通過對(duì)比酷睿與NetBrust微架構(gòu)的一些差異來理解微架構(gòu)的改進(jìn)對(duì)處理器效率提升帶來的有益作用。實(shí)際上,在酷睿微架構(gòu)采用的五大創(chuàng)新技術(shù)中,多數(shù)均與處理器效率提升有直接或間接的關(guān)系,例如其寬位動(dòng)態(tài)執(zhí)行技術(shù),就是通過將解碼器從前一代微架構(gòu)的3個(gè)增加到4個(gè),來提升處理器的IPC值;又如它采用的高級(jí)數(shù)字媒體增強(qiáng)技術(shù),就將前一代產(chǎn)品必須用兩個(gè)時(shí)鐘周期才能處理完的SSE指令改為在一個(gè)時(shí)鐘周期內(nèi)完成,這也有助于處理器效率的提升。此外,酷睿微架構(gòu)還采用了宏融合(Macro-Fusion)技術(shù),在解碼時(shí)可將同類指令融合為單一的指令,以減少待處理的指令總數(shù),這與處理器性能公式強(qiáng)調(diào)減少待執(zhí)行程序指令數(shù)目的要求相合,也能夠起到提升性能的作用。
選芯須兼顧架構(gòu)與速度
所上文所述,評(píng)估處理器性能的高下,較為科學(xué)的方法應(yīng)是綜合考察微架構(gòu)和時(shí)鐘頻率兩個(gè)方面的差異,這種方法尤其適用于采用不同微架構(gòu)的處理器產(chǎn)品。而要在基于同一微架構(gòu)的處理器產(chǎn)品中進(jìn)行性能評(píng)估時(shí),以時(shí)鐘頻率作為衡量標(biāo)準(zhǔn)的方法事實(shí)上并未過時(shí),當(dāng)然,在時(shí)鐘頻率之外,消費(fèi)者也需要了解它們?cè)谙到y(tǒng)總線頻率、緩存容量上是否還有差異。
以英特爾現(xiàn)有的PC處理器產(chǎn)品為例,不論是它定位于高端的四核酷睿2(Core 2 Quad)、定位于中高端的雙核酷睿2(Core 2 Duo)、還是它主攻低端市場(chǎng)的雙核奔騰和單核賽揚(yáng)主力產(chǎn)品,現(xiàn)在都采用了目前業(yè)界效率最為出色的酷睿微架構(gòu),當(dāng)消費(fèi)者需要將它們與其他廠商或微架構(gòu)的產(chǎn)品進(jìn)行對(duì)比時(shí),消費(fèi)者就不能只看時(shí)鐘頻率上的差異,但如果消費(fèi)者只需在這四款酷睿微架構(gòu)的產(chǎn)品中進(jìn)行選擇,那么就只需考慮它們?cè)诤诵臄?shù)量、時(shí)鐘頻率、緩存容量及前端總線頻率上的差別即可。
或許有人還會(huì)追問:既然時(shí)鐘頻率一直以來就不是衡量處理器性能的惟一標(biāo)準(zhǔn),那為什么在過去很多年中,這種"速度即性能"的觀點(diǎn)卻一直能夠大行于道呢?為什么現(xiàn)在人們?cè)谶x擇PC處理器時(shí)還要多考慮微架構(gòu)的差異呢?
其實(shí),造成這一情況的原因在于過去三十多年間,處理器在時(shí)鐘頻率上的增長(zhǎng)幅度要遠(yuǎn)遠(yuǎn)超過了其效率的提升幅度。從上世紀(jì)70年代初英特爾推出全球首款處理器4004以來,處理器的時(shí)鐘頻率增長(zhǎng)幅度已經(jīng)達(dá)到了近30000倍,而IPC提升幅度只有幾十倍,處理器性能的提升很大程度上要?dú)w功于時(shí)鐘頻率的飛速增長(zhǎng),而今,時(shí)鐘頻率的提升因?yàn)樘幚砥鞴牡牟粩嘣黾右呀?jīng)遇到瓶頸,而其在效率上的改進(jìn),即微架構(gòu)的改進(jìn)對(duì)性能提升的作用開始變得越來越重要,實(shí)際上,處理器從單核走向多核,也是微架構(gòu)上的革新,也是為了大幅提升處理器的效率。因此,在多核時(shí)代,評(píng)估PC處理器性能要兼顧微架構(gòu)與時(shí)鐘頻率已經(jīng)成為必然趨勢(shì)。
軟件優(yōu)化情況不可忽視
PC處理器多核時(shí)代的來臨,不但讓消費(fèi)者們?cè)谶x購(gòu)處理器及PC時(shí)不再以時(shí)鐘頻率作為衡量其性能的惟一標(biāo)準(zhǔn),還在逐漸引導(dǎo)他們關(guān)注軟件優(yōu)化的問題,即操作系統(tǒng)和應(yīng)用軟件是否能夠針對(duì)多核PC處理器進(jìn)行調(diào)優(yōu),以充分發(fā)揮或發(fā)掘其性能優(yōu)勢(shì),尤其是其出色的并行處理能力。
軟件優(yōu)化問題的出現(xiàn),與PC處理器從單核過渡到多核的"突然性"不無關(guān)系。同早就導(dǎo)入對(duì)稱多處理器技術(shù)、在軟件上也偏重多線程化的服務(wù)器相比,而以往的PC,不論是家用產(chǎn)品還是商用產(chǎn)品,多是基于單顆處理器,其多數(shù)軟件也一直缺乏對(duì)多核處理器并行處理能力的支持,雖然在基于多核處理器的平臺(tái)上,它們的運(yùn)行性能也能獲得一定的提升,但它們還沒有做到真正的物盡其用。
要讓更多的PC軟件針對(duì)全新的多核處理器平臺(tái)進(jìn)行優(yōu)化,就需要它們的編程方式從傳統(tǒng)的串行編程革新為并行編程,不過,如果沒有合適的工具提供輔助,并行編程的難度和成本較高、開發(fā)效率也較低,這將使許多軟件開發(fā)商不太愿意為針對(duì)多核處理器重新編譯自己已經(jīng)在市場(chǎng)上獲得成功的軟件,而這種多核PC應(yīng)用軟件的缺失對(duì)于多核處理器及相應(yīng)PC產(chǎn)品的推廣必然會(huì)有不利影響。
面對(duì)多核PC軟件優(yōu)化中存在的這些問題,英特爾的準(zhǔn)備較為充分,它旗下的軟件與解決方案事業(yè)部在最近兩年陸續(xù)推出用于多核軟件開發(fā)和優(yōu)化的各種工具,包括相應(yīng)的分析器、編譯器和檢查器,它們可以幫助軟件開發(fā)商快速、低成本地實(shí)現(xiàn)其產(chǎn)品對(duì)于多核處理器的優(yōu)化和支持,讓多核處理器的性能優(yōu)勢(shì)能夠真正落到實(shí)地。
據(jù)了解,英特爾推出的這些多核軟件開發(fā)和調(diào)優(yōu)工具,已經(jīng)獲得了眾多軟件開發(fā)商的青睞,就國(guó)內(nèi)來說,許多商用及商用PC軟件商都利用它們對(duì)自己的產(chǎn)品進(jìn)行了優(yōu)化。例如廣州圓方計(jì)算機(jī)軟件工程有限公司開發(fā)的個(gè)人家居室內(nèi)設(shè)計(jì)軟件通過優(yōu)化,可以在基于酷睿2的PC上獲得相當(dāng)于奔騰4系統(tǒng)3.18倍的運(yùn)行速度,東軟的醫(yī)療影像系統(tǒng)利用英特爾相應(yīng)工具優(yōu)化后也能在基于英特爾酷睿2的PC的獲得1.5倍的性能提升,而金山的3D網(wǎng)絡(luò)游戲引擎在進(jìn)行同樣的優(yōu)化后,不但運(yùn)行速度在酷睿2 PC有了1.5倍的增長(zhǎng),其流暢性和交互性也得到了增強(qiáng)。
需要說明的是,由于英特爾的競(jìng)爭(zhēng)對(duì)手還比較欠缺對(duì)于多核軟件開發(fā)和調(diào)優(yōu)的支持,這實(shí)際上也就意味著在多核時(shí)代選擇基于英特爾處理器的PC,用戶也就無須為多核應(yīng)用軟件的缺失而擔(dān)憂。
對(duì)于廣大消費(fèi)者來說,要盡享多核PC的快感,僅僅以科學(xué)的性能評(píng)估方法對(duì)其處理器進(jìn)行選型還是遠(yuǎn)遠(yuǎn)不夠的。畢竟,處理器早已不是PC性能的瓶頸,I/O和存儲(chǔ)子系統(tǒng)的性能表現(xiàn)才是影響PC整體性能優(yōu)劣的關(guān)鍵環(huán)節(jié),而它們也成為了業(yè)內(nèi)廠商技術(shù)攻關(guān)的重點(diǎn)。值得一提的是,英特爾在這些領(lǐng)域的技術(shù)開發(fā)或推廣上也起到了至關(guān)重要的作用–它不但在業(yè)界率先支持最新的內(nèi)存技術(shù),如過去的DDR2和即將普遍使用的DDR3內(nèi)存,還領(lǐng)導(dǎo)了新一代PCI-E總線技術(shù)和USB等技術(shù)的研發(fā)和應(yīng)用,此外,它與業(yè)內(nèi)合作伙伴對(duì)于固態(tài)硬盤和混合硬盤技術(shù)的推動(dòng)也加快了這兩種高性能存儲(chǔ)設(shè)備走入PC的步伐。