首先是美洲虎、山貓的對(duì)比,進(jìn)步可以說(shuō)是全方位的,幾乎每一項(xiàng)指標(biāo)都有了大幅度甚至經(jīng)常是翻番的提升。

– 生產(chǎn)工藝:從40nm升級(jí)為28nm,均來(lái)自臺(tái)積電(GlobalFoundries再踩你一腳)

– 單個(gè)內(nèi)核面積:從4.9平方毫米減小到3.1平方毫米

– 最大核心數(shù)量:x86-64,從2個(gè)翻番至4個(gè)

– 緩存:基本保持不變,還是一級(jí)雙路32KB指令、八路32KB數(shù)據(jù),二級(jí)每核心十六路512KB,當(dāng)然二級(jí)緩存總量會(huì)從1MB翻番至2MB

– 核心平面布局:從159900個(gè)增至194490個(gè)。這個(gè)你只要簡(jiǎn)單地理解為核心電路設(shè)計(jì)規(guī)模增大了20%以上就差不多了

– 發(fā)射寬度:雙寬度不變

– 物理尋址:36-bit增至40-bit

– 載入/存儲(chǔ)帶寬:每時(shí)鐘周期8Byte翻番至16Byte

– 浮點(diǎn)單元數(shù)據(jù)路徑:64-bit翻番至128-bit

– 調(diào)度器查詢:增大25-50%

再來(lái)看美洲虎架構(gòu)上的一些主要特性:

– ISA指令集架構(gòu)增強(qiáng):這個(gè)是重中之重,包括SSE4.1/4.2、AVX、AES、F16C、BMI1等等相當(dāng)豐富,比高性能核心并不遜色多少,這也是Atom所無(wú)法比擬的

– 4×32B指令緩存循環(huán)緩存,改進(jìn)功耗

– 改進(jìn)指令緩存預(yù)取器,提升IPC,估計(jì)可比山貓?zhí)岣?5%以上

– 增加硬件整數(shù)除法器

– 二級(jí)緩存預(yù)取器

– 改進(jìn)C6、CC6電源狀態(tài)開(kāi)關(guān)延遲

– 典型應(yīng)用中,時(shí)鐘柵極可占整個(gè)平面布局的92%以上

制造技術(shù)上,美洲虎使用的是臺(tái)積電28nm Bulk HKMG,11個(gè)金屬堆棧,比山貓多出1個(gè),但因?yàn)楣に囅冗M(jìn),間距小了很多,所以核心面積才縮小了三分之一以上。

處理器內(nèi)部模塊分布示意圖(局部):下方是四個(gè)CPU核心(不知道雙核心是屏蔽還是原生?),上方是共享的二級(jí)緩存。

核心平面布局圖:這是單個(gè)核心的各個(gè)模塊,都是和真實(shí)情況一一對(duì)應(yīng)的,當(dāng)然是偽色彩。

核心電源柵極:這是降低功耗尤其是低負(fù)載、待機(jī)功耗的關(guān)鍵,也是最高效的方式。它可以徹底關(guān)閉暫時(shí)無(wú)用處的模塊,而不同于簡(jiǎn)單的屏蔽。

這個(gè)是講如何控制電源柵極的,我們就不管它了。

最后是說(shuō)電源柵極的電壓控制效果。簡(jiǎn)單地說(shuō),整個(gè)核心都可以從此中獲益。正是新工藝加電源柵極,美洲虎的功耗可以大大降低,也可以在同等功耗水平下大大提升頻率和性能。根據(jù)相關(guān)消息,美洲虎架構(gòu)CPU的熱設(shè)計(jì)功耗從5-25W不等。

分享到

zhaohang

相關(guān)推薦