惠普Moonshot項(xiàng)目Gemini機(jī)箱
從上圖來看,好象Gemini機(jī)箱大約有十個(gè)機(jī)架單元高,配有兩個(gè)可載入服務(wù)器“墨盒”的托架。這是任何人從所有公開聲明中所能獲知Gemini機(jī)器的全部信息了,惠普并沒有公開表示將在未來的Gemini機(jī)箱中使用德州儀器的KeyStone ARM處理器。
惠普也沒有表示,與公司于2011年十一月推出的“Redstone”Moonshot機(jī)箱相比,Gemini服務(wù)器將如何進(jìn)行配置,前者使用了32位Calxeda ECX-100 ARM芯片,其中包括了一個(gè)非常智能的芯載分布式兩層交換機(jī)。
因?yàn)镃alxeda與惠普在Redstone上的長期合作以及Calxeda的產(chǎn)品已經(jīng)在惠普發(fā)現(xiàn)實(shí)驗(yàn)室中的事實(shí),Calxeda ARM芯片非常有可能被用于Gemini機(jī)器中,但Calxeda和惠普都沒有對(duì)此予以證實(shí)。
而另一個(gè)Moonshot機(jī)器(可能是Satum或Apollo,這取決于惠普是使用boost還是capsule的名稱)成為下一個(gè)產(chǎn)品是完全可能的,它將基于開放計(jì)算的Group Hug微服務(wù)器背板和形成因素的,這是目前和未來的ARM服務(wù)器、甚至未來Atom、Xeon以及Opteron服務(wù)器將被使用的所在。
德州儀器已推出了Cortex-A15處理器,該款處理器具有兩個(gè)或四個(gè)32位核并配有40位內(nèi)存尋址(即在ARM世界中被稱為大物理地址擴(kuò)展)以及混合ARM處理器(該技術(shù)把一至四個(gè)Cortex-A15核與一至八個(gè)TMS320C66x數(shù)字信號(hào)處理器集成在一個(gè)硅片上。
德州儀器的KeyStone II芯片系統(tǒng)框圖
有趣的是,這些ARM-DSP混合芯片使用了相同的TMS320C66x DSP 組件,使用了相同的TeraNet一致性網(wǎng)絡(luò)來集成為一個(gè)SoC,德州儀器在一年多以前SC11超級(jí)計(jì)算事件中將其作為x86的協(xié)處理器進(jìn)行銷售。
DSP和ARM芯片的架構(gòu)是一致的,并與其KeyStone的名稱一樣為人所知。現(xiàn)在的差別在于,如果你有需求它們就可以配上ARM核,而如果你完全不需要任何的DSP和ARM核,那么德州儀器也可以滿足你的要求。
通過這種方法,德州儀器可以緊貼純粹的云計(jì)算基礎(chǔ)設(shè)施工作負(fù)載:服務(wù)器、交換機(jī)、路由器、網(wǎng)絡(luò)控制板、工業(yè)傳感器以及無線傳輸設(shè)備,提供KeyStone II芯片的普通ARM版本。
它可以調(diào)低使用混合芯片上的DSP以滿足如視頻、IP攝像頭、流量系統(tǒng)、語音網(wǎng)關(guān)以及醫(yī)療設(shè)備應(yīng)用的工作負(fù)載需求,也可以調(diào)高使用混合ARM-DSP芯片上的DSP以滿足諸如超級(jí)計(jì)算、視頻會(huì)議、圖像處理與分析、醫(yī)療成像甚至虛擬桌面基礎(chǔ)設(shè)施等更高工作負(fù)載的需求。
這些DSP中的八個(gè)可以提供約1萬億次單精度浮點(diǎn)運(yùn)算性能和約384億次雙精度浮點(diǎn)運(yùn)算性能,而德州儀器的第二代DSP有望實(shí)現(xiàn)更高的性能。
有一點(diǎn)需要指出的是,性能是以單位功耗(瓦)計(jì)算的。使用幾個(gè)ARM芯片和你會(huì)相當(dāng)感興趣的模塊在200瓦的功耗下完成兩萬億次運(yùn)算的ceepie-deepie 超級(jí)計(jì)算機(jī).
DSP運(yùn)行頻率高達(dá)1.2GHz并配有一個(gè)1MB自有SRAM Level 2緩存,以及兩個(gè)或四個(gè)Cortex-A15 ARM核共享的一個(gè)4MB L2緩存,而每個(gè)核都有32KB 的L1指令型緩存和32KB L1數(shù)據(jù)型緩存。ARM核的運(yùn)行頻率高到1.4GHz,所有緩存均配有ECC擦除,這對(duì)于服務(wù)器工作負(fù)載來說是很重要的,只有DSP具有軟錯(cuò)誤保護(hù)。
ARM Cortex-A15處理器的KeyStone II系列產(chǎn)品
同樣重要的是,KeyStone II處理器在其芯片上有一個(gè)集成的以太網(wǎng)交換機(jī)。這個(gè)交換機(jī)就可能能夠像Calxeda用其處理器那樣把SoC連接至一個(gè)交換網(wǎng)絡(luò)。
但是其容量可能并不會(huì)太高,因?yàn)楦鶕?jù)規(guī)格設(shè)計(jì),它只是一個(gè)五端口千兆以太網(wǎng)交換機(jī),一個(gè)端口用于計(jì)算單元而四個(gè)端口用于外部世界的Soc。
我們希望,有可能在軟件中創(chuàng)建一個(gè)有別于多個(gè)Soc及其內(nèi)部千兆以太網(wǎng)交換機(jī)的Layer 2 網(wǎng)絡(luò),以形成簡潔的高密度集群。KeyStone II芯片的網(wǎng)絡(luò)加速器運(yùn)行線速度為1Gb/秒,它可以每秒150萬個(gè)數(shù)據(jù)包的吞吐量進(jìn)行處理,而這對(duì)于大量的云計(jì)算和超大規(guī)模負(fù)載應(yīng)用也是非常有用的。