這款發(fā)布于2021年的Arm處理器,真的這么強嗎?
這項研究叫做《Arm云服務(wù)器是否準備好處理數(shù)據(jù)庫工作負載?一項實驗研究》,作者Dumitrel Loghin是新加坡國立大學計算學院的研究助理教授。
研究指出,搭載Arm 處理器的云服務(wù)器速度令人印象深刻,在處理某些任務(wù)負載時的表現(xiàn)甚至超過了英特爾至強處理器。
這項研究選了五款A(yù)rm服務(wù)器CPU,然后,還將它們與英特爾至強白金8488C(2023年Q1發(fā)布的第四代至強)在云平臺上的表現(xiàn)進行了比較。
實際參與對比的有AWS的Graviton2,Graviton3,阿里倚天710,來自Ampere的Altra以及英特爾至強白金8488C。
研究者租用了基于這些處理器的云主機,然后執(zhí)行了8個測試,包括:
Dhrystone 基準測試:用于測量計算機的整體性能;
Whetstone 基準測試:主要用于測量計算機的浮點運算性能;
系統(tǒng)調(diào)用測試:展示不同CPU在執(zhí)行系統(tǒng)調(diào)用時的頻率(以百萬次/秒計);
Execl調(diào)用測試:測試各CPU執(zhí)行execl調(diào)用的性能;
文件復制速度:測量數(shù)據(jù)在系統(tǒng)中移動的速度;
總體UnixBench分數(shù):一個綜合的基準測試,用來評估系統(tǒng)的多方面性能;
RSA 2048簽名:用來測試系統(tǒng)執(zhí)行加密簽名操作的性能;
RSA 2048驗證:測試系統(tǒng)執(zhí)行加密驗證操作的性能;
在所有這些測試中,阿里倚天710表現(xiàn)都非常不錯。
在Whetstone測試中,它甚至超過了英特爾的至強,同樣的,Ampere的Altra處理器也在這個測試中超過了至強。
研究者提到,阿里的倚天710有一些固有優(yōu)勢。比如,它使用了更新版本的Arm指令集架構(gòu)(ISA),還有更快的DDR5內(nèi)存,這是別的CPU沒有的。
華為云中的kc1.15xlarge.2主機支持使用NUMA拓撲結(jié)構(gòu)將一對鯤鵬920 CPU結(jié)合運行,這是其他Arm云服務(wù)器所沒有的功能。
在運行Redis的測試中,亞馬遜的Graviton 3處理器在這項測試中表現(xiàn)優(yōu)于倚天710。
在測試memcached的吞吐量時,倚天710的表現(xiàn)又勝過Graviton 3。
在用于測試RocksDB吞吐量的三種工作負載中,倚天710在其中兩種工作負載上表現(xiàn)更好。
報告還對比了Arm服務(wù)器和英特爾x86服務(wù)器的成本效益。
盡管Arm處理器的系統(tǒng)調(diào)用次數(shù)比英特爾至強多了兩倍還多,效率上差了點,但AWS的Graviton和倚天的性價比還是更高。
所以,當性能不是最重要的時候,用戶就可以考慮Arm服務(wù)器了。Arm帶來了性能和成本之間的新的平衡。
最后,研究者也指出了提升Arm服務(wù)器性能的三個建議。
第一個,提高主頻。Arm的主頻都偏低,小幅度的提升也能在成本增加不多的情況下,帶來顯著的性能提升。這是因為更高的主頻通常意味著處理器可以更快地執(zhí)行指令。
第二個,可以優(yōu)化系統(tǒng)調(diào)用的性能。研究者希望Linux內(nèi)核開發(fā)者能夠分析并改進系統(tǒng)調(diào)用的性能?,F(xiàn)在的Arm系統(tǒng),其系統(tǒng)調(diào)用的速度大約是x86系統(tǒng)的一半。優(yōu)化之后可以提高Arm服務(wù)器的執(zhí)行效率和響應(yīng)速度。
還有,如果軟件開發(fā)者能夠更好地利用Arm平臺的特有功能,例如Scalable Vector Extensions(可擴展向量擴展)。它也可以顯著提高應(yīng)用性能,特別是在處理大量數(shù)據(jù)運算時。
如果這些改進落實之后,則可以顯著提高Arm服務(wù)器在性能、成本效益和功耗方面的優(yōu)勢。
最后的最后,值得一提的是AWS最新的Graviton4。
它是去年年底re:Invent上發(fā)布的,目前由于采用該處理器的云主機只向部分用戶提供預(yù)覽,所以這里就沒有測到,未來如果全面放開的話,其表現(xiàn)也值得期待。