(圖片引自SemiAnalysis報道)

據SemiAnalysis披露,華為云CM384基于384顆昇騰芯片構建,通過全互連拓撲架構實現芯片間高效協(xié)同,可提供高達300 PFLOPs的密集BF16算力,接近達到英偉達GB200 NVL72系統(tǒng)的兩倍。此外,CM384在內存容量和帶寬方面同樣占據優(yōu)勢,總內存容量超出英偉達方案3.6倍,內存帶寬也達到2.1倍,為大規(guī)模AI訓練和推理提供了更高效的硬件支持。

(圖片引自SemiAnalysis報道)

報道分析稱,盡管單顆昇騰芯片性能約為英偉達Blackwell架構GPU的三分之一,但華為通過規(guī)?;到y(tǒng)設計,成功實現整體算力躍升,并在超大規(guī)模模型訓練、實時推理等場景中展現更強競爭力。SemiAnalysis也指出,華為的工程優(yōu)勢不僅體現在芯片層面,更在于系統(tǒng)級的創(chuàng)新,包括網絡架構、光學互聯和軟件優(yōu)化,使得CM384能夠充分發(fā)揮集群算力,滿足超大規(guī)模AI計算需求。

此次華為云CloudMatrix 384的發(fā)布,標志著中國在AI計算系統(tǒng)領域已具備與國際巨頭正面競爭的實力。SemiAnalysis在報道中特別指出,華為的規(guī)模化解決方案“領先于英偉達和AMD目前市場上的產品一代”,并認為中國在AI基礎設施上的突破將對全球AI產業(yè)格局產生深遠影響。

分享到

崔歡歡

相關推薦