徐直軍在演講中強(qiáng)調(diào),算力過去是、未來也將繼續(xù)是人工智能發(fā)展的關(guān)鍵,尤其對于中國的人工智能而言更是如此?;谥袊F(xiàn)有可獲得的芯片制造工藝,華為正努力打造“超節(jié)點(diǎn)+集群”的算力解決方案,以滿足持續(xù)高速增長的AI算力需求。

文字編輯|宋雨涵

1

全球最強(qiáng)“超節(jié)點(diǎn)+集群”

深度解讀其內(nèi)涵

“超節(jié)點(diǎn)”:邏輯上的單一超級計(jì)算機(jī)

華為提出的“超節(jié)點(diǎn)”概念,是指由多臺物理服務(wù)器通過高速互聯(lián)緊密耦合而成的一個邏輯上的單一計(jì)算節(jié)點(diǎn)。雖然在物理上由多臺機(jī)器組成,但通過先進(jìn)的互聯(lián)和協(xié)同技術(shù),這個超節(jié)點(diǎn)可以像一臺超級計(jì)算機(jī)那樣統(tǒng)一地進(jìn)行機(jī)器學(xué)習(xí)、思考和推理。簡單來說,超節(jié)點(diǎn)實(shí)現(xiàn)了大規(guī)模分布式硬件在軟件層面的高度集成與協(xié)同,讓成百上千個計(jì)算單元如同一個整體般高效運(yùn)作。

在此次大會上,華為發(fā)布了最新一代的AI超節(jié)點(diǎn)產(chǎn)品——Atlas 950 SuperPoD和Atlas 960 SuperPoD。其中,Atlas 950 SuperPoD可支持多達(dá)8192張昇騰AI加速卡,Atlas 960 SuperPoD則支持高達(dá)15488張昇騰卡。

這兩款超節(jié)點(diǎn)在總算力、內(nèi)存容量、互聯(lián)帶寬等關(guān)鍵指標(biāo)上均處于全球領(lǐng)先地位,在未來多年都將是世界上算力最強(qiáng)的超節(jié)點(diǎn)。發(fā)布了兩款重磅超節(jié)點(diǎn)產(chǎn)品,代表當(dāng)前全球最高算力水平:

產(chǎn)品型號Atlas 950 SuperPoDAtlas 960 SuperPoD
支持昇騰卡數(shù)量8192張15488張
FP8算力8 EFLOPS30 EFLOPS
FP4算力16 EFLOPS60 EFLOPS
互聯(lián)帶寬16.3 PB/s34 PB/s
機(jī)柜數(shù)量160個未披露
典型性能訓(xùn)練:491萬tokens/秒<br>推理:1960萬tokens/秒未披露
上市時間已發(fā)布2026年

Atlas SuperCluster超級集群

基于上述超節(jié)點(diǎn),華為進(jìn)一步構(gòu)建了規(guī)模更為龐大的超級集群系統(tǒng):

2

“靈衢”互聯(lián)協(xié)議:

突破大規(guī)?;ヂ?lián)瓶頸

要將成千上萬臺服務(wù)器、數(shù)十萬顆芯片整合成一個協(xié)同工作的整體,高速互聯(lián)網(wǎng)絡(luò)是關(guān)鍵中的關(guān)鍵。傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)多采用以太網(wǎng)或InfiniBand交換機(jī)級聯(lián),隨著節(jié)點(diǎn)數(shù)量增加,網(wǎng)絡(luò)延遲和帶寬瓶頸會愈發(fā)明顯。

華為此次發(fā)布的“靈衢”(UnifiedBus)高速互聯(lián)協(xié)議,正是為了解決大規(guī)模AI集群的互聯(lián)難題。靈衢協(xié)議是一種面向超節(jié)點(diǎn)的全新互聯(lián)架構(gòu),它采用了跨機(jī)柜全光互聯(lián)技術(shù),將傳統(tǒng)的電信號互聯(lián)升級為光互聯(lián),大幅提升了帶寬并降低了延遲。

據(jù)介紹,靈衢2.0在Atlas 950 SuperPoD中實(shí)現(xiàn)了34 PB/s的總互聯(lián)帶寬。這意味著集群內(nèi)部任意兩個計(jì)算節(jié)點(diǎn)之間都能以接近“無限帶寬”的方式通信,數(shù)據(jù)在超節(jié)點(diǎn)內(nèi)的傳輸幾乎不受瓶頸限制。

同時,全光互聯(lián)避免了傳統(tǒng)電纜傳輸中的信號衰減和電磁干擾問題,使延遲降低到極致。華為宣稱,靈衢互聯(lián)的速度比當(dāng)前互聯(lián)網(wǎng)骨干網(wǎng)快了一個數(shù)量級,在連接數(shù)千顆加速器時依然能夠保持可靠的高速低延遲通信。這種“網(wǎng)絡(luò)即總線”的設(shè)計(jì),使得整個超節(jié)點(diǎn)如同擁有一個全局共享的高速總線,所有計(jì)算單元都可以像訪問本地內(nèi)存一樣高效地交換數(shù)據(jù)。

更值得稱道的是,華為選擇開放靈衢2.0的技術(shù)規(guī)范,邀請產(chǎn)業(yè)鏈伙伴共同參與生態(tài)建設(shè)。這意味著未來其他廠商也可以基于靈衢協(xié)議開發(fā)光模塊、交換芯片、網(wǎng)卡等相關(guān)產(chǎn)品,從而形成一個圍繞高速互聯(lián)的開放產(chǎn)業(yè)生態(tài)。

在當(dāng)前全球科技競爭加劇的背景下,華為的這一舉措顯示出戰(zhàn)略眼光:通過開放標(biāo)準(zhǔn)來壯大自身生態(tài),既可降低對外部技術(shù)的依賴,又能吸引更多合作伙伴,共同做大中國自主的AI基礎(chǔ)設(shè)施蛋糕。靈衢協(xié)議的推出和開放,有望逐步打破美國廠商在高端數(shù)據(jù)中心互聯(lián)領(lǐng)域的壟斷,為中國乃至全球的算力網(wǎng)絡(luò)提供一個新的選擇。

3

產(chǎn)業(yè)影響:

重塑AI算力版圖

華為此次發(fā)布的“超節(jié)點(diǎn)+集群”算力方案,在全球AI產(chǎn)業(yè)界引發(fā)了巨大震動,其影響將是多方面的:

長期以來,美國企業(yè)在AI芯片和算力基礎(chǔ)設(shè)施領(lǐng)域占據(jù)主導(dǎo)地位,英偉達(dá)的GPU幾乎成為AI訓(xùn)練的代名詞。然而,華為的Ascend昇騰芯片和Atlas超算方案正迅速崛起,打破了這一格局。憑借Atlas 950/960 SuperCluster所展示的算力實(shí)力,華為已經(jīng)站到了全球AI算力金字塔的頂端。這不僅提升了中國在全球AI競賽中的話語權(quán),也讓其他國家看到了除美國方案之外的另一種可能。

其次,它加速了中國AI產(chǎn)業(yè)的自主化進(jìn)程。在中美科技摩擦背景下,獲取最先進(jìn)的半導(dǎo)體工藝和芯片受到限制,這一度被認(rèn)為是中國AI發(fā)展的短板。然而華為通過“以規(guī)模補(bǔ)性能”的創(chuàng)新路徑,成功繞開了部分限制,用現(xiàn)有工藝實(shí)現(xiàn)了世界領(lǐng)先的算力水平。

這極大地提振了中國科技界的信心:即便在高端芯片制造上暫時落后,也可以通過系統(tǒng)創(chuàng)新和協(xié)同優(yōu)化來彌補(bǔ)差距。此次發(fā)布的超節(jié)點(diǎn)和集群,其核心部件(如昇騰芯片、鯤鵬CPU、靈衢互聯(lián)等)均為國產(chǎn)自主設(shè)計(jì),標(biāo)志著中國在AI基礎(chǔ)設(shè)施核心技術(shù)上的自主可控取得了重大進(jìn)展。這將進(jìn)一步帶動上下游產(chǎn)業(yè)鏈的發(fā)展,包括國產(chǎn)芯片制造、光通信器件、基礎(chǔ)軟件等領(lǐng)域,形成良性循環(huán)。

華為的方案在架構(gòu)上大膽創(chuàng)新,將原本用于超級計(jì)算機(jī)的大規(guī)模并行技術(shù)引入商用數(shù)據(jù)中心領(lǐng)域,開創(chuàng)了“超節(jié)點(diǎn)”這一新的基礎(chǔ)設(shè)施形態(tài)。這一創(chuàng)新可能引發(fā)行業(yè)的跟隨和模仿,促使更多廠商探索通過系統(tǒng)級架構(gòu)創(chuàng)新來提升算力的方法。例如,全光互聯(lián)、液冷高密度集成、軟硬件深度協(xié)同等技術(shù),未來有望在業(yè)界得到更廣泛的應(yīng)用。

未來展望:華為的算力雄心

面對此次發(fā)布的震撼成果,華為對未來充滿信心。徐直軍表示,依托全球最強(qiáng)算力的超節(jié)點(diǎn)和集群,華為有能力為人工智能的長期快速發(fā)展提供可持續(xù)且充裕的算力支持。

按照華為公布的Ascend昇騰芯片路線圖,其新一代AI芯片Ascend 950、960系列將在2026-2027年陸續(xù)推出,每代芯片的算力性能都將實(shí)現(xiàn)倍增。同時,華為計(jì)劃將Atlas超節(jié)點(diǎn)集群規(guī)模在2027年擴(kuò)展到百萬卡級別,屆時算力規(guī)模相比目前又將實(shí)現(xiàn)數(shù)量級的提升。可以想見,華為的算力版圖將隨著芯片迭代和集群擴(kuò)張而不斷壯大,持續(xù)鞏固其在AI算力領(lǐng)域的領(lǐng)先地位。

華為在發(fā)布會上也明確了自身的戰(zhàn)略定位:做智能世界的“黑土地”,即專注于打造底層的算力基礎(chǔ)設(shè)施和平臺,讓各行各業(yè)的AI應(yīng)用在上面生根發(fā)芽。這意味著華為未來將更加開放合作,聯(lián)合產(chǎn)業(yè)伙伴共同繁榮AI生態(tài)。

例如,通過“靈衢”開放生態(tài),華為希望吸引更多廠商參與高速互聯(lián)技術(shù)的研發(fā);通過MindSpore開源AI框架和ModelArts平臺,華為正打造從芯片、框架到應(yīng)用的全棧開放生態(tài)。在可預(yù)見的未來,華為將繼續(xù)加大研發(fā)投入(2024年研發(fā)投入達(dá)1797億元人民幣,占收入20.8%),在先進(jìn)芯片設(shè)計(jì)、新型計(jì)算架構(gòu)、基礎(chǔ)軟件等方面持續(xù)攻關(guān),以保持技術(shù)領(lǐng)先優(yōu)勢。

分享到

lixiangjing

算力豹主編

相關(guān)推薦