單卡集成112G以上超大顯存、FP32單精度浮點(diǎn)算力飆至78TFLOPS,更是國(guó)內(nèi)首款把國(guó)產(chǎn)RISC-V(一種開(kāi)放指令集架構(gòu))CPU和兼容CUDA的GPU集成在一起的芯片。要知道,這可不是簡(jiǎn)單的參數(shù)升級(jí),而是國(guó)產(chǎn)GPU陣營(yíng)里,一位重量級(jí)選手的正式 “亮劍”。

對(duì)芯動(dòng)科技來(lái)說(shuō),這是一次里程碑式的技術(shù)躍遷;放到全球半導(dǎo)體產(chǎn)業(yè)風(fēng)云變幻的大背景下,更是中國(guó)芯片自主化道路上,一個(gè)足以載入史冊(cè)的關(guān)鍵節(jié)點(diǎn)。

文字編輯|宋雨涵

1

解構(gòu)“風(fēng)華3號(hào)”:

不止于算力的“全功能”雄心

“風(fēng)華3號(hào)”最引人注目的標(biāo)簽是“全功能GPU”。在服務(wù)器領(lǐng)域,許多所謂的GPU實(shí)際上是GPGPU(通用計(jì)算圖形處理器),它們?yōu)榱藰O致的計(jì)算效率,閹割了圖形渲染和顯示輸出功能。而“風(fēng)華3號(hào)”反其道而行之,堅(jiān)持“大而全”,這意味著它在架構(gòu)設(shè)計(jì)上需要克服遠(yuǎn)超GPGPU的復(fù)雜性。讓我們深入其六大亮點(diǎn),探尋其“全功能”背后的技術(shù)底氣與市場(chǎng)野心。

“風(fēng)華3號(hào)”六大核心亮點(diǎn)

國(guó)內(nèi)首款:集成國(guó)產(chǎn)RISC-V CPU與CUDA兼容GPU的SoC。

全球首款:原生支持DICOM高精度灰階顯示的GPU。

國(guó)內(nèi)首款:?jiǎn)慰ㄅ鋫?12GB+大顯存、核心IP全自研的全功能GPU。

國(guó)內(nèi)首款:支持光線追蹤的8K渲染GPU。

國(guó)內(nèi)首款:支持YUV444無(wú)損視頻編碼的GPU。

生態(tài)整合:打通“計(jì)算+存儲(chǔ)+連接”,構(gòu)建完整國(guó)產(chǎn)GPU生態(tài)。

一、算力巨獸:AI大模型的國(guó)產(chǎn)新引擎

在AI大模型時(shí)代,算力和顯存是衡量一枚GPU價(jià)值的核心標(biāo)尺。“風(fēng)華3號(hào)”交出的答卷堪稱驚艷:

78 TFLOPS的FP32算力:這一數(shù)字使其穩(wěn)穩(wěn)地站在了高性能計(jì)算的第一梯隊(duì)。它足以支撐大規(guī)模的AI模型訓(xùn)練、復(fù)雜的科學(xué)計(jì)算以及高精度的物理模擬。

112GB+的高帶寬顯存:這是“風(fēng)華3號(hào)”最具沖擊力的特性。相比之下,國(guó)際主流的AI訓(xùn)練芯片如英偉達(dá)H100的顯存為80GB。更大的顯存意味著單卡能夠容納更大參數(shù)的模型,從而顯著減少在模型并行訓(xùn)練中跨節(jié)點(diǎn)通信的開(kāi)銷,提升訓(xùn)練效率。發(fā)布會(huì)信息顯示,單張“風(fēng)華3號(hào)”即可運(yùn)行320億或720億參數(shù)的大模型,而一臺(tái)搭載八張卡的服務(wù)器,理論上可以直接驅(qū)動(dòng)像DeepSeek 671B/685B這樣的千億級(jí)巨型模型。這對(duì)于國(guó)內(nèi)眾多渴望擁有自主可控大模型算力底座的企業(yè)和研究機(jī)構(gòu)而言,無(wú)疑是巨大的福音。

兼容CUDA生態(tài):這是其最具戰(zhàn)略智慧的一步。CUDA作為英偉達(dá)建立的、事實(shí)上的行業(yè)標(biāo)準(zhǔn),擁有龐大的開(kāi)發(fā)者基礎(chǔ)和成熟的軟件庫(kù)。通過(guò)兼容CUDA,芯動(dòng)科技極大地降低了開(kāi)發(fā)者的遷移成本,使得現(xiàn)有的AI應(yīng)用可以更平滑地移植到“風(fēng)華3號(hào)”平臺(tái)。結(jié)合其對(duì)PyTorch、Triton等主流AI框架的支持,它正在努力將自己從一個(gè)“硬件孤島”變?yōu)橐粋€(gè)能夠融入全球主流AI生態(tài)的“即戰(zhàn)力”。

二、視覺(jué)革命:從8K光追到專業(yè)醫(yī)學(xué)影像

“很多用于服務(wù)器的GPU,其實(shí)是GPGPU,閹割了圖形和顯示功能。而全功能GPU,計(jì)算、圖形渲染、視頻編解碼、多屏顯示這些活兒全都能干,架構(gòu)更復(fù)雜,門檻自然也更高?!薄帮L(fēng)華3號(hào)”不僅能干,而且干得相當(dāng)出色:

支持8K分辨率下的實(shí)時(shí)光線追蹤,并兼容DirectX 12、OpenGL、Vulkan等主流圖形接口。這意味著它不僅能在CAD等工業(yè)設(shè)計(jì)軟件中提供國(guó)際主流水平的性能,甚至可以流暢運(yùn)行《古墓麗影》這類3A游戲大作。這展示了其強(qiáng)大的渲染管線和通用圖形處理能力。

全球首款原生支持DICOM,這是其切入高價(jià)值垂直行業(yè)的“神來(lái)之筆”。DICOM是醫(yī)學(xué)數(shù)字成像和通信的國(guó)際標(biāo)準(zhǔn)。傳統(tǒng)GPU在顯示灰階圖像時(shí)存在精度損失,“風(fēng)華3號(hào)”通過(guò)硬件原生支持,能夠?qū)崿F(xiàn)無(wú)損的高精度灰階顯示,為精準(zhǔn)醫(yī)療提供了強(qiáng)大的硬件基礎(chǔ)。這不僅是一個(gè)技術(shù)亮點(diǎn),更是開(kāi)辟了一個(gè)全新的、高壁壘的藍(lán)海市場(chǎng)。
強(qiáng)大的顯示與編碼能力,
單卡支持6路8K超高清顯示輸出,并率先支持YUV444無(wú)損視頻編碼。

三、架構(gòu)創(chuàng)新:RISC-V與自研IP的深層布局

在芯片的底層架構(gòu)上,“風(fēng)華3號(hào)”同樣展現(xiàn)了深遠(yuǎn)的戰(zhàn)略考量。國(guó)內(nèi)首次將國(guó)產(chǎn)RISC-V CPU與CUDA兼容GPU集成在同一芯片中,并強(qiáng)調(diào)核心IP全自研。

RISC-V作為一個(gè)開(kāi)放、免費(fèi)的指令集架構(gòu),被視為打破x86和ARM壟斷的希望。芯動(dòng)科技通過(guò)集成自研的RISC-V CPU,不僅可以在GPU內(nèi)部實(shí)現(xiàn)更高效的調(diào)度和管理。

生態(tài)建設(shè)的優(yōu)先級(jí)不亞于芯片研發(fā)。
?“風(fēng)華3號(hào)”對(duì)CUDA的兼容是明智且務(wù)實(shí)的選擇。在短期內(nèi),與其另起爐灶,不如先“借船出?!?,融入現(xiàn)有主流生態(tài),讓用戶“愿用、能用、好用”。長(zhǎng)期來(lái)看,則應(yīng)以RISC-V等開(kāi)放標(biāo)準(zhǔn)為基礎(chǔ),聯(lián)合國(guó)內(nèi)軟硬件廠商,逐步構(gòu)建我們自己的指令集標(biāo)準(zhǔn)和軟件生態(tài)。這是一個(gè)漫長(zhǎng)但必須堅(jiān)持的過(guò)程。

2

超越芯片本身:

芯動(dòng)科技的“計(jì)算+存儲(chǔ)+連接”生態(tài)棋局

如果說(shuō)“風(fēng)華3號(hào)”是一艘性能強(qiáng)悍的旗艦,那么芯動(dòng)科技在發(fā)布會(huì)上同時(shí)展示的高端DDR5內(nèi)存模組PCIe 5.0服務(wù)器交換芯片,則是為這艘旗艦保駕護(hù)航的整個(gè)艦隊(duì)。這揭示了芯動(dòng)科技更大的野心:它不只想做一家GPU芯片公司,更想成為一家數(shù)據(jù)中心核心部件的平臺(tái)型解決方案提供商。

這個(gè)“計(jì)算+存儲(chǔ)+連接”的鐵三角戰(zhàn)略,邏輯非常清晰:

通過(guò)將這三者垂直整合,芯動(dòng)科技能夠?yàn)榭蛻籼峁┮惶仔阅芙?jīng)過(guò)協(xié)同優(yōu)化、自主可控的“全家桶”方案。這種模式不僅能提升產(chǎn)品整體的競(jìng)爭(zhēng)力,更重要的是,它構(gòu)建了一個(gè)以自身為核心的硬件生態(tài)壁壘,這在未來(lái)的市場(chǎng)競(jìng)爭(zhēng)中將是極其寶貴的資產(chǎn)。

單點(diǎn)技術(shù)突破的時(shí)代正在過(guò)去,未來(lái)的競(jìng)爭(zhēng)是平臺(tái)的競(jìng)爭(zhēng)、生態(tài)的競(jìng)爭(zhēng)。芯動(dòng)科技“計(jì)算+存儲(chǔ)+連接”的布局,展現(xiàn)了這種平臺(tái)化思維。國(guó)產(chǎn)芯片企業(yè)需要跳出“賣芯片”的單一模式,向“提供解決方案”的平臺(tái)模式轉(zhuǎn)型,通過(guò)垂直整合和協(xié)同優(yōu)化,創(chuàng)造出1+1+1>3的價(jià)值。

結(jié)語(yǔ):

“風(fēng)華3號(hào)”的發(fā)布,無(wú)疑為國(guó)產(chǎn)GPU產(chǎn)業(yè)注入了一劑強(qiáng)心針。它用強(qiáng)大的性能、全面的功能和深遠(yuǎn)的布局,證明了中國(guó)芯片企業(yè)不僅有能力在局部市場(chǎng)實(shí)現(xiàn)追趕,更有潛力在全球性的技術(shù)浪潮中,發(fā)出自己的聲音,定義自己的賽道。

當(dāng)然,前路依然漫長(zhǎng)。從芯片流片成功到形成規(guī)?;袌?chǎng)應(yīng)用,從兼容生態(tài)到引領(lǐng)生態(tài),每一步都充滿挑戰(zhàn)。但“風(fēng)華”已起,我們有理由相信,這條國(guó)產(chǎn)GPU的自主化道路,正越走越寬,前方是值得期待的星辰大海。

分享到

lixiangjing

算力豹主編

相關(guān)推薦