但大模型產(chǎn)業(yè)的井噴,給算力行業(yè)帶來新的難題——智能算力出現(xiàn)供給短缺。

摩爾線程副總裁、產(chǎn)品事業(yè)部總經(jīng)理董龍飛認(rèn)為,國產(chǎn)大模型應(yīng)用呈現(xiàn)出“千模大戰(zhàn)”的狀態(tài),使得智能算力出現(xiàn)“一卡難求”的局面,當(dāng)下,如何“強(qiáng)化頂層設(shè)計,提升算力綜合供給能力”已經(jīng)成為行業(yè)的核心命題。

新建+改造,突破智能算力供需瓶頸

為了應(yīng)對日益增長的智能算力需求,2023年5月發(fā)布的《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》提到,將新增算力建設(shè)項目納入算力伙伴計劃,加快推動海淀區(qū)建設(shè)北京人工智能公共算力中心、朝陽區(qū)建設(shè)北京數(shù)字經(jīng)濟(jì)算力中心,形成規(guī)?;冗M(jìn)算力供給能力。

其中,北京數(shù)字經(jīng)濟(jì)算力中心由北京電子控股有限責(zé)任公司旗下的提供規(guī)?;冗M(jìn)智算算力、AI云及AI轉(zhuǎn)型服務(wù)的科技企業(yè)北電數(shù)智承建,已經(jīng)在朝陽區(qū)酒仙橋核心地帶開工建設(shè),預(yù)計2024年落成達(dá)產(chǎn),一期實現(xiàn)多元異構(gòu)的1000P智能算力供給。建成后的北京數(shù)字經(jīng)濟(jì)算力中心,還將以“開放、人本、普惠”的創(chuàng)新理念,建設(shè)算力生態(tài)聯(lián)合實驗室,打造酒仙橋地區(qū)的算力科技新高地。

“面對技術(shù)、產(chǎn)業(yè)、應(yīng)用等方面的挑戰(zhàn),進(jìn)一步調(diào)優(yōu)算力結(jié)構(gòu)、加大智算中心的建設(shè)比例,把算力聚集進(jìn)一步轉(zhuǎn)化為產(chǎn)業(yè)聚集,成為滿足行業(yè)算力需求、賦能數(shù)字經(jīng)濟(jì)發(fā)展的重要途徑。”

—— 李子威 紫光股份旗下新華三集團(tuán)副總裁

然而,單靠新建算力還難以解決供需不平衡的狀況,改造升級老舊小散數(shù)據(jù)中心成了另一個“解題思路”。

“AI全面爆發(fā)對基礎(chǔ)設(shè)施的消耗達(dá)到絕無僅有的狀態(tài),也讓傳統(tǒng)數(shù)據(jù)中心面臨嚴(yán)峻的考驗與深層次的變革?!?/strong>荊磊表示。

在北電數(shù)智看來,傳統(tǒng)數(shù)據(jù)中心經(jīng)過改造后將會煥發(fā)新的價值——不只是對陳舊的軟硬件設(shè)備進(jìn)行更新和升級,降低能耗,還要增加智能算力的生產(chǎn)和供給,幫助傳統(tǒng)數(shù)據(jù)中心打開新的增長點(diǎn)。

例如,北電數(shù)智與世紀(jì)互聯(lián)合作,通過賦能傳統(tǒng)數(shù)據(jù)中心升級發(fā)展,構(gòu)筑了堅實的智能算力底座,不僅可以滿足大模型時代AI服務(wù)器的高功率需求,還可以大幅提高算力效率,滿足人工智能新業(yè)態(tài)對智能計算的新需求。世紀(jì)互聯(lián)相關(guān)負(fù)責(zé)人表示,作為在數(shù)據(jù)中心領(lǐng)域深耕多年的大型企業(yè),雙方共同建設(shè)最符合目前市場需求的算力基礎(chǔ)設(shè)施,具有重要的典型示范作用,以智算中心構(gòu)建智能計算新生態(tài),將有效助力北京打造具有國際影響力的通用人工智能大模型創(chuàng)新發(fā)展高地

此外,針對算力單點(diǎn)存在性能極限,北電數(shù)智還會把這些分散的多元算力互聯(lián)成網(wǎng),統(tǒng)一納管,搭建出符合AI產(chǎn)業(yè)需要的“新形態(tài)”大規(guī)模智能算力集群,靈活便捷地支持各行各業(yè)對智能算力的需求。

建好生態(tài),彌補(bǔ)算力性能差距

通過生態(tài)系統(tǒng),提升算力性能是解決算力供給不足難題的另一條路徑。

中國工程院院士、清華大學(xué)計算機(jī)系教授鄭緯民表示,國內(nèi)因起步較晚,自研的芯片在性能上仍稍顯不足。但性能上的差距可以在生態(tài)上得到彌補(bǔ)。所謂好的生態(tài)就是讓芯片用起來不費(fèi)勁,建立這樣的生態(tài),并讓市場接受,需要一個過程。

“國產(chǎn)生態(tài)只要解決好編程框架、并行加速、調(diào)度器、內(nèi)存分配系統(tǒng)、容錯系統(tǒng)、存儲系統(tǒng)等問題,即使性能不足,國產(chǎn)芯片也會大受歡迎?!?/p>

—— 鄭緯民 中國工程院院士、清華大學(xué)計算機(jī)系教授

不僅如此,在荊磊看來,軟件和硬件協(xié)同優(yōu)化的問題同樣刻不容緩。硬件為軟件提供了一個運(yùn)行的環(huán)境和基礎(chǔ),而軟件則通過調(diào)用和利用硬件資源來實現(xiàn)特定的功能。“目前行業(yè)的現(xiàn)實情況是,大家手里拿到的硬件都是一樣的,但各家提升硬件性能的效率是不一樣的?!?/strong>

然而,軟件與硬件的協(xié)同優(yōu)化很難由一家廠商獨(dú)立完成,需要更多廠商來共同參與,深度協(xié)同。

“以GPU為主的人工智能芯片是人工智能產(chǎn)業(yè)生態(tài)建設(shè)的核心基礎(chǔ),也是驅(qū)動AI產(chǎn)業(yè)發(fā)展的加速器。但是,光有硬件還不夠,如何做好軟硬協(xié)同才是驅(qū)動AI應(yīng)用的重要法寶。國產(chǎn)GPU/AI芯片企業(yè)在努力提升產(chǎn)品性能的同時,更需關(guān)注GPU生態(tài)的建設(shè)和完善。”

—— 董龍飛 摩爾線程副總裁產(chǎn)品事業(yè)部總經(jīng)理

據(jù)了解,北電數(shù)智已經(jīng)聯(lián)合AI產(chǎn)業(yè)生態(tài)上下游的多家企業(yè),涵蓋國內(nèi)外芯片、服務(wù)器、大模型、人工智能、應(yīng)用創(chuàng)新、產(chǎn)業(yè)投資等多個領(lǐng)域,期望以實踐推動AI技術(shù)應(yīng)用和迭代升級,推動產(chǎn)業(yè)進(jìn)步繁榮?!疚淖謥碓?北京日報】