大模型混合云持續(xù)進(jìn)化,深耕政企以卓越賦能卓越
當(dāng)前,技術(shù)變革日新月異,大模型以其獨(dú)特的技術(shù)與應(yīng)用優(yōu)勢,已成為推動各行業(yè)智能化轉(zhuǎn)型的核心引擎。然而在邁向智能化的征程中,政企仍面臨著諸多挑戰(zhàn)。徐強(qiáng)指出,一方面,政企存在大量敏感數(shù)據(jù)需要妥善保護(hù),“數(shù)據(jù)不出域”成為剛性要求;另一方面,構(gòu)建和運(yùn)行大模型所需的龐大算力與高昂成本,讓許多企業(yè)望而卻步。同時,不同行業(yè)的業(yè)務(wù)場景千差萬別,如何定制化打造貼合自身需求的智能應(yīng)用,也是擺在政企面前的一道難題。
基于此,華為云Stack打造大模型混合云方案,通過堅實算力底座、使能百模千態(tài)、賦能千行萬業(yè)三大能力,幫助企業(yè)一站式建設(shè)自己的專屬大模型,加速邁向智能化。
去年6月,華為云Stack發(fā)布大模型混合云十大創(chuàng)新技術(shù),迭代基礎(chǔ)設(shè)施、算法架構(gòu)和工程能力多維度根技術(shù),讓AI技術(shù)不難用;同時定義了AI平臺標(biāo)準(zhǔn)化的8大能力板塊,支撐百模千態(tài)和多樣化的開發(fā)場景,讓AI創(chuàng)新變簡單;9月,華為云Stack面向5大行業(yè)發(fā)布80+場景地圖,幫助客戶快速訓(xùn)好模型,讓AI落地更高效。
技術(shù)躍遷,激發(fā)智能應(yīng)用創(chuàng)新,推理需求爆發(fā)式增長
今年以來,以 DeepSeek、Qwen3為代表的新一代大模型加速涌現(xiàn),推動AI產(chǎn)業(yè)在多個維度發(fā)生深度變革。
首先,MoE架構(gòu)興起,逐步打破大模型性能、成本與易用性的“不可能三角”,在實現(xiàn)高效推理的同時降低了使用門檻,使AI技術(shù)真正走向普惠化。
其次,CoT(思維鏈)將Scaling Law從訓(xùn)練階段延伸到推理階段,在訓(xùn)練算力保持相對穩(wěn)定的情況下,將催生新的算力需求,同時還讓模型推理過程打破黑箱,更具可解釋性,加速AI在企業(yè)核心業(yè)務(wù)場景的落地。
第三,模型訓(xùn)練的范式也不斷演進(jìn),從單一的預(yù)測學(xué)習(xí)向強(qiáng)化學(xué)習(xí)遷移,從預(yù)訓(xùn)練逐步走向后訓(xùn)練,使模型對齊人類偏好,更具“個性化適配能力”。
第四,AI的應(yīng)用生態(tài)逐漸轉(zhuǎn)向開源,產(chǎn)業(yè)創(chuàng)新的重心從封閉的模型本體轉(zhuǎn)向業(yè)務(wù)驅(qū)動的應(yīng)用創(chuàng)新,推動AI從“技術(shù)突破”邁向“價值創(chuàng)造”。
在這樣技術(shù)變革和推理需求快速增長的背景下,算力底座和調(diào)度面臨新挑戰(zhàn)。需要軟硬件系統(tǒng)級協(xié)同優(yōu)化,結(jié)合模型架構(gòu)實現(xiàn)分布式彈性調(diào)度;通過PD分離實現(xiàn)資源解耦;以訓(xùn)推一體提升資源利用率,滿足系統(tǒng)低時延、高吞吐,全面提升推理效率。
同時,AI開發(fā)的工具鏈也亟待適配全新的后訓(xùn)練所需要的一站式數(shù)據(jù)、模型和應(yīng)用開發(fā)能力,并能與開源生態(tài)無縫對接,提升AI應(yīng)用的開發(fā)效率與落地速度。
大模型混合云煥新升級,打造政企更優(yōu)AI平臺
迎接推理時代挑戰(zhàn),華為云Stack大模型混合云全面煥新升級6大能力,通過極致推理和精細(xì)化的運(yùn)營運(yùn)維實現(xiàn)大規(guī)模算力高效調(diào)度和管理,提供一站式模型后訓(xùn)練和Agent開發(fā)工具加速模型天級調(diào)優(yōu)、分鐘級部署和應(yīng)用,并預(yù)置政企專屬行業(yè)使能套件和全流程專業(yè)服務(wù),全方位加速智能應(yīng)用規(guī)模落地,加速AI場景價值閉環(huán)。
在極致推理方面,華為云Stack致力于推動平臺軟件與算力硬件的深度適配,打造大規(guī)模集群“算力省”“上線快”“體驗好”的極致推理服務(wù)。針對資源錯峰復(fù)用場景,利用訓(xùn)推共池技術(shù),算力閑置時長可下降50%;極致彈性伸縮場景下,借助推理部署加速技術(shù),推理服務(wù)5分鐘即可上線;而在規(guī)模并行推理場景,應(yīng)用大規(guī)模專家并行推理與PD分離技術(shù),優(yōu)異的吞吐與時延特性支持達(dá)成99%+SLO推理體驗指標(biāo)。
在精細(xì)化運(yùn)營方面,華為云Stack首創(chuàng)行業(yè)標(biāo)準(zhǔn)化AI算力度量指標(biāo)體系,提供40+算力度量指標(biāo)和120+全棧資源性能指標(biāo),可以管理萬卡AI算力集群,同時支持客戶CXO評估算力使用價值和投入產(chǎn)出比、運(yùn)維人員分鐘級快速定界故障,以及運(yùn)營人員實現(xiàn)安全合規(guī)的算力全生命周期管控,讓算力管理更高效、更可靠。
在模型后訓(xùn)練方面,面向數(shù)據(jù)和模型開發(fā)工程師,華為云Stack構(gòu)建了一站式的后訓(xùn)練工具鏈,覆蓋數(shù)據(jù)、訓(xùn)練和評測階段,幫助企業(yè)打造專屬深度思考模型。
在Agent開發(fā)方面,面向應(yīng)用落地最后一公里,華為云Stack提供Agent開發(fā)平臺,具備一站式知識中心、多智能體協(xié)作和低門檻開發(fā)多重優(yōu)勢,讓企業(yè)智能應(yīng)用開發(fā)像搭積木一樣簡單。
在行業(yè)使能套件方面,基于華為深入行業(yè)的實踐積累,華為云Stack圍繞7大行業(yè)沉淀了40+開箱即用的Agent模板,助力業(yè)務(wù)分鐘級上線;同時提供工業(yè)AI引擎,聚焦視覺質(zhì)檢、工藝優(yōu)化、預(yù)測性維護(hù)和生產(chǎn)計劃4大核心領(lǐng)域打造了18個場景化工作流,使能政企更快速、更精準(zhǔn)地應(yīng)對復(fù)雜工業(yè)場景的挑戰(zhàn)。
在專業(yè)服務(wù)方面,面向模型供數(shù)、模型開發(fā)、到模型應(yīng)用全流程需求,華為云Stack提供7大類30多項專業(yè)服務(wù)、自研AI工具鏈以及在實際交付項目中沉淀的服務(wù)經(jīng)驗,助力政企加快各行業(yè)場景大模型應(yīng)用的創(chuàng)新和迭代,讓大模型從可用到好用。
政企AI平臺參考架構(gòu)發(fā)布,為智能化提供路徑指引
一直以來,華為云攜手政企行業(yè)客戶,探索業(yè)務(wù)和技術(shù)的前沿,并深入生產(chǎn)一線與客戶聯(lián)合創(chuàng)新,幫助行業(yè)“解難題、做難事”,持續(xù)賦能政企智能升級。截至目前,華為云Stack已服務(wù)全球超5500個客戶,在政府、金融、央國企等行業(yè)市場份額領(lǐng)先。
基于金融、制造、政務(wù)、能源等行業(yè)豐富實踐沉淀,華為云重磅發(fā)布《政企AI平臺架構(gòu)及應(yīng)用實踐》白皮書,提出政企AI平臺參考架構(gòu),從底層到上層形成了一套完整且科學(xué)的體系。徐強(qiáng)介紹,該參考架構(gòu)底層是堅實的基礎(chǔ)設(shè)施,涵蓋了強(qiáng)大的云計算資源以及適配不同場景的邊緣計算節(jié)點(diǎn),為整個平臺提供穩(wěn)定的AI-Native算力基礎(chǔ);中間是AI平臺層,提供先進(jìn)的工具和專業(yè)服務(wù),支持從數(shù)據(jù)預(yù)處理、模型訓(xùn)練、評估到應(yīng)用的全流程操作;最上層是行業(yè)場景,通過華為云沉淀的豐富的模板和資產(chǎn)套件,確保AI能夠快速落地到政企業(yè)務(wù)系統(tǒng)中。
政企AI平臺參考架構(gòu)旨在為行業(yè)發(fā)展提供一個標(biāo)準(zhǔn)化、規(guī)范化的框架,幫助政企客戶更清晰地規(guī)劃自身AI平臺建設(shè)路徑,降低建設(shè)成本與技術(shù)門檻,在國家“人工智能+”重大專項行動帶來的發(fā)展機(jī)遇中,實現(xiàn)業(yè)務(wù)的創(chuàng)新突破與高質(zhì)量發(fā)展。
徐強(qiáng)在最后表示:“未來,大模型混合云將持續(xù)進(jìn)化,不斷拓展邊界,與政企用戶攜手共進(jìn),共赴智能應(yīng)用時代的星辰大海?!?/p>