H3C UniCube DeepSeek大模型一體機(jī)
產(chǎn)品規(guī)格與型號(hào)
中科曙光
2月14日,曙光云推出的全國(guó)產(chǎn)DeepSeek大模型超融合一體機(jī),主要應(yīng)用場(chǎng)景為政務(wù)云、企業(yè)數(shù)據(jù)中心還有多行業(yè)適配。產(chǎn)品亮點(diǎn)第一個(gè)我們就能關(guān)注到的——全國(guó)產(chǎn)化。這款一體機(jī)采用了國(guó)產(chǎn)X86 CPU和國(guó)產(chǎn)GPGPU加速卡,支持全精度和半精度混合訓(xùn)練與推理,這樣能有更高的計(jì)算性?xún)r(jià)比。
另外一體機(jī)全面適配DeepSeek系列模型(如V3、R1、Janus Pro),并支持全系列量化蒸餾版本,同時(shí)兼容QWen2.5、LLama3.2、ChatGLM等主流大模型。而且內(nèi)置文心雕龍智能化應(yīng)用,通過(guò)快速問(wèn)答和知識(shí)庫(kù)管理,幫助企業(yè)高效處理信息,提升運(yùn)營(yíng)效率。
寧暢
2月14日,寧暢發(fā)布DeepSeek大模型一體機(jī)解決方案。DeepSeek 大模型一體機(jī)解決方案從底層技術(shù)到業(yè)務(wù)場(chǎng)景深度優(yōu)化。除了易部署,這些不同版本還集成了多款行業(yè)知識(shí)庫(kù)與模板,并且通過(guò)內(nèi)置資源監(jiān)控與自?xún)?yōu)化算法,算力利用率可提升至85%,大幅降低總擁有成本,幫助企業(yè)實(shí)現(xiàn)高效、低成本的運(yùn)維管理。
DeepSeek 大模型一體機(jī)解決方案產(chǎn)品矩陣
華為
2月13日,華為對(duì)外推出昇騰DeepSeek一體機(jī),深度融合昇騰高性能算力底座與DeepSeek全系列大模型能力,覆蓋語(yǔ)言理解、圖像分析、知識(shí)推理等全場(chǎng)景需求。以DeepSeek-R1-Distill-Llama-70B為例,其系統(tǒng)每秒吞吐量可達(dá)3300 Tokens,輕松應(yīng)對(duì)海量文本分析和復(fù)雜業(yè)務(wù)場(chǎng)景模擬。
一體機(jī)還支持低至50ms的每用戶(hù)時(shí)延,就是哪怕很多人同時(shí)用,系統(tǒng)對(duì)每個(gè)用戶(hù)的時(shí)延也控制在50ms以?xún)?nèi)(簡(jiǎn)單來(lái)說(shuō)就是打游戲不卡的程度),可以提升個(gè)人辦公效率。以DeepSeek V3/R1滿(mǎn)血版為例,能支持高達(dá)192個(gè)用戶(hù)的并發(fā),滿(mǎn)足大型企業(yè)多部門(mén)協(xié)同工作的需求。
一體機(jī)采用華為Atlas800l A2推理服務(wù)器,搭載鯤鵬920+昇騰AI處理器,支持全精度和半精度混合訓(xùn)練與推理?;旌贤评砀锕馓岬降狞c(diǎn)相同,就是回答你的問(wèn)題,簡(jiǎn)單的要求能快速批量處理(半精度),復(fù)雜的精密任務(wù)就會(huì)更注重細(xì)節(jié)(全精度)。
截止2月12日,已有13家伙伴基于昇騰產(chǎn)品打造自有DeepSeek一體機(jī)產(chǎn)品。
宏杉科技
2月13日,宏杉科技對(duì)外推出基于DeepSeek的大模型一體機(jī)解決方案。宏杉科技DeepSeek一體機(jī)解決方案除了易部署,還提到了靈活擴(kuò)展性,能滿(mǎn)足私有化部署對(duì)海量數(shù)據(jù)存儲(chǔ)的需求。同時(shí),內(nèi)置多種數(shù)據(jù)保護(hù)模式,并可根據(jù)數(shù)據(jù)訪(fǎng)問(wèn)級(jí)別配置性?xún)r(jià)比更高的存儲(chǔ)介質(zhì)。
宏杉科技還內(nèi)置了自研功能組件,可無(wú)縫對(duì)接各類(lèi)型生產(chǎn)系統(tǒng),實(shí)現(xiàn)數(shù)據(jù)自由流轉(zhuǎn)。同時(shí),搭載智能AI文檔庫(kù)產(chǎn)品,支持知識(shí)協(xié)作共享和跨領(lǐng)域多模態(tài)檢索,提升企業(yè)數(shù)據(jù)管理效率。
聯(lián)想集團(tuán)
2月初,聯(lián)想集團(tuán)與國(guó)產(chǎn)GPU企業(yè)沐曦股份聯(lián)合發(fā)布了基于DeepSeek大模型的首個(gè)國(guó)產(chǎn)一體機(jī)解決方案。方案以“聯(lián)想服務(wù)器/工作站+沐曦訓(xùn)推一體國(guó)產(chǎn)GPU+自主算法”為核心架構(gòu),配合聯(lián)想AI Force智能體開(kāi)發(fā)平臺(tái),推出智能體一體機(jī)與訓(xùn)推一體服務(wù)器雙產(chǎn)品形態(tài)。
聯(lián)想創(chuàng)新性推出兩大產(chǎn)品:面向敏捷部署的DeepSeek智能體一體機(jī)采用ThinkStation PX工作站為載體,搭載沐曦曦思N260國(guó)產(chǎn)GPU。實(shí)測(cè)數(shù)據(jù)顯示,在相同并發(fā)條件下,沐曦曦思N260國(guó)產(chǎn)GPU在Qwen2.5-14B模型推理實(shí)測(cè)性能達(dá)到NVIDIA L20 GPU的110%-130%,可支持本地部署DeepSeek各種參數(shù)蒸餾模型推理。而面向更廣泛場(chǎng)景的DeepSeek訓(xùn)推一體機(jī)則基于聯(lián)想問(wèn)天WA5480 G3 AI服務(wù)器,搭載8張曦云C500國(guó)產(chǎn)GPU,可為大模型訓(xùn)練和推理提供強(qiáng)大的算力支撐。
基于聯(lián)想ThinkStation PX的智能體一體機(jī)
基于聯(lián)想問(wèn)天WA5480 G3 AI服務(wù)器的訓(xùn)推一體機(jī)
浪潮
2月7日,浪潮云聯(lián)合沐曦股份、銓興科技等生態(tài)伙伴,對(duì)外發(fā)布了預(yù)置DeepSeek-R1和DeepSeek-V3模型的海若一體機(jī),實(shí)現(xiàn)671B DeepSeek大模型國(guó)產(chǎn)GPU單機(jī)推理服務(wù)。同樣是開(kāi)箱即用,部署時(shí)間1-3天。大模型推理性能有大幅提升,解碼生成速度提升185.7%,平均首字時(shí)延降低55.9%。
開(kāi)放兼容性高,支持浪潮海若、DeepSeek、GPT-4、通義千問(wèn)等主流大模型;支持EmBedding、ReRanker、ASR、TTS多類(lèi)型;內(nèi)置模型池適配沐曦、昇騰等多種芯片。規(guī)格也有版本之分,有啟航版、進(jìn)階版、旗艦版等多種規(guī)格,可根據(jù)模型參數(shù)和應(yīng)用規(guī)模靈活選擇。
海若一體機(jī)產(chǎn)品能力全景圖
銓興科技
2月18日,銓興科技對(duì)外發(fā)布DeepSeek R1 671B 超顯存融合訓(xùn)推一體機(jī)系列。包括三個(gè)版本:
671B 推理一體機(jī)入門(mén)版:價(jià)格 9.8W 起,支持 DeepSeek R1 671B 模型部署,強(qiáng)調(diào)極致性?xún)r(jià)比,輸出最高可達(dá) 12TPS。
671B 推理一體機(jī)滿(mǎn)血版:被稱(chēng)為 “性能機(jī)皇”,支持 DeepSeek R1 671B 滿(mǎn)血版模型部署,超顯存融合賦能高效推理,配置為 RTX5880 ada 48GB x10、Intel 4410Y x 2、512GB DRAM。
671B 滿(mǎn)血版訓(xùn)推一體機(jī):成本再降 95%,助力國(guó)產(chǎn)模型訓(xùn)練,支持 DeepSeek R1 671B 滿(mǎn)血版本地訓(xùn)練,采用雙節(jié)點(diǎn)配置,每節(jié)點(diǎn)含 RTX5880 ada 48GB x 8、Intel 4410Y x 2、2TB DRAM、400Gb 網(wǎng)卡、AI Cache Pro 2TB x 4 。
超聚變
2月17日,超聚變對(duì)外發(fā)布deepseek大型一體機(jī)。其優(yōu)勢(shì)在于開(kāi)箱即用,分鐘級(jí)交付。擁有一站式工具鏈,兼容主流模型,提供專(zhuān)業(yè)服務(wù);多元算力融合,AI 資源可視可管,算力共享等。
產(chǎn)品規(guī)格包括:
輕量版:適用于低成本、低時(shí)延推理,如文本生成、簡(jiǎn)單問(wèn)答,支持 1.5B – 14B 模型。
標(biāo)準(zhǔn)版:平衡成本與性能,適用于代碼輔助、學(xué)術(shù)研究等,支持 32B – 70B 模型。
旗艦版:面向高性能推理,如尖端科研、商業(yè)決策,支持 671B 滿(mǎn)血模型。
紫光云
紫光云公司推出的是紫鸞大模型一體機(jī),已經(jīng)全系優(yōu)化適配并預(yù)制DeepSeek R1系列推理模型,支持英偉達(dá)、天數(shù)、昆侖芯、燧原科技等異構(gòu)芯片的統(tǒng)一調(diào)度。通過(guò)一體化開(kāi)箱即用私域部署,紫鸞大模型實(shí)現(xiàn)了DeepSeek的部署,為政企用戶(hù)提供高性?xún)r(jià)比的生產(chǎn)級(jí)AI解決方案。
京東云
2月8日,京東云對(duì)外發(fā)布DeepSeek大模型一體機(jī),基于“本地化開(kāi)箱即用”的理念,提供從底層算力、模型服務(wù)、推理能力、應(yīng)用開(kāi)發(fā)的全棧解決方案,支持華為昇騰、海光、寒武紀(jì)、摩爾線(xiàn)程、天數(shù)智芯等國(guó)產(chǎn)AI加速芯片,在滿(mǎn)足自主可控的同時(shí),降低算力投資成本,主要面向金融、政府及企業(yè)用戶(hù)。
昆侖技術(shù)+中科加禾
2月18日,昆侖技術(shù)與中科加禾攜手推出的DeepSeek本地化部署一體機(jī),產(chǎn)品基于昆侖技術(shù)的KunLun AI服務(wù)器算力和中科加禾的SigInfer模型推理引擎,提供穩(wěn)定可靠的生產(chǎn)級(jí)DeepSeek-R1和V3服務(wù)。這個(gè)要簡(jiǎn)單說(shuō)兩句,河南昆侖技術(shù)有限公司成立于2022年10月,核心團(tuán)隊(duì)來(lái)自鯤鵬與昇騰的原班人馬,是一家專(zhuān)注于算力基礎(chǔ)設(shè)施與服務(wù)的高科技企業(yè)。中科加禾的 SigInfer 模型推理引擎可以理解為是一個(gè)非常聰明的 “大腦助手”。它主要做的事情就是幫助各種人工智能模型快速、準(zhǔn)確地 “理解” 和處理數(shù)據(jù),然后給出相應(yīng)的結(jié)果或判斷。這個(gè)是昨天才發(fā)布的,但是兩家公司一個(gè)背靠華為一個(gè)背靠中科院,產(chǎn)品應(yīng)該不會(huì)差,這里先備注一下。
產(chǎn)品優(yōu)勢(shì)生態(tài)兼容:全面兼容昇騰生態(tài),滿(mǎn)足本地化部署需求。
靈活配置:2節(jié)點(diǎn)起配,支持64并發(fā),可按需線(xiàn)性擴(kuò)容。
性能定制:高性能推理引擎,支持靈活定制以實(shí)現(xiàn)領(lǐng)先推理性能。
開(kāi)發(fā)加速:集成 AI Space 開(kāi)發(fā)平臺(tái),加速 AI 場(chǎng)景化持續(xù)創(chuàng)新。
技術(shù)支持:超100人的 FAE 團(tuán)隊(duì)提供安裝部署及調(diào)優(yōu)技術(shù)支持。