騰訊云TI平臺(tái)支持的DeepSeek系列模型列表

DeepSeek模型性能優(yōu)異、廣受關(guān)注

DeepSeek近期在全球范圍內(nèi)廣受關(guān)注,其推理模型DeepSeek-R1發(fā)布即開源,在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1 正式版。

同時(shí),DeepSeek-R1 遵循 MIT License,允許用戶通過蒸餾技術(shù)借助 R1 訓(xùn)練其他模型。蒸餾模型DeepSeek-R1-Distill參數(shù)規(guī)模更小,推理成本更低,基準(zhǔn)測(cè)試同樣表現(xiàn)出色。

而12月發(fā)布的通用模型DeepSeek-V3在推理速度上相較歷史模型有了大幅提升。在目前大模型主流榜單中,DeepSeek-V3在開源模型中位列榜首,與當(dāng)前領(lǐng)域內(nèi)最先進(jìn)的閉源模型不分伯仲。

騰訊云TI平臺(tái)現(xiàn)已全面上架DeepSeek系列模型。用戶可進(jìn)入“TI平臺(tái)-大模型廣場(chǎng)”,點(diǎn)擊DeepSeek系列模型卡片,了解模型信息,進(jìn)行在線體驗(yàn)和一鍵部署。

騰訊云TI平臺(tái)支持DeepSeek系列模型,開發(fā)者可免費(fèi)體驗(yàn)、一鍵部署

在TI平臺(tái)免費(fèi)體驗(yàn)DeepSeek

騰訊云TI平臺(tái)限時(shí)免費(fèi)開放DeepSeek的在線體驗(yàn)功能,支持 DeepSeek-R1 和 DeepSeek-R1-Distill-Qwen-1.5B 兩款模型,便于開發(fā)者直觀比較“最大杯”和“最小杯”的性能差異。進(jìn)入DeepSeek系列模型頁面后,選擇上方Tab即可進(jìn)入在線對(duì)話體驗(yàn)頁面。

騰訊云TI平臺(tái)支持DeepSeek系列模型,開發(fā)者可免費(fèi)體驗(yàn)、一鍵部署

用戶還可以使用同一問題對(duì)上述兩款模型進(jìn)行簡單對(duì)比測(cè)試。比如提問:“在我的廚房里,有一張桌子,上面放著一個(gè)杯子,杯子里有一個(gè)球。我把杯子移到了臥室的床上,并將杯子倒過來。然后,我再次拿起杯子,移到了主房間?,F(xiàn)在,球在哪里?”

DeepSeek-R1-Distill-Qwen-1.5B 的回答:

騰訊云TI平臺(tái)支持DeepSeek系列模型,開發(fā)者可免費(fèi)體驗(yàn)、一鍵部署

DeepSeek-R1的回答:

騰訊云TI平臺(tái)支持DeepSeek系列模型,開發(fā)者可免費(fèi)體驗(yàn)、一鍵部署

從回答對(duì)比可以看出,擁有更大參數(shù)量的DeepSeek-R1模型在效果上更勝一籌,其正確推理出了杯子倒扣時(shí)球會(huì)掉出并留在臥室的床上,不會(huì)隨著杯子移動(dòng)至主房間。而參數(shù)量較小的DeepSeek-R1-Distill-Qwen-1.5B模型認(rèn)為球仍在原來的桌子中。

對(duì)于復(fù)雜任務(wù)而言,擁有更大參數(shù)量的R1模型會(huì)更有優(yōu)勢(shì),但推理成本也會(huì)更高。更小參數(shù)的R1-Distill系列模型,響應(yīng)速度更快,推理成本也會(huì)更低,在處理較為簡單的任務(wù)時(shí)仍是不錯(cuò)的選擇。

在TI平臺(tái)一鍵部署專屬DeepSeek推理服務(wù)

對(duì)于需要將DeepSeek接入AI應(yīng)用的開發(fā)者,TI平臺(tái)提供一鍵部署功能,可快速將DeepSeek發(fā)布為推理服務(wù)。進(jìn)入DeepSeek系列模型頁面后,選擇點(diǎn)擊上方的“新建在線服務(wù)”按鈕,將會(huì)自動(dòng)跳轉(zhuǎn)至“在線服務(wù)”模塊,發(fā)起模型部署。平臺(tái)支持多種計(jì)費(fèi)模式:

按量計(jì)費(fèi):對(duì)于僅需短時(shí)體驗(yàn)的用戶,可以直接從TIONE購買算力,并選用“按量計(jì)費(fèi)”模式;

包年包月:對(duì)于已購買CVM機(jī)器或需要長時(shí)間體驗(yàn)的用戶,推薦選用自有的CVM機(jī)器作為推理算力。

在算力配置方面,“滿血版”DeepSeek-R1總參數(shù)量高達(dá)671B,推薦使用騰訊云上的2臺(tái)8卡HCCPNV6機(jī)型進(jìn)行服務(wù)部署,以獲得穩(wěn)定業(yè)務(wù)體驗(yàn)。蒸餾后的DeepSeek-R1-Distill-Qwen-1.5B模型參數(shù)量為1.5B,單張中端GPU卡即可部署服務(wù)。開發(fā)者可根據(jù)業(yè)務(wù)復(fù)雜度選擇合適的模型進(jìn)行測(cè)試。

騰訊云TI平臺(tái)支持DeepSeek系列模型,開發(fā)者可免費(fèi)體驗(yàn)、一鍵部署

開發(fā)者在TI平臺(tái)完成模型部署后,可在線體驗(yàn)?zāi)P托Ч?,平臺(tái)也支持以調(diào)用API的方式接入AI應(yīng)用。

騰訊云TI平臺(tái)支持DeepSeek系列模型,開發(fā)者可免費(fèi)體驗(yàn)、一鍵部署

詳細(xì)部署和測(cè)試可參考TI平臺(tái)官網(wǎng)提供的實(shí)踐教程:

https://cloud.tencent.com/document/product/851/115962

TI平臺(tái)為大模型開發(fā)和運(yùn)營提供一站式服務(wù)

在部署服務(wù)之外,騰訊云TI平臺(tái)為用戶提供從數(shù)據(jù)處理、模型訓(xùn)練、模型評(píng)測(cè)到模型部署的全流程支持,內(nèi)置多種訓(xùn)練方式和算法框架,可以滿足不同 AI 應(yīng)用場(chǎng)景的需求。

在數(shù)據(jù)處理層面,騰訊云TI平臺(tái)沉淀了來自騰訊優(yōu)圖實(shí)驗(yàn)室的算法專家清洗大模型訓(xùn)練數(shù)據(jù)的優(yōu)質(zhì)Pipeline,支持開箱即用。TI平臺(tái)面向大語言模型和多模態(tài)大模型的標(biāo)注工具非常靈活,基于數(shù)據(jù)集 Schema,可完全自定義工作臺(tái),支持的大模型標(biāo)注場(chǎng)景涵蓋所有文生文、圖生文類的場(chǎng)景。

在精調(diào)訓(xùn)練階段,騰訊云TI平臺(tái)內(nèi)置了主流開源模型,用戶可以一鍵發(fā)起精調(diào)任務(wù)。通過硬件容錯(cuò)、容器調(diào)度、任務(wù)斷點(diǎn)續(xù)訓(xùn)的三層保障機(jī)制,平臺(tái)確保大規(guī)模訓(xùn)練任務(wù)的穩(wěn)定性。另外,借助騰訊自研的Angel加速機(jī)制,騰訊云TI平臺(tái)整體提升了訓(xùn)練性能30%,不僅加快了大模型的精調(diào)過程,還有效降低了資源消耗。

在模型驗(yàn)證階段,騰訊云TI平臺(tái)還提供了一整套完善的模型評(píng)測(cè)工具,包括在線輕量體驗(yàn)、客觀評(píng)測(cè)以及主觀評(píng)測(cè)。這些評(píng)測(cè)功能讓企業(yè)能夠根據(jù)實(shí)際業(yè)務(wù)需求,對(duì)模型效果進(jìn)行全方位的驗(yàn)證,確保在應(yīng)用場(chǎng)景中的高效表現(xiàn)。

與此同時(shí),騰訊云TI平臺(tái)已完成對(duì)國產(chǎn)計(jì)算卡的適配,有效滿足了相關(guān)企業(yè)對(duì)安全性和獨(dú)立性的高標(biāo)準(zhǔn)要求。TI平臺(tái)最新支持異構(gòu)算力的統(tǒng)一納管,實(shí)現(xiàn)了ARM架構(gòu)和X86架構(gòu)芯片服務(wù)器算力資源可通過一個(gè)控制臺(tái)進(jìn)行統(tǒng)一納管,在算力資源緊張的情況下,幫助客戶最大限度整合現(xiàn)有資源。

目前,騰訊云TI平臺(tái)已經(jīng)在金融、出行、政務(wù)、醫(yī)療、工業(yè)、零售等多個(gè)行業(yè)落地應(yīng)用。通過優(yōu)化AI 模型生產(chǎn)流程、提升 AI 業(yè)務(wù)運(yùn)營效率,幫助企業(yè)實(shí)現(xiàn)降本增效。比如某自動(dòng)駕駛企業(yè)借助騰訊云TI平臺(tái),基于數(shù)百張 GPU 卡實(shí)現(xiàn)了穩(wěn)定高效的自駕感知模型訓(xùn)練,整體訓(xùn)練性能實(shí)測(cè)提升近40%。

分享到

zhupb

相關(guān)推薦