“云邊端”全棧AI產品與解決方案
摩爾線程全功能GPU芯片采用自主研發(fā)的MUSA架構,率先實現了單芯片架構同時支持 AI 計算加速、圖形渲染、物理仿真和科學計算、超高清視頻編解碼的技術突破。自2020年成立至今,摩爾線程已成功推出四代GPU架構和智能SoC產品,拓展出覆蓋AI智算、專業(yè)圖形加速、桌面級圖形加速等領域豐富完整的計算加速產品矩陣,全面支持云計算、邊緣計算及終端設備市場,滿足從政務、企業(yè)智能計算到個人消費場景的多層次需求。
——夸娥(KUAE):夸娥是以全功能GPU為硬件核心,軟硬一體化、完整的系統級算力解決方案,旨在為大規(guī)模GPU算力的建設和運營管理提供系統級支持。KUAE為智算中心提供端到端解決方案,支持萬卡級規(guī)模擴展能力,單集群可部署超1,000個計算節(jié)點,每節(jié)點集成8顆自研OAM模組化GPU,通過3D全互聯拓撲實現亞微秒級通信延遲,為大模型預訓練提供穩(wěn)定高效的算力支撐。其中,KUAE1是支持千卡互聯的第一代智算融合中心產品;KUAE2是2024年底推出的第二代大規(guī)模智算融合中心產品,支持萬卡互聯。
——全功能GPU OAM模組:摩爾線程自研全功能GPU高性能計算模塊,專為大規(guī)模智算集群設計,可支持萬億級參數大模型訓練與推理。摩爾線程全功能GPU在國內率先支持FP8等全計算精度,滿足DeepSeek V3/R1等原生FP8計算需求,同時配備FP64算力,滿足科學應用需求并加速AI for Science等場景。
——AI大模型一體機MCCX D800 X2:摩爾線程旗艦級GPU加速服務器MCCX D800 X2,專為大語言及多模態(tài)大模型、科學計算和物理仿真等前沿領域打造。該服務器基于摩爾線程全功能GPU模組與高速全互聯架構,全面釋放計算性能,為高性能計算集群的構建提供強大支持,賦能企業(yè)在復雜AI場景中實現極致算力突破。
——大模型智算加速卡MTT S4000:訓推兼顧,單卡支持 48GB 顯存和 768GB/s 的顯存帶寬?;谀柧€程自研MTLink技術,MTT S4000 可以支持多卡互聯,支持千卡集群基礎設施建設,加速千億參數大語言模型計算。
——云端渲染卡MTT S3000:基于其多樣算力,借助覆蓋圖形渲染、視頻處理、深度學習的完整MUSA軟件棧,MTT S3000可為AI推理、云游戲、云渲染、視頻云、數字孿生、數字內容創(chuàng)作等場景提供通用智算能力支持。
——桌面級圖形顯卡MTT S80:首款國產GPU游戲顯卡,支持多種主流圖形API,擁有14.7TFLOPS 的FP32算力,并搭配16GB GDDR6 高速顯存及PCIe Gen5 x16 接口,可支持 8K 超高清與4K 144Hz高刷新率顯示輸出。
——邊緣AI計算模組:摩爾線程基于邊緣AI計算模組打造了高性能、低延遲、強可靠的國產邊緣AI解決方案。該方案憑借50TOPS的高算力、全棧AI工具鏈以及端云協同架構,可廣泛應用于工業(yè)、能源、教育、交通、醫(yī)療等行業(yè)。
摩爾線程還對以下內容進行了展示和介紹。
1)智能計算
大模型訓練:實現高效AI訓練,FP8算力與容錯技術引領行業(yè)突破。摩爾線程KUAE2智算集群解決方案面向大規(guī)模智算中心,集成計算、存儲、網絡硬件及分布式計算軟件,最高支持10,240個全功能GPU部署。KUAE2兼顧AI與科學計算,覆蓋FP64至FP8全精度計算,支持AI、圖形、科學計算等全場景加速。
KUAE2具備高效的AI大模型訓練能力,訓練性能表現優(yōu)異,領先行業(yè)水平。同時,依托于在FP8混合精度計算方面的原生優(yōu)勢,KUAE2與BF16相比精度幾乎無損,FP8 GEMM利用率達到行業(yè)領先水平。
大模型推理:國產GPU推理解決方案,打造極速DeepSeek體驗。摩爾線程基于全新GPU的計算、通信、訪存等強大基礎能力,為國產GPU推理性能帶來了全新的極速體驗。基于圖優(yōu)化、算子優(yōu)化、FP8精度計算等軟硬件深度優(yōu)化,打造集高性能、最佳全量體驗和高精度模型等優(yōu)勢于一身的國產化推理解決方案。
運行DeepSeek R1 671B 全量模型的單路解碼速度約100 token/s,處于行業(yè)領先水平。
2)科學計算
生命科學:以全功能GPU強大算力,推動生命科學研究實現國產突破。智能計算與科學計算的融合正推動生命科學研究的變革。分子動力學模擬和分子對接技術能在原子層面解析生物分子相互作用,極大提升藥物研發(fā)效率,但也帶來巨大算力需求。 摩爾線程聯合北京大學、昌平實驗室高毅勤課題組,基于國產SPONGE和DSDP軟件,打造了軟硬件協同的生命科學解決方案。
全功能GPU憑借全精度計算、強大兼容性和高性能優(yōu)勢,可高效運行分子動力學、分子對接等科學計算軟件。同時還能夠加速AlphaFold等AI模型的訓練推理,實現計算與AI的深度融合。該方案不僅突破傳統研究瓶頸,更在性能上達到行業(yè)領先水平,推動生命科學研究的國產化突破。
物理仿真:攜手硒鉬科技,開啟AI for Science科研新范式。硒鉬·秋月白AI是硒鉬科技研發(fā)的打造的AI for Science(AI4S)大模型平臺。該平臺深度融合AI與科學研究,通過智能任務規(guī)劃、多模態(tài)數據分析、動態(tài)數學建模和PhysicsAI物理反演等核心功能,為電氣工程、航天科技、流體力學等領域提供智能化的科研解決方案。
相比傳統CPU方案,平臺依托摩爾線程全功能GPU的強大算力與均衡的訓推能力,在保持計算精度的同時,可實現百倍以上的仿真效率提升,顯著加速科研進程。其專有智能體系統能夠自動化處理科研中的重復性工作,推動科學研究向工程化、精準化的新范式演進。
3)圖形計算
空間智能:依托全功能GPU,補齊遙感智能解譯方案全國產關鍵一環(huán)。遙感大模型正成為處理海量地球觀測數據的關鍵技術,可高效完成場景分類、目標檢測等智能解譯任務。面對日均PB級數據增長,傳統算力已無法滿足實時分析需求,遙感的AI升級迫在眉睫。同時遙感數據多為國家重要數據資產,構建完全自主可控的全國產化解決方案亦成為當務之急。
超圖遙感大模型通過智能化技術實現了從數據處理到分析解譯的全流程覆蓋,可高效完成場景分類、變化檢測、目標識別等在內的多類遙感影像解譯任務。依托全功能GPU,摩爾線程聯合超圖共同構建了覆蓋訓練、推理到可視化的完整國產化鏈條,支持億級參數模型開發(fā),并實現快速解譯和高清影像實時渲染,成為國內極少數的可滿足遙感大模型全流程需求的國產GPU解決方案。
視頻超分:摩爾線程MTVSR,實時超分喚醒畫質新生。實時視頻超分技術不僅能夠提升用戶的觀看體驗,更能有效節(jié)省視頻文件的存儲空間,降低存儲和網絡傳輸成本。
摩爾線程開發(fā)的端側實時視頻超分技術MTVSR,可提供2倍-4倍的實時視頻超分,并提供多檔質量設定,能夠顯著提升低分辨率視頻在高分辨率屏幕下的播放清晰度。MTVSR還將以SDK形式支持播放器、瀏覽器等App集成調用,可為終端用戶提供無縫的實時視頻超分體驗。
4)全功能GPU加速行業(yè)應用。
全功能GPU+創(chuàng)娛教育:全功能GPU賦能創(chuàng)娛教育,用AI激發(fā)兒童無限創(chuàng)意。“AI智繪童畫”是由摩爾線程與運動加加聯合推出的創(chuàng)新教育應用,基于摩爾線程AIGC技術及全功能GPU的強大算力,為用戶提供一站式、多模態(tài)的智能繪本創(chuàng)作體驗。孩子只需簡單言語表達,即可自由改編童話故事、生成專屬插畫,輕松完成個性化繪本創(chuàng)作。
目前,該應用已登陸海信平臺,憑借強大的AI生成能力和友好的交互設計,累計服務數十萬用戶。在趣味互動中培養(yǎng)孩子的表達力與創(chuàng)造力,讓學習與娛樂完美融合,開啟寓教于樂的全新體驗。
全功能GPU+智能制造:攜手雪浪云,為制造業(yè)高質量發(fā)展注入新動能。人工智能技術為高端裝備制造產業(yè)升級提供了巨大歷史機遇。摩爾線程工業(yè)領域合作伙伴雪浪云依托全功能GPU,打造了圖零大模型、工藝生成智能體和裝備運維智能體等一系列產品,構建了涵蓋工藝、生產與設備全流程的工業(yè)智能解決方案,實現了制造核心技術從底層到應用的國產化閉環(huán)。
該解決方案以“國產GPU算力+國產模型+國產應用”的全國產架構,將裝備制造業(yè)的海量經驗、數據和產業(yè)鏈優(yōu)勢轉換為產業(yè)發(fā)展的創(chuàng)新動力,為我國智能智造高質量發(fā)展釋放生產力、打造競爭力。
全功能GPU+智慧醫(yī)療:攜手推想醫(yī)療,加速開啟智能醫(yī)療新時代。摩爾線程全功能GPU內置圖形渲染、視頻編解碼、物理仿真、人工智能四大計算引擎,其自研的MUSA架構能夠良好兼容CUDA生態(tài),在現今多模態(tài)發(fā)展趨勢下具備廣泛的兼容性與易用性。
依托全功能GPU 的強大優(yōu)勢,摩爾線程攜手合作伙伴推想醫(yī)療,成功完成冠脈CT造影圖像血管狹窄輔助評估軟件的國產化適配及遷移,突破AI算法開發(fā)環(huán)境、軟件運行環(huán)境和基礎算力匹配的多重技術瓶頸,解決我國AI醫(yī)療軟件產品自主發(fā)展的重大難題,助力AI醫(yī)療領域實現從芯片到軟件全面國產化的跨越。
全功能GPU+智能駕駛:構建虛擬訓練場,助力自動駕駛領域突破數據邊界。在自動駕駛領域,”世界模型”正在成為訓練系統的核心工具。它通過模擬真實駕駛環(huán)境,為AI提供了高效、安全的學習平臺。就像人類通過觀察和實踐掌握駕駛技能一樣,AI依賴世界模型來理解和適應復雜道路場景。
摩爾線程全功能GPU憑借其卓越的圖形渲染、AI計算和視頻編解碼能力,為極佳科技的世界模型平臺提供了強大的算力基座。通過媲美行業(yè)標桿的視覺精度與穩(wěn)定算力輸出,不僅可以滿足自動駕駛對高精度數據的嚴苛需求,還能持續(xù)為世界模型提供優(yōu)質的訓練素材,推動自動駕駛技術快速迭代,加速自動駕駛領域突破數據瓶頸。
全功能GPU+數字服務:摩爾線程數字人全棧解決方案,全鏈路定制服務賦能企業(yè)智能升級。摩爾線程數字人解決方案基于全功能GPU強大算力,深度融合圖形渲染、AI計算與視頻編解碼技術,打造軟硬一體化的交互方案。新一代聲像模型驅動高清數字人,呈現逼真自然的音色與畫面;界面設計簡潔,支持一鍵切換形象與音色;全雙工交互技術實現毫秒級響應,支持實時語音打斷,讓對話流暢自然。
依托端云協同架構,方案在確保數據安全的同時,為政務、銀行、企業(yè)等服務場景提供定制化智能交互服務。通過從硬件到終端的全鏈路國產化技術,助力企業(yè)構建自主可控的數字化服務體系,實現服務體驗與運營效率的雙重提升。
全功能GPU+智能座艙:國產智能座艙域控方案,重塑高端駕乘新體驗。摩爾線程與合作伙伴紫光計算機共同打造的全國產高端智能座艙域控方案,集成了高性能顯示、強大AI計算能力于一體。該方案最高支持8塊4K屏幕同時輸出,并具備8K硬件編解碼能力,配合媲美獨立顯卡的3D渲染性能,能夠流暢呈現各類復雜場景。
平臺提供高達50TOPS的本地AI算力,支持大語言模型和圖像識別算法在終端側部署運行,結合預裝的數字人穆莎等AI應用,在兼容Linux和Android系統的同時,實現了從硬件底層到軟件交互的完整智能座艙解決方案。