4月20日,科大訊飛旗下的深度推理大模型——訊飛星火X1,正式宣布完成全新升級。作為當前業(yè)界中唯一一款基于全國產算力進行訓練的深度推理大模型,升級后的星火X1在多個通用任務領域均取得了顯著的性能提升。具體而言,該模型在數學計算、代碼編寫、邏輯推理、文本生成、語言理解以及知識問答等任務上的表現均有了大幅提升。尤為值得一提的是,在模型參數規(guī)模較業(yè)界同類模型縮小一個數量級的情況下,星火X1的整體性能已經能夠與OpenAI的o1模型以及DeepSeek的R1模型相媲美。這一成果再次印證了基于國產算力訓練的全棧自主可控大模型不僅具備登頂業(yè)界最高水平的實力,更展現出持續(xù)創(chuàng)新的巨大潛力。
文字編輯|宋雨涵
1
訊飛星火X1技術突破
三大創(chuàng)新驅動國產大模型登頂
訊飛星火X1的升級聚焦于推理能力與泛化性的全面提升,其核心技術突破包括:
快慢思考統(tǒng)一模型
首創(chuàng)“直覺快思考”與“深度慢思考”雙模式融合架構。快思考模式支持實時翻譯、百科問答等低延遲任務;慢思考模式則通過多步驟邏輯鏈拆解復雜問題(如數學證明、法律條文解析),模擬人類專家級推理過程。
大規(guī)模多階段強化學習
針對復雜場景數據稀缺問題,提出基于問題難度的分階段訓練框架。通過動態(tài)調整強化學習更新速度,顯著提升長思維鏈(如50步推理)的穩(wěn)定性和準確性,在數學競賽題(如AIME、MATH 500)上的準確率較前代提升12%。
國產算力適配工程優(yōu)化
聯合華為昇騰團隊攻克顯存動態(tài)卸載、訓推共卡協(xié)同等技術難題,實現集群推理性能翻番。例如,通過異步雙發(fā)射技術,服務請求調度耗時降低10%,為國產算力平臺的高效運行提供系統(tǒng)性解決方案。
通用能力比肩國際頂尖模型水平
通用能力比肩國際頂尖模型水平
全新升級后的訊飛星火X1,在多個任務效果上繼續(xù)突破,性能表現優(yōu)異。根據最新測試集評測結果,星火X1在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1,在數學和知識問答等方面表現尤為突出。
性能對標國際:
小參數量下的“降維打擊”:
在數學答題與數理邏輯推理領域,星火X1展現出了卓越的能力。它能夠精準識別復雜的數學公式,不僅提供全面細致的解題思路,而且輸出結果嚴謹清晰,令人信服。在邏輯推理方面,星火X1更是能夠全方位考量,深入探索各種潛在假設,其嚴謹性和準確性令人印象深刻。
在代碼能力上,星火X1實現了顯著提升。它不僅提高了代碼生成的準確率,還加深了對生成代碼邏輯的理解,從而能夠輕松應對更為復雜的編程挑戰(zhàn),助力開發(fā)者快速高效地實現功能。在語言理解層面,星火X1的輸出內容更加貼合用戶指令,格式規(guī)范,且生成的內容連貫準確,極大地提升了用戶體驗。
此外,星火X1還具備出色的長思維鏈能力,并支持圖像輸入。它能夠對輸入的圖像進行深度關聯思考,細致探究圖像中的多種復雜元素,實現深層次的信息整合與推理,展現出強大的智能處理潛力。
盡管星火X1的模型參數規(guī)模較業(yè)界同類模型有所縮減,但其整體性能卻毫不遜色,已經能夠與OpenAI的o1模型及DeepSeek的R1模型相抗衡。這一成就再次有力證明了,基于國產算力訓練的大模型不僅具備躋身業(yè)界頂尖水平的實力,更擁有著持續(xù)創(chuàng)新、不斷突破的巨大潛力。
3
行業(yè)領先,簡化部署流程
4張華為910B實現“輕量化部署”
訊飛星火X1經過全新升級,在行業(yè)實際應用中展現出顯著優(yōu)勢。在技術創(chuàng)新與模型部署層面,星火X1率先推出了“快思考、慢思考統(tǒng)一模型”,實現了通過一個模型即可靈活支持兩種思考模式,極大地增強了模型處理不同復雜度任務的能力。此外,滿血版的星火X1部署需求極為精簡,僅需4張華為910B顯卡即可完成,顯著簡化了私有化部署的流程。
與此同時,星火X1還全面升級了模型定制優(yōu)化工具鏈,現支持SFT(監(jiān)督微調)與強化學習兩種定制優(yōu)化方案。企業(yè)僅需16張華為910B顯卡,即可完成針對特定行業(yè)的模型定制優(yōu)化,極大地降低了AI定制化的門檻。這一舉措使得各行業(yè)能夠更加便捷地實現AI應用價值的落地,推動了AI技術的普及與應用。
在中美科技競爭日趨激烈的背景下,星火X1選擇的全國產化技術路徑具有深遠意義。正如科大訊飛董事長劉慶峰所說:“訊飛星火大模型代表了完全自主可控大模型中國能達到的高度?!笨拼笥嶏w董事長劉慶峰
結語
國產AI的“破局”與“立新”
此次訊飛星火X1的全面升級,彰顯了中國人工智能技術在國產算力平臺上的卓越創(chuàng)新,為各行業(yè)的數字化轉型開辟了嶄新的路徑。作為國產算力訓練的大模型典范,星火X1的卓越表現充分證明,中國在技術自主可控的征途上,其AI技術已經具備了與國際頂尖模型一較高下的實力。