4月20日,科大訊飛旗下的深度推理大模型——訊飛星火X1,正式宣布完成全新升級(jí)。作為當(dāng)前業(yè)界中唯一一款基于全國(guó)產(chǎn)算力進(jìn)行訓(xùn)練的深度推理大模型,升級(jí)后的星火X1在多個(gè)通用任務(wù)領(lǐng)域均取得了顯著的性能提升。具體而言,該模型在數(shù)學(xué)計(jì)算、代碼編寫(xiě)、邏輯推理、文本生成、語(yǔ)言理解以及知識(shí)問(wèn)答等任務(wù)上的表現(xiàn)均有了大幅提升。尤為值得一提的是,在模型參數(shù)規(guī)模較業(yè)界同類模型縮小一個(gè)數(shù)量級(jí)的情況下,星火X1的整體性能已經(jīng)能夠與OpenAI的o1模型以及DeepSeek的R1模型相媲美。這一成果再次印證了基于國(guó)產(chǎn)算力訓(xùn)練的全棧自主可控大模型不僅具備登頂業(yè)界最高水平的實(shí)力,更展現(xiàn)出持續(xù)創(chuàng)新的巨大潛力。
文字編輯|宋雨涵
1
訊飛星火X1技術(shù)突破
三大創(chuàng)新驅(qū)動(dòng)國(guó)產(chǎn)大模型登頂
訊飛星火X1的升級(jí)聚焦于推理能力與泛化性的全面提升,其核心技術(shù)突破包括:
快慢思考統(tǒng)一模型
首創(chuàng)“直覺(jué)快思考”與“深度慢思考”雙模式融合架構(gòu)。快思考模式支持實(shí)時(shí)翻譯、百科問(wèn)答等低延遲任務(wù);慢思考模式則通過(guò)多步驟邏輯鏈拆解復(fù)雜問(wèn)題(如數(shù)學(xué)證明、法律條文解析),模擬人類專家級(jí)推理過(guò)程。
大規(guī)模多階段強(qiáng)化學(xué)習(xí)
針對(duì)復(fù)雜場(chǎng)景數(shù)據(jù)稀缺問(wèn)題,提出基于問(wèn)題難度的分階段訓(xùn)練框架。通過(guò)動(dòng)態(tài)調(diào)整強(qiáng)化學(xué)習(xí)更新速度,顯著提升長(zhǎng)思維鏈(如50步推理)的穩(wěn)定性和準(zhǔn)確性,在數(shù)學(xué)競(jìng)賽題(如AIME、MATH 500)上的準(zhǔn)確率較前代提升12%。
國(guó)產(chǎn)算力適配工程優(yōu)化
聯(lián)合華為昇騰團(tuán)隊(duì)攻克顯存動(dòng)態(tài)卸載、訓(xùn)推共卡協(xié)同等技術(shù)難題,實(shí)現(xiàn)集群推理性能翻番。例如,通過(guò)異步雙發(fā)射技術(shù),服務(wù)請(qǐng)求調(diào)度耗時(shí)降低10%,為國(guó)產(chǎn)算力平臺(tái)的高效運(yùn)行提供系統(tǒng)性解決方案。
通用能力比肩國(guó)際頂尖模型水平
通用能力比肩國(guó)際頂尖模型水平
全新升級(jí)后的訊飛星火X1,在多個(gè)任務(wù)效果上繼續(xù)突破,性能表現(xiàn)優(yōu)異。根據(jù)最新測(cè)試集評(píng)測(cè)結(jié)果,星火X1在通用任務(wù)效果評(píng)測(cè)中全面對(duì)標(biāo)OpenAI o1和DeepSeek R1,在數(shù)學(xué)和知識(shí)問(wèn)答等方面表現(xiàn)尤為突出。
性能對(duì)標(biāo)國(guó)際:
小參數(shù)量下的“降維打擊”:
在數(shù)學(xué)答題與數(shù)理邏輯推理領(lǐng)域,星火X1展現(xiàn)出了卓越的能力。它能夠精準(zhǔn)識(shí)別復(fù)雜的數(shù)學(xué)公式,不僅提供全面細(xì)致的解題思路,而且輸出結(jié)果嚴(yán)謹(jǐn)清晰,令人信服。在邏輯推理方面,星火X1更是能夠全方位考量,深入探索各種潛在假設(shè),其嚴(yán)謹(jǐn)性和準(zhǔn)確性令人印象深刻。
在代碼能力上,星火X1實(shí)現(xiàn)了顯著提升。它不僅提高了代碼生成的準(zhǔn)確率,還加深了對(duì)生成代碼邏輯的理解,從而能夠輕松應(yīng)對(duì)更為復(fù)雜的編程挑戰(zhàn),助力開(kāi)發(fā)者快速高效地實(shí)現(xiàn)功能。在語(yǔ)言理解層面,星火X1的輸出內(nèi)容更加貼合用戶指令,格式規(guī)范,且生成的內(nèi)容連貫準(zhǔn)確,極大地提升了用戶體驗(yàn)。
此外,星火X1還具備出色的長(zhǎng)思維鏈能力,并支持圖像輸入。它能夠?qū)斎氲膱D像進(jìn)行深度關(guān)聯(lián)思考,細(xì)致探究圖像中的多種復(fù)雜元素,實(shí)現(xiàn)深層次的信息整合與推理,展現(xiàn)出強(qiáng)大的智能處理潛力。
盡管星火X1的模型參數(shù)規(guī)模較業(yè)界同類模型有所縮減,但其整體性能卻毫不遜色,已經(jīng)能夠與OpenAI的o1模型及DeepSeek的R1模型相抗衡。這一成就再次有力證明了,基于國(guó)產(chǎn)算力訓(xùn)練的大模型不僅具備躋身業(yè)界頂尖水平的實(shí)力,更擁有著持續(xù)創(chuàng)新、不斷突破的巨大潛力。
3
行業(yè)領(lǐng)先,簡(jiǎn)化部署流程
4張華為910B實(shí)現(xiàn)“輕量化部署”
訊飛星火X1經(jīng)過(guò)全新升級(jí),在行業(yè)實(shí)際應(yīng)用中展現(xiàn)出顯著優(yōu)勢(shì)。在技術(shù)創(chuàng)新與模型部署層面,星火X1率先推出了“快思考、慢思考統(tǒng)一模型”,實(shí)現(xiàn)了通過(guò)一個(gè)模型即可靈活支持兩種思考模式,極大地增強(qiáng)了模型處理不同復(fù)雜度任務(wù)的能力。此外,滿血版的星火X1部署需求極為精簡(jiǎn),僅需4張華為910B顯卡即可完成,顯著簡(jiǎn)化了私有化部署的流程。
與此同時(shí),星火X1還全面升級(jí)了模型定制優(yōu)化工具鏈,現(xiàn)支持SFT(監(jiān)督微調(diào))與強(qiáng)化學(xué)習(xí)兩種定制優(yōu)化方案。企業(yè)僅需16張華為910B顯卡,即可完成針對(duì)特定行業(yè)的模型定制優(yōu)化,極大地降低了AI定制化的門檻。這一舉措使得各行業(yè)能夠更加便捷地實(shí)現(xiàn)AI應(yīng)用價(jià)值的落地,推動(dòng)了AI技術(shù)的普及與應(yīng)用。
在中美科技競(jìng)爭(zhēng)日趨激烈的背景下,星火X1選擇的全國(guó)產(chǎn)化技術(shù)路徑具有深遠(yuǎn)意義。正如科大訊飛董事長(zhǎng)劉慶峰所說(shuō):“訊飛星火大模型代表了完全自主可控大模型中國(guó)能達(dá)到的高度?!笨拼笥嶏w董事長(zhǎng)劉慶峰
結(jié)語(yǔ)
國(guó)產(chǎn)AI的“破局”與“立新”
此次訊飛星火X1的全面升級(jí),彰顯了中國(guó)人工智能技術(shù)在國(guó)產(chǎn)算力平臺(tái)上的卓越創(chuàng)新,為各行業(yè)的數(shù)字化轉(zhuǎn)型開(kāi)辟了嶄新的路徑。作為國(guó)產(chǎn)算力訓(xùn)練的大模型典范,星火X1的卓越表現(xiàn)充分證明,中國(guó)在技術(shù)自主可控的征途上,其AI技術(shù)已經(jīng)具備了與國(guó)際頂尖模型一較高下的實(shí)力。