圖:重要AI模型數(shù)量

而中國在論文數(shù)量(全球占比23.2%)和專利授權(quán)量(全球69.7%)上領(lǐng)跑,但高影響力研究仍由美國主導(dǎo)(Top100高被引論文中,美國貢獻(xiàn)50篇,中國34篇)。

圖:論文發(fā)表數(shù)量

2

技術(shù)突破

DeepSeek率先打響成本革命

通過混合專家架構(gòu)(MoE)與動態(tài)路由優(yōu)化,將170億激活參數(shù)動態(tài)分配給128個專家模塊,僅需激活必要模塊即可完成任務(wù),避免“全參數(shù)啟動”的資源浪費。DeepSeek-V3的推理成本降至$0.07/百萬token,僅為GPT-4的1/10。其訓(xùn)練能耗較Llama 3下降62%,單卡H100即可運行,徹底打破“算力即霸權(quán)”的行業(yè)鐵律。

小模型迎來性能突破

2022年時,能在MMLU多任務(wù)語言理解基準(zhǔn)測試中達(dá)到60%準(zhǔn)確率的最小模型是擁有5400億參數(shù)的PaLM。

而到2024年,微軟僅38億參數(shù)的Phi-3-mini模型就實現(xiàn)了同等表現(xiàn),兩年間模型體積縮小了142倍。

AI使用成本呈下降趨勢:

圖注:從2022年到2024年,GPT-3.5和GPT-4在基準(zhǔn)測試中的推理價格呈下降趨勢

以GPT模型為例,對于MMLU測試中達(dá)到GPT-3.5水平(64.8%準(zhǔn)確率)的模型,單次百萬token查詢成本從2022年11月的20美元,暴跌至2024年10月的0.07美元(Gemini-1.5-Flash-8B模型),18個月內(nèi)降幅超280倍。不同任務(wù)的LLM推理價格年降幅達(dá)9-900倍不等。

經(jīng)濟(jì)影響:

企業(yè)降本增效加速,生成式AI成資本寵兒

AI對生產(chǎn)力的改造已進(jìn)入規(guī)?;A段:

企業(yè)應(yīng)用爆發(fā):78%的組織在2024年采用AI技術(shù),較前一年增長55%。中國大陸企業(yè)AI采用率達(dá)75%,與北美差距縮小至7%。

投資熱潮:2024年全球AI投資達(dá)2523億美元,其中美國以1091億美元領(lǐng)跑(中國為93億美元),生成式AI獨占339億美元,年增長18.7%。

值得注意的是,盡管投資回報尚未全面顯現(xiàn)(多數(shù)企業(yè)成本降幅低于10%),但生成式AI在醫(yī)療、金融等領(lǐng)域的商業(yè)化潛力已初露鋒芒。例如,F(xiàn)DA批準(zhǔn)的AI醫(yī)療設(shè)備數(shù)量從2015年的6款飆升至2024年的950款,AI在蛋白質(zhì)折疊預(yù)測等科學(xué)任務(wù)中甚至助力研究斬獲諾貝爾獎。

AI競賽的“中國式突圍”能否持續(xù)?:

中國政府在AI領(lǐng)域給予了大力支持,成立了國家數(shù)據(jù)局推動數(shù)據(jù)要素市場化,全面落地“東數(shù)西算”工程降低算力成本。這些政策紅利為中國AI企業(yè)的快速發(fā)展提供了有力保障。此外中國AI企業(yè)積極構(gòu)建開放生態(tài),推動產(chǎn)業(yè)鏈上下游協(xié)同發(fā)展。華為“鯤鵬+昇騰”算力底座、百度“文心一言”開放平臺、騰訊“混元”大模型產(chǎn)業(yè)聯(lián)盟等,為AI技術(shù)的研發(fā)和應(yīng)用提供了有力支撐。但是中國AI的發(fā)展還面臨著基礎(chǔ)研究斷層的問題:若無法在算法、芯片等底層領(lǐng)域突破,中國可能陷入“應(yīng)用強、生態(tài)弱”的被動局面。而且要面對開源與商業(yè)的平衡:過度依賴開源可能導(dǎo)致核心技術(shù)創(chuàng)新動力不足,從而難免走“下坡路”,“中國式突圍”能否持續(xù)?讓我們拭目以待吧!

結(jié)語

斯坦福報告描繪了一幅復(fù)雜圖景:技術(shù)差距的縮小并未消弭生態(tài)系統(tǒng)的差異,效率革命催生了普惠紅利,對中國而言,如何在基礎(chǔ)研究、算力自主與商業(yè)化落地之間找到平衡,或?qū)Q定其能否在下一輪康波周期中實現(xiàn)從“追趕”到“引領(lǐng)”的跨越。而對于全球,構(gòu)建負(fù)責(zé)任的技術(shù)生態(tài),或許比單純追求性能突破更為緊迫。

分享到

lixiangjing

算力豹主編

相關(guān)推薦