z該柱狀圖展示了不同基準(zhǔn)測(cè)試在ERNIE-4.5和GPT-40上的表現(xiàn)情況。圖中橫軸列出了各個(gè)基準(zhǔn)測(cè)試的名稱,包括平均值、CCCBench、OCRBench、ChartQA、MMMU、MathVista、DocVQA和MVBench。縱軸表示測(cè)試得分。每個(gè)基準(zhǔn)測(cè)試都有兩根柱子,分別代表ERNIE-4.5(紅色)和GPT-40(藍(lán)綠色)的得分。從圖中可以看出,ERNIE-4.5在DocVQA基準(zhǔn)測(cè)試上得分最高,而在MMMU上得分最低;GPT-40在DocVQA上同樣取得較高得分,而在MathVista上得分相對(duì)較低。整體來(lái)看,ERNIE-4.5和GPT-40在不同基準(zhǔn)測(cè)試上的表現(xiàn)各有優(yōu)劣,ERNIE-4.5在多數(shù)基準(zhǔn)測(cè)試上的得分要高于GPT-40。
再來(lái)看看價(jià)格方面
這張圖片展示了文心大模型X1與DeepSeek R1在輸入和輸出價(jià)格上的對(duì)比。在輸入價(jià)格方面,文心X1的價(jià)格為0.002元/千Tokens,而DeepSeek R1的價(jià)格為0.004元/千Tokens,文心X1的輸入價(jià)格更具優(yōu)勢(shì)。在輸出價(jià)格方面,文心X1的價(jià)格為0.008元/千Tokens,DeepSeek R1的價(jià)格為0.016元/千Tokens,文心X1的輸出價(jià)格同樣更為經(jīng)濟(jì)??傮w來(lái)看,文心大模型X1在輸入和輸出價(jià)格上均低于DeepSeek R1,顯示出更高的性價(jià)比。
2
構(gòu)建開(kāi)發(fā)者生態(tài)
開(kāi)源時(shí)間與技術(shù)普惠
百度宣布將于2025年6月30日開(kāi)源文心4.5,涵蓋輕量化模型、多模態(tài)模塊及訓(xùn)練工具鏈,吸引開(kāi)發(fā)者共建生態(tài)。李彥宏強(qiáng)調(diào),開(kāi)源源于對(duì)技術(shù)領(lǐng)先地位的信心,旨在通過(guò)“用戶基數(shù)→數(shù)據(jù)反饋→模型迭代”循環(huán)擴(kuò)大應(yīng)用場(chǎng)景。
開(kāi)源模型支持與第三方云平臺(tái)混合部署,降低企業(yè)使用門(mén)檻。百度智能云通過(guò)托管服務(wù)、算力租賃等實(shí)現(xiàn)“開(kāi)源引流-云服務(wù)創(chuàng)收”閉環(huán),已幫助33,000個(gè)模型精調(diào),開(kāi)發(fā)77萬(wàn)個(gè)企業(yè)應(yīng)用。
行業(yè)巨頭紛紛提速
今年以來(lái),在DeepSeek的推動(dòng)下,行業(yè)巨頭加速了AI大模型領(lǐng)域的業(yè)務(wù)布局。3月12日,谷歌CEO宣布開(kāi)源多模態(tài)大模型Gemma 3,包含10億至270億四種參數(shù)規(guī)模,即便最小規(guī)模也具備強(qiáng)大處理能力。在LMArena測(cè)試中,270億參數(shù)的Gemma 3表現(xiàn)卓越,擊敗多款模型,成為僅次于DeepSeek-R1的最優(yōu)開(kāi)源模型。
同時(shí),谷歌推出基于Gemini 2.0的Gemini Robotics及Gemini Robotics-ER兩款模型,旨在開(kāi)發(fā)更靈活的互動(dòng)機(jī)器人,拓展應(yīng)用場(chǎng)景。
同日,OpenAI發(fā)布AI Agent應(yīng)用開(kāi)發(fā)新工具包,包括Responses API、首款開(kāi)源Agents SDK等,SDK支持多Agent動(dòng)態(tài)任務(wù)協(xié)作,可開(kāi)發(fā)復(fù)雜智能自動(dòng)化流程。
此外,Meta正與臺(tái)積電合作測(cè)試其自研AI訓(xùn)練芯片,繼去年成功部署推理任務(wù)處理器后,計(jì)劃2025年投入650億美元于AI基礎(chǔ)設(shè)施建設(shè)。