10月16日,零一萬物繼千億參數模型Yi-Large之后,正式對外發(fā)布新旗艦模型Yi-Lightning。這款模型在國際權威盲測榜單LMSYS上取得了優(yōu)異成績,超越了硅谷知名OpenAI GPT – 4o – 2024 – 05 – 13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。這是中國大模型在LMSYS這一全球大模型必爭的公開擂臺上,首度實現“超越OpenAI GPT – 4o”的最佳成績,在一眾國內模型中拔得頭籌,成為含金量最高的“中國大模型第一”。零一萬物也憑借此模型緊隨OpenAI、Google之后,與xAI打平,進擊全球前三大模型企業(yè),以優(yōu)異模型性能穩(wěn)居世界第一梯隊大模型公司之列。
一、模型性能卓越
(一)綜合性能出眾
在LMSYS的多個分榜中,Yi – Lightning表現優(yōu)異。在中文分榜上,超越了xAI發(fā)布的Grok – 2 – 08 – 13、智譜發(fā)布的GLM – 4 – Plus等國內外優(yōu)質模型,與o1 – mini等模型并列排名世界第二;在多輪對話分榜上,超越了Google所發(fā)布的Gemini – 1.5 – Pro、Anthropic發(fā)布的Claude 3.5 Sonnet等知名旗艦模型,排名第三;在數學、代碼分榜上,分別取得第三、第四名;在以專業(yè)性與高難度著稱的艱難提問、長提問榜單上,均取得世界第四的優(yōu)異成績。
(二)推理速度大幅提升
與上半年發(fā)布的Yi – Large相比,Yi – Lightning的推理速度有極大提升。內部評測數據顯示,在8xH100算力基礎下,以同樣的任務規(guī)模進行測試,首包時間僅為Yi – Large的一半,最高生成速度提升了近四成。外部與GPT – 4o對比,其生成速度堪稱“極速”。這得益于其采用的Mixture of Experts(MoE)混合專家模型架構以及在訓練過程中的多項創(chuàng)新嘗試。
1、獨特的混合注意力機制(Hybrid Attention):在部分層次中將傳統(tǒng)的全注意力(Full Attention)替換為滑動窗口注意力(Sliding Window Attention),并引入跨層注意力(Cross – Layer Attention, CLA)的設計。這種方式平衡了模型在處理長序列數據時的性能和計算資源消耗,使得模型在面對長序列數據時的表現保持在較高水平,同時顯著降低了KV緩存的大小,實現了2倍至4倍的減少;某些層次的計算復雜度也由序列長度的平方級降低到線性級,進一步提高了模型的計算效率。
2、動態(tài)Top – P路由:可以根據任務的難度動態(tài)自動選擇最合適的專家網絡組合,無需人工干預。與傳統(tǒng)的Top – K路由機制相比,能更靈活地根據任務的難度調整激活的專家網絡數量,從而更好地平衡推理成本和模型性能。
3、多階段訓練(Multi – stage Training):訓練前期注重數據的多樣性,后期側重內容更豐富、知識性更強的數據。通過這種方式,模型在不同階段吸收不同的知識,便于數據配比調試,同時在不同階段采用不同的batch size和LR schedule來保證訓練速度和穩(wěn)定性。結合自創(chuàng)的高質量數據生產管線,不僅保證了訓練效率,還讓模型在具備豐富知識的同時,基于復雜且重要的數據做進一步的強化。在有較多新增數據或對模型進行專有化時,可基于此模型進行快速、低成本的重新訓練。
二、推理成本降低
基于MoE模型架構與零一萬物自身的AI Infra優(yōu)勢,Yi – Lightning的推理成本大幅下降。目前已上線的Yi大模型開放平臺(https://platform.lingyiwanwu.com/)上,每百萬token僅需0.99元,直逼行業(yè)最低價,以極致性價比助力開發(fā)者與企業(yè)客戶輕松實現SOTA大模型自由。
三、行業(yè)應用廣泛
(一)AI 2.0數字人解決方案
10月16日,零一萬物首度對媒體公布了全新ToB戰(zhàn)略下的首發(fā)行業(yè)應用產品AI 2.0數字人,聚焦零售和電商等場景,將Yi – Lightning模型實踐到行業(yè)解決方案中。AI 2.0數字人包含角色大模型、直播聲音大模型、電商話術大模型等,具備動作訓練、表情生成、多國語言和情感表達、智能對話等能力。Yi – Lightning接入后,數字人的實時互動效果更好,話術更絲滑,回復也更準確。在業(yè)務數據方面,某酒旅企業(yè)接入后GMV較此前上升170%。除直播外,還為數字人客戶準備了AI 2.0門店短視頻解決方案,可低成本、高品質地生成營銷視頻,與直播內容相互配合,提升商品轉化率。該解決方案涵蓋了AI伴侶、IP形象、電商直播、辦公會議等多個應用場景,合作案例包括全國某著名餐飲連鎖、某頭部酒旅類客戶、全國某知名水果連鎖店等,均取得了顯著的GMV提升。
(二)全行業(yè)解決方案
零一萬物的全行業(yè)解決方案,除基座模型外還會搭配RAG、Function Calling等實用工具。在過去,已基于Yi – Vision與飛書合力打造智能巡檢產品,基于Yi – Large與某頭部醫(yī)療機構合作搭建在線問診平臺,Yi系列模型也接入了包含360 AI助手、沉浸式翻譯在內的知名應用。截止目前,ToB解決方案已在零售、醫(yī)療、教育、物流等領域內完成落地,涉及AI搜索、AI生產力工具、AI智能巡檢等應用場景,合作企業(yè)包括世界500強企業(yè)等。Yi – Lightning正式接入后,無論是標準化的全行業(yè)解決方案,還是私有化定制業(yè)務,都迎來了更多可能性。新旗艦模型Yi – Lightning采用的MoE混合專家模型架構在模型交付方面具有效率優(yōu)勢,可根據垂直領域的特殊需求快速重新訓練專家模型并交付。同時,其訓練過程中的創(chuàng)新嘗試也能為客戶提供更高起點的標準化基座模型,更快速、高效、低成本地完成定制模型訓練。
結語
零一萬物此次推出的Yi – Lightning模型,標志著中國大模型行業(yè)的重大突破,彰顯了中國所孕育的強大技術實力。其“模型+AI基礎設施+應用”的三位一體布局,不僅為自身構筑了技術護城河,也為中國大模型產業(yè)的發(fā)展提供了有益的探索和借鑒,未來將繼續(xù)推動中國大模型成為驅動千行百業(yè)的新質生產力。
零一萬物CEO李開復博士表示,Yi – Lightning的出色表現是“?;步ā睉?zhàn)略正確性的有力例證,也是探索“模應一體”的重要基石,在當前中國大模型產業(yè)的“耐力賽”階段,零一萬物將堅持這一布局,積極在ToB企業(yè)級解決方案上探索TC – PMF,助力中國打造以大模型為引擎的新質生產力。