生成式AI的爆發(fā),首先是一個數(shù)據(jù)總量與處理方式改變的問題。無論是文本生成、圖像合成還是多模態(tài)大模型,其底層都依賴海量異構(gòu)數(shù)據(jù)和高頻訪問的存儲支持。
過去訓(xùn)練階段以“順序讀寫、離線處理”為主,但今天的大模型迭代更強調(diào):
這意味著:
簡而言之,生成式AI將“讀多寫少”的AI存儲模型推向極限,高性能、分層調(diào)度、低延遲成為基礎(chǔ)要求。
如果說生成式AI需要的是“高效的數(shù)據(jù)加載”,那么智能體時代(Agentic AI)則提出了一個更復(fù)雜的命題:“持久、可追溯、可互動”的數(shù)據(jù)與行為記錄系統(tǒng)。
智能體不同于傳統(tǒng)模型調(diào)用,其核心特征是:
這對存儲系統(tǒng)提出了四類全新要求:
這意味著:傳統(tǒng)以“模型調(diào)度”為核心的數(shù)據(jù)架構(gòu),必須升級為以“行為持久化與交互協(xié)同”為目標(biāo)的Agent-native存儲體系。
結(jié)合上述生成式AI和智能體雙向演進(jìn),我們認(rèn)為未來AI基礎(chǔ)設(shè)施中的“存儲底座”需具備以下六大核心能力:
支持上萬個模型/Agent的同時調(diào)用,讀寫IOPS數(shù)量級需上升兩個維度。
支持大規(guī)模并行訓(xùn)練與推理任務(wù)的靈活擴展,適配GPU集群與邊緣節(jié)點部署。
自動識別數(shù)據(jù)冷熱,動態(tài)遷移至不同介質(zhì)(高性能SSD/QLC/磁帶等),優(yōu)化成本與訪問效率。
同時支撐AI數(shù)據(jù)湖、推理緩存、日志寫入等多種數(shù)據(jù)類型。
實時掌握數(shù)據(jù)流動與存儲瓶頸,配合AIOps實現(xiàn)資源智能分配。
在多Agent/多模型/跨域部署場景下,確保數(shù)據(jù)隔離、訪問審計與隱私保護(hù)。
我們正在步入一個模型不再“冷啟動”,而是持續(xù)運行、動態(tài)演化的AI時代。生成式AI讓算力成為焦點,但智能體的興起正在讓“存力”成為關(guān)鍵支柱。
在這個過程中,存儲不再只是數(shù)據(jù)倉庫或緩存中轉(zhuǎn)站,而是變成了支撐AI行為邏輯、決策協(xié)同與知識記憶的核心基礎(chǔ)設(shè)施。未來真正強大的AI系統(tǒng),不僅要擁有強算力,更需要一套“懂行為、會協(xié)作、有記憶”的存儲體系。
以“釋放數(shù)據(jù)潛能,加速智能涌現(xiàn)”為主題的2025中國數(shù)據(jù)與存儲峰會將于11月18日在北京舉行,共探AI時代的數(shù)據(jù)基礎(chǔ)設(shè)施演進(jìn)、存儲技術(shù)創(chuàng)新、智能應(yīng)用實踐及未來發(fā)展趨勢,迎接智能時代新機遇。