在生成式AI的工作流中,數(shù)據(jù)首先要被切割為“詞元”,這些詞元是承載語義的最小單位。例如,在自然語言處理中,詞元可能是一個單詞、短語或字母。這些詞元為AI模型的訓(xùn)練和推理提供了基礎(chǔ)。
當(dāng)數(shù)據(jù)管道不再只是單純的傳輸,而是轉(zhuǎn)向智能化處理時,存儲系統(tǒng)的價值點發(fā)生了變化,不再僅是存儲大量數(shù)據(jù),而是通過“詞元化”技術(shù)提取數(shù)據(jù)的深層價值。
由于生成式人工智能的影響,WEKA的市場正從傳統(tǒng)的高性能計算(HPC)和企業(yè)分析領(lǐng)域發(fā)生轉(zhuǎn)變。茲維貝爾表示,生成式AI和企業(yè)AI市場持續(xù)爆發(fā)式增長。AI行業(yè)的創(chuàng)新速度驚人,為企業(yè),、政府和研究機構(gòu)帶來了機遇。
如今,為生成式AI模型訓(xùn)練和推理提供數(shù)據(jù)及數(shù)據(jù)管道的競爭異常激烈。比如DOIT將在3月27日召開人工智能基礎(chǔ)設(shè)施峰會,DDN將在3月17日英偉達的GTC25大會上舉辦人工智能數(shù)據(jù)論壇,VAST Data推出專為人工智能設(shè)計的數(shù)據(jù)基礎(chǔ)設(shè)施,所有主流存儲供應(yīng)商紛紛涌入這個市場,同時Cloudian、MinIO和Scality等對象存儲供應(yīng)商也蜂擁而至。此外,還有數(shù)據(jù)管理和編排企業(yè),如Arcitecta、Hammerspace、Komprise等正在構(gòu)建以人工智能為核心的數(shù)據(jù)管道。在整個存儲行業(yè),生成式AI推動了以AI為核心的發(fā)展。
詞元經(jīng)濟正在重塑價值分配法則——存儲系統(tǒng)的價值不再僅僅取決于裝載了多少數(shù)據(jù),而在于能提煉出多少可用詞元。這種轉(zhuǎn)變類似于從原油貿(mào)易進階到精細化工產(chǎn)業(yè),可能會催生出新的職業(yè),如存儲咨詢師、詞元精算師、AI存儲合規(guī)專家等。