真人做人试看120分钟,久久久久久久,欲色天天网综合久久

這讓我們開始思考AI訓練中文件系統(tǒng)的必要性以及VAST的發(fā)展方向，因此我們向丹沃斯提出了一些問題。

Blocks & Files：為什么像DDN這樣的文件系統(tǒng)供應商被Nvidia用于其自身的存儲，獲得了SuperPOD認證，以及被X用于其Colossus AI集群，還有許多其他客戶用于AI應用？同樣的觀點也適用于NetApp、Pure和WEKA。顯然，許多客戶，包括Nvidia，都在使用文件系統(tǒng)（無論是平行的還是非平行的）進行AI訓練。這是為什么？

杰夫·丹沃斯（Jeff Denworth）：這不是非黑即白的問題，而是逐步演進的。歷史上，所有AI訓練框架都需要POSIX/文件接口。只有開發(fā)自己框架的公司才會考慮使用對象存儲，而這種情況僅限于頂尖的公司。

格倫·洛克伍德（Glenn Lockwood）在這里闡述了一個例子。

許多客戶仍在使用文件系統(tǒng)……我的觀點并不是它們沒有被使用，而是如今你需要多協議支持，否則僅靠文件系統(tǒng)的解決方案會導致非常糟糕的投資保護?？蚣艿难葑兯俣缺瓤蛻舻耐顿Y決策更快。客戶現在開始進行轉變，我們經常聽到他們表示，他們喜歡能夠在同一數據上同時以兩種模式工作。

別忘了，Nvidia還收購了一家對象存儲公司（SwiftStack）。這說明了很多問題。

Blocks & Files：是否有大型語言模型（LLM）僅使用直接來自對象存儲系統(tǒng)的數據進行訓練？這種能力肯定只是最近才隨著Cloudian、MinIO、Nvidia和Scality等公司在對象數據存儲方面的GPUDirect類訪問設施的進步而出現的？

杰夫·丹沃斯（Jeff Denworth）：是的。在我所知的全球排名前十的模型中：

VAST正在被用于一個非常突出的模型，僅在CoreWeave上使用VAST S3。我們還有一些其他頂尖的名字開始進行實驗。
Azure Blob正在被用于一個非常突出的模型。
Nvidia正在S3兼容存儲上訓練一個非常突出的模型。
這只是我所知道的。

Blocks & Files：VAST構建了一個專注于AI的軟件棧，即VAST數據平臺，包括基礎數據存儲、其數據目錄（DataCatalog）、數據庫（DataBase）、數據空間（DataSpace）和數據引擎（DataEngine），以實現其“思考機器”愿景，我們認為這些是必要的軟件層。然而，OpenAI的ChatGPT和其他生成式AI模型開發(fā)者已經證明，你可以擁有智能聊天機器人而無需這些軟件。給他們一個向量數據庫和文件系統(tǒng)，他們就可以完成任務?？纯碊DN、IBM、NetApp、Pure和WEKA，它們都獲得了Nvidia SuperPOD認證。

杰夫·丹沃斯（Jeff Denworth）：總是有可能集成一個解決方案；這并不意味著它是實用的或高效的。

VAST……打破了規(guī)模、事務性、安全性等方面的權衡，以提供（在我看來）AI檢索的最佳可能方法。大多數組織處理GB級數據集，認為他們有一個好的解決方案。我們設想的是一個世界，AI嵌入模型可以理解所有數據的時效性和相關性，因為數據正在被分塊和向量化……所有數據都將被向量化，數萬億個向量需要在恒定時間內可搜索，無論向量空間的大小……只有我們的架構才能做到這一點。

一個能夠管理每秒數十萬到數百萬個文件的攝取、實時處理和索引的系統(tǒng)……以及立即將所有數據更新傳播到索引，以便企業(yè)永遠不會看到過時的數據。一個不需要昂貴的基于內存的索引的系統(tǒng)，因為傳統(tǒng)的分區(qū)方法是低效的。你需要DASE（分離式存儲架構）來實現所有這些。

最后……底層數據源需要是可擴展的且企業(yè)級的……我不確定你還能從哪里得到這些，除了VAST。

Blocks & Files：ChatGPT風格的技術是否否定了VAST軟件棧的需求？

杰夫·丹沃斯（Jeff Denworth）：恰恰相反。代理應用的興起，組織在GPU時間內的計算增加了對我們技術的需求。在你考慮這個問題時，我建議你停止將AI和RAG（檢索增強生成）僅僅視為聊天機器人……未來商業(yè)的速度將不是由人類處理數據的速度決定的。Nvidia計劃在未來幾年內部署1億個代理來增強其5萬名員工的工作——所有這些代理將共同處理復雜的商業(yè)任務。你不認為這將推動傳統(tǒng)存儲和數據庫系統(tǒng)的邊界嗎？

我認為我看到的未來與你看到的非常不同。一切都將關乎規(guī)模、GPU時間和處理前所未有的數據量以思考難題的能力。你看到我的博客了嗎？

星際之門（Stargate）的宣布將是眾多公告中的第一個。Dario Amodei在Anthropic也宣布了計算能力需要擴大100倍。這不僅僅是用于訓練。系統(tǒng)二/長期思考將改變世界與數據的關系，并促使對更大數據量的需求。

Blocks & Files：VAST從零開始開發(fā)原始存儲技術，然后是類似思考機器的軟件棧。這個技術創(chuàng)意時期現在是否已經結束，從現在開始只有漸進的技術進步和業(yè)務流程的發(fā)展？未來的愿景是什么？

杰夫·丹沃斯（Jeff Denworth）：我可以自信地說，我們擁有業(yè)務中最富有創(chuàng)造力和最雄心勃勃的團隊。每一次客戶互動都為我們提供了未來十年的更多靈感……我們很幸運能夠與世界上最聰明的客戶合作。假設我們已經變得自滿、安逸和滿足，這將是一個危險的假設。

我不打算通過電子郵件來闡述我們的愿景，因為我不認為這對我們雙方都有任何好處，但也許下次我們見面時可以更多地談談未來。

Blocks & Files：你的陣列可以在C節(jié)點上運行應用程序軟件，提供計算存儲。這是否類似于將陣列變成該應用程序的服務器直接附加存儲（DAS），從而否定了共享存儲資源的基本目的？

杰夫·丹沃斯（Jeff Denworth）：跨機器共享數據訪問是我們所做的事情的核心。現代機器需要實時訪問PB到EB級數據，以獲得全局數據理解。你不能將這些數據固定在任何一臺主機上。這些功能在哪里以及如何運行只是一個打包練習……我們喜歡效率，所以我們可以盡可能地整合……但DAS與我們的思維方式完全相反。分離式存儲不僅可能，我們已經向世界證明，這是一種非常實用的方法，可以達到極端水平的數據訪問和數據處理并行性。

Blocks & Files：你如何確定計算存儲陣列中的計算資源大?。?/strong>

杰夫·丹沃斯（Jeff Denworth）：我們每天都在學習更多關于如何確定大小的知識。比如I/O負載、查詢負載、功能速度、事件通知活動、QoS管理、RAS（可靠性、可用性和可維護性）等等。

分享到

AI 存儲

nina

上一篇
開源數據庫 KWDB 入選全球開源新勢力項目排行榜前十下一篇
推進6個國家級試點建設工作！趣鏈科技瞄準數據要素市場再發(fā)力

相關推薦
 繽紛時尚三星Galaxy A56 5G用色彩哲學開啟潮流新時代
 AI大模型“內卷”時代，引爆全球存儲需求
 新一代超輕薄性能旗艦三星Galaxy S25 Edge上市開售
 2025換機指南：從Galaxy S25到Galaxy A56 5G 三星AI手機這樣選更合適
 當AI與藝術碰撞,三星藝術電視開啟破次元的沉浸視聽美學盛宴
 當折疊屏遇見生成式AI 三星Galaxy Z系列解鎖更多可能
 騰訊大模型戰(zhàn)略首次全景亮相：自研混元大模型、知識庫、智能體開發(fā)、工具箱一應俱全
 英偉達黃仁勛Computex 2025演講：AI工廠時代開啟，官宣在中國臺北建AI超算！

近期文章

“云網數智安”融合共生！亞信科技、亞信安全助力百行千業(yè)全要素轉型

OpenHarmony 5.1版本發(fā)布：開發(fā)效率躍升，加速全場景布局

鴻蒙電腦專屬權益放送，暢聽華為音樂空間音頻如臨現場

“AI賦智端云共生”中興通訊亮相2025全球人工智能終端展

Hitachi Vantara推出全新Virtual Storage Platform 360數據管理軟件解決方案，打造極簡高效體驗

熱門標簽
微軟(3776)IBM(3738)服務器(3118)英特爾(2561)云存儲(1996)云計算(1953)EMC(1605)惠普(1551)虛擬化(1525)AMD(1452)數據中心(1337)甲骨文(1284)安全(1282)軟件(1267)戴爾(1223)蘋果(1206)Windows(1175)IT(1173)AI(1163)CIO(1155)阿里云(1046)至強(1027)收購(1026)芯片(1013)病毒(1001)華為(993)HP(980)Linux(943)谷歌(937)浪潮(929)

© 2010-2025 DOIT-數據產業(yè)媒體與服務平臺
關于我們 | 廣告服務 | 加入我們 | 聯系我們

北京世紀百易網絡有限公司版權所有 | 京ICP證101168號 | 京ICP備12007866號-14 | 京公網安備 11010502032764號

感谢您访问我们的网站，您可能还对以下资源感兴趣：
国产精品一区二区av交换