過去十多年以來,國內存儲市場環(huán)境發(fā)生了很大變化。一方面受政策導向影響,國際廠商發(fā)展受限。另一方面,國內幾家存儲公司技術產品實力不斷提升。如果沒有特別之處,新來的國際巨頭很難在國內市場上立足。

Hammerspace顯然是有備而來的

從外媒的報道中了解到,從2023年到2024年,Hammerspace的收入增長了10倍。在2022年,該公司也宣布其收入相較于2021年增長了200%。

在2024年,Hammerspace的客戶規(guī)模增長了32%,并且總收入留存率 (GRR) 超過 95%。這表明,Hammerspace的用戶滿意度驚人地高。

不僅如此,用戶還用真金白銀為Hammerspace投票。Hammerspace的凈收入留存率 (NRR) 超過 330%,現(xiàn)有用戶為Hammerspace貢獻了很多收入。

在 2024 年,Hammerspace 將員工人數(shù)增加了 75%。不久前,宣布將在亞洲開展業(yè)務,將在中國、韓國、日本、新加坡和印度市場發(fā)力。在中國市場上,將與北京驛心科技合作,提供全新的存儲與數(shù)據(jù)編排解決方案。

Hammerspace是一家2018年成立的公司,創(chuàng)始人是大衛(wèi)·弗林 (David Flynn),他曾是Fusion-io的創(chuàng)始人,F(xiàn)usion-io是最早將NAND閃存設備直接連接到PCIe總線的公司之一,這家公司在2014年被SanDisk(閃迪)收購。

大衛(wèi)·弗林在做 Fusion-io CEO之前,曾是 Fusion-io 的首席技術官,是不折不扣的技術專家,他在Web瀏覽器技術、移動設備管理、網絡交換和分布式存儲系統(tǒng)協(xié)議等領域擁有100多項專利。

Fusion-io的大膽創(chuàng)新對存儲行業(yè)帶來了啟發(fā),而Hammerspace也頗具創(chuàng)新性,這次創(chuàng)新的關鍵就在于,擁有一套超強的數(shù)據(jù)編排和調度能力。

Hammerspace數(shù)據(jù)編排平臺,堪稱魔法

Hammerspace提供的是基于并行文件系統(tǒng)pNFS打造的全區(qū)數(shù)據(jù)平臺(Global Data Platform)軟件,它可以用來編排存儲在本地服務器、存儲系統(tǒng)和云存儲系統(tǒng)中的非結構化數(shù)據(jù),將跨多個本地站點和多個云平臺的存儲呈現(xiàn)在一個全局命名空間當中。

當數(shù)據(jù)統(tǒng)一到這個全局數(shù)據(jù)平臺后,通過超強的自動化數(shù)據(jù)編排能力,用戶可以不用管數(shù)據(jù)在哪兒,都能更快、更高效地訪問數(shù)據(jù)。它提高了數(shù)據(jù)的流動性,解決了傳統(tǒng)存儲的數(shù)據(jù)孤島問題,幫企業(yè)更好地管理和利用數(shù)據(jù)。

這種能力達到了一種神奇的效果。Hammerspace董事總經理Molly Presley表示,這就像動畫片里的人物都有一個“超維空間”,可以從“空間”隨手拿出來各種道具,“空間”所代表的就是Hammerspace,這正是公司的名字。

這也代表了Hammerspace的理念,它希望數(shù)據(jù)存儲能像這種“超維空間”一樣靈活。無論用戶需要什么樣的數(shù)據(jù),無論數(shù)據(jù)在哪兒,都能立即從系統(tǒng)中獲取,實現(xiàn)數(shù)據(jù)的瞬時訪問,就像動畫角色隨時能從 Hammerspace 里拿出道具一樣。

Meta首席工程師認為,“Hammerspace 能做到的,簡直就是魔法”。

Hammerspace的能力可用于AIHPC等場景

Molly Presley介紹稱,AI訓練需要的是去重的數(shù)據(jù),過去積累的數(shù)據(jù)中包含大量重復信息,Hammerspace 的元數(shù)據(jù)管理功能可以確保不會創(chuàng)建重復的數(shù)據(jù)副本,把去重后的數(shù)據(jù)給到訓練系統(tǒng)可以提高AI訓練的效率。

據(jù)介紹,Meta的Llama 2和LLama 3訓練過程中就使用了Hammerspace的服務,Meta在訓練過程中使用了至少24000塊GPU卡,還有1000個存儲節(jié)點。

Molly Presley表示,Meta在AI訓練中對新技術的選擇非常謹慎,因為它希望新技術能無縫集成到現(xiàn)有架構。Hammerspace憑借其基于標準協(xié)議架構,很好地滿足了Meta 的需求,沒有破壞原有的技術體系。

此外,憑借12.5TB/s的聚合吞吐帶寬,Hammerspace為Meta提供了充足的性能,確保了GPU資源的高效利用。同時,為滿足Meta的能耗要求,Hammerspace支持Meta在能源成本較低的地方進行訓練,而不用把所有數(shù)據(jù)都進行遷移。

Hammerspace的技術不僅應用于AI訓練,還助力視覺特效行業(yè)優(yōu)化工作流程。

例如,全球知名特效公司Jellyfish Pictures依托Hammerspace的架構,實現(xiàn)了6個全球站點間的數(shù)據(jù)高效協(xié)同。通過將數(shù)據(jù)智能調度至最接近計算資源的位置,Jellyfish Pictures加快了渲染與剪輯任務,同時節(jié)省了近300萬美元的云渲染成本。

Blue Origin(藍色起源)依托Hammerspace實現(xiàn)了跨美國9個站點的數(shù)據(jù)實時流轉,提升了火箭研發(fā)、發(fā)射準備和飛行數(shù)據(jù)分析的協(xié)同效率,整體訪問速度提高80%,幫助工程師快速識別并優(yōu)化火箭性能。同時,其分級存儲策略節(jié)省了超100萬美元。

藍色起源的案例很有意思,它的創(chuàng)始人是貝索斯,而貝索斯同時也是亞馬遜的創(chuàng)始人,亞馬遜的云服務也有很多數(shù)據(jù)存儲服務,即便如此,也使用了Hammerspace的數(shù)據(jù)管理服務,藍色起源看中的是Hammerspace在多站點分布中的數(shù)據(jù)管理能力。

Hammerspace可以提供HPC并行文件系統(tǒng)的性能,可取代Lustre。

Los Alamos國家實驗室在高性能計算項目中選擇Hammerspace取代Lustre,并成功部署在1000臺NVIDIA SuperPOD集群上。Hammerspace憑借其獨特的數(shù)據(jù)管理和存儲優(yōu)化能力,滿足了實驗室對高效計算和數(shù)據(jù)訪問的需求。

HammerspaceTier 0,可大幅節(jié)省AI訓練的成本

2024年11月,Hammerspace發(fā)布了一個叫Tier 0的方案,這是一個超高速的共享存儲層。它不僅能加速數(shù)據(jù)讀寫、減少GPU空閑時間,還能節(jié)省存儲成本、能源成本以及數(shù)據(jù)中心機房空間,能大量節(jié)省訓練AI模型的成本,好處多的數(shù)不清。

傳統(tǒng)做法中,GPU服務器的本地存儲的NVMe SSD很少被利用,主要依賴外部存儲系統(tǒng),而Hammerspace的Tier 0方案,通過超強的編排調度和數(shù)據(jù)分層技術,把本地 SSD用作數(shù)據(jù)緩存層,直接為GPU提供超高速的數(shù)據(jù)訪問。

盡管GPUDirect已經非常高效了,但由于仍然需要涉及大量網絡傳輸,其效率仍不如本地NVMe SSD。

值得一提的是,Tier 0能將AI和HPC集群創(chuàng)建Checkpoint的速度提高10到100倍,這意味用戶可以提高Checkpoint的頻率,從而減少重復計算的時間。Hammerspace認為,用戶每年可以解鎖10-15%的額外的GPU計算能力。

結束語

Hammerspace要打造的是一個全局數(shù)據(jù)平臺,無論數(shù)據(jù)存儲在邊緣、異地數(shù)據(jù)中心還是云端,都能按需流動,實現(xiàn)實時訪問。該平臺在AI和HPC等高性能存儲場景的應用大有可為,也將會成為其進入中國市場的重要切入點。

分享到

zhupb

相關推薦