加速加速,超低延遲的對(duì)象存儲(chǔ)來(lái)了!

Amazon S3  Express One Zone是一款性能加強(qiáng)版的S3對(duì)象存儲(chǔ),性能最多能達(dá)到標(biāo)準(zhǔn)版S3的十倍,每秒能夠處理數(shù)十萬(wàn)次請(qǐng)求(具體數(shù)值暫未知),并始終保持幾毫秒的延遲。

它主要面向延遲敏感型工作負(fù)載,比如金融交易分析,實(shí)時(shí)廣告推薦,欺詐檢測(cè),機(jī)器學(xué)習(xí)訓(xùn)練等場(chǎng)景,這些場(chǎng)景經(jīng)常需要在短時(shí)間內(nèi)發(fā)起數(shù)百萬(wàn)次的數(shù)據(jù)訪問(wèn),并且延遲要求還很高。

在以前,為了提供這樣的性能,用戶需要把數(shù)據(jù)從S3挪到一些緩存加速解決方案里。然鵝,此時(shí)用戶就需要管理多個(gè)存儲(chǔ)基礎(chǔ)架構(gòu),事情會(huì)變復(fù)雜。

而現(xiàn)在,有了Amazon S3 Express One Zone。

實(shí)際上,它用了專用硬件和軟件來(lái)加速,它存放在單個(gè)可用區(qū)里,用戶可以手動(dòng)選擇將熱數(shù)據(jù)放在離高性能算力(包括EC2、ECS和EKS)特別近的地方,從而更好地降低延遲。

我記得亞馬遜云科技在2019年的時(shí)候,收購(gòu)了全閃存初創(chuàng)公司E8,然后,就再也沒(méi)聽(tīng)到關(guān)于E8的消息了。至于這次是不是用了E8的技術(shù)。你猜!?

低延遲提高了小對(duì)象的性能表現(xiàn)

得益于低延遲的特性,Amazon S3 Express One Zone處理小對(duì)象的性能表現(xiàn)大幅提高。

通常,對(duì)象存儲(chǔ)在處理大量小文件時(shí)的表現(xiàn)可能不如其他存儲(chǔ)系統(tǒng),頻繁地讀取和寫(xiě)入大量小文件會(huì)導(dǎo)致存儲(chǔ)系統(tǒng)性能下降。

這是因?yàn)椋瑢?duì)象存儲(chǔ)系統(tǒng)在處理每個(gè)對(duì)象的時(shí)候,要處理元數(shù)據(jù)時(shí)都有一定的延遲開(kāi)銷。另外,讀或者寫(xiě)一個(gè)對(duì)象也需要一定的時(shí)間。

如果對(duì)象的個(gè)頭比較小,那么,基礎(chǔ)的延遲開(kāi)銷占整個(gè)過(guò)程的比例就更高,系統(tǒng)開(kāi)銷占比會(huì)更高,這時(shí)候的讀寫(xiě)帶寬也比較低。

而當(dāng)對(duì)象個(gè)頭比較大的時(shí)候,整個(gè)讀寫(xiě)過(guò)程的大部分時(shí)間都在傳輸數(shù)據(jù),開(kāi)銷的比例就更少,讀寫(xiě)帶寬就會(huì)比較高。

所以,當(dāng)系統(tǒng)延遲比較低的時(shí)候,小型對(duì)象受益明顯,性能相比于標(biāo)準(zhǔn)版的S3,最高能提高十倍。

低延遲的S3能幫助用戶降低成本

更高性能層級(jí)的S3對(duì)象存儲(chǔ)通常意味著更高的成本(文末有價(jià)格信息),但實(shí)際上,亞馬遜云科技想說(shuō)的是,它能省錢(qián)!

當(dāng)用戶使用突發(fā)實(shí)例和按需實(shí)例時(shí),如果搭配延遲極低的S3存儲(chǔ),就能更快處理完任務(wù),就能盡早釋放這些計(jì)算資源,從而降低成本。

沒(méi)錯(cuò),這里省的不是存儲(chǔ)的成本,而是云主機(jī)的成本。

當(dāng)在面對(duì)數(shù)據(jù)密集型工作負(fù)載時(shí),整個(gè)系統(tǒng)的運(yùn)行時(shí)間會(huì)大幅縮短,特別是那些需要成百上千個(gè)機(jī)器一起干活兒的時(shí)候,效果會(huì)更明顯,能讓成本降低很多。

Adam分享了Pinterest的案例,其中,寫(xiě)速度提高了10倍,而整體成本降低了40%。

始于2006年的Amazon S3改變了人們消費(fèi)和使用存儲(chǔ)的方式,隨時(shí)隨地存取任意數(shù)量的數(shù)據(jù)的能力。

方便是真方便,貴也是真的貴,為了降低成本,亞馬遜云科技前后有很多操作。

比如,后來(lái)發(fā)布成本更低的歸檔存儲(chǔ)Amazon S3 Deep Archive,成本降到了每GB不到1美分的水平。

后來(lái),隨著Amazon S3層數(shù)的增多,后來(lái)又推出了Amazon S3 Intelligent Tiering,智能分層技術(shù),自動(dòng)幫用戶在層與層之間遷移數(shù)據(jù)。

Adam表示,自發(fā)布智能分層以來(lái),已經(jīng)幫助用戶省下了超過(guò)20億美元,數(shù)據(jù)非??捎^。

Amazon S3 Express One Zone的一些特別的地方

Amazon S3 Express One Zone支持常見(jiàn)的S3 API函數(shù),也支持一系列的S3都有的功能。

但跟別的S3不同的是,它有全新的桶類型(目錄桶-Directory Bucket),全新的認(rèn)證模型,還有新的桶命名規(guī)則。

上圖是Jeff Bar在博客里分享的一張圖,它能把數(shù)據(jù)從某個(gè)已有的S3桶里放到新創(chuàng)建的,Amazon S3 Express One Zone的目錄桶里。

點(diǎn)確定,之后,就會(huì)自己進(jìn)行批處理操作,把數(shù)據(jù)復(fù)制到高性能的桶里。

目前,Amazon SageMaker Model Training, Amazon Athena, Amazon EMR以及AWS Glue Data Catalog 都支持使用Amazon S3 Express One Zone。

目前,US East (N. Virginia), US West (Oregon), Asia Pacific (Tokyo), 以及 Europe (Stockholm) 這幾個(gè)區(qū)可用,中國(guó)區(qū)不能用。

價(jià)格方面,雖然數(shù)據(jù)只放在一個(gè)可用區(qū)里,但是價(jià)格卻比標(biāo)準(zhǔn)的S3貴了不少(0.16?vs?0.023),畢竟性能高,貴點(diǎn)也行,是不是?況且數(shù)據(jù)訪問(wèn)成本比標(biāo)準(zhǔn)版S3低50%呢!

最后要注意,它只在單個(gè)可用區(qū)里存著,如果單個(gè)可用區(qū)出問(wèn)題了,數(shù)據(jù)可能就丟了。

分享到

zhupb

相關(guān)推薦