美光科技亞太區(qū)解決方案架構(gòu)總監(jiān)陳詩義
以下內(nèi)容來自現(xiàn)場(chǎng)速記:
各位嘉賓早上好,非常能夠在這個(gè)大會(huì)給大家分享美光對(duì)于新的介質(zhì)的一些想法,還有這些新的介質(zhì)能夠在未來創(chuàng)造哪一些不同的應(yīng)用情景。眾所皆知現(xiàn)在最新的QLC可能是一個(gè)比較新的(閃存介質(zhì))技術(shù),它未必能夠應(yīng)用在所有應(yīng)用上,所以我今天想跟大家分享一下QLC在什么地方能夠發(fā)揮它的潛能?
首先我們先看一下我們所謂的數(shù)據(jù)經(jīng)濟(jì)。我們每天在想怎么將數(shù)以億計(jì)的互聯(lián)網(wǎng)設(shè)備連接起來,連接是大家都能做到的事情,重要的是我們?cè)趺礃幽軓倪@些數(shù)據(jù)里面拿到有益于的大家的實(shí)時(shí)數(shù)據(jù)做分析,然后最重要的是怎么在業(yè)界里面做出價(jià)值,這是非常重要的,大家每天在思考的事情。
如果從數(shù)據(jù)的海量數(shù)據(jù)來看,僅僅去年我們已經(jīng)在業(yè)界里面大家已經(jīng)制造了有2.2萬億GB的數(shù)據(jù),這是非常大的數(shù)據(jù)。大家有沒有想過這么多數(shù)據(jù)我們?cè)趺慈?yīng)用而制造價(jià)值?這也是我們今天希望探討的一部分。我們預(yù)測(cè)僅僅三年就會(huì)翻3倍,到達(dá)6.2萬億的水平,這是一個(gè)非常大的增長(zhǎng),數(shù)據(jù)越多問題就越多,我們?cè)趺慈ド朴梦覀兡壳暗募夹g(shù)?怎么去處理這些不同的數(shù)據(jù)?
我們也認(rèn)為AI是一個(gè)非常大的動(dòng)力,非常大的一個(gè)能夠改變規(guī)則的動(dòng)力。為什么?因?yàn)閿?shù)據(jù)多,我們不可能用人工去分析,人工智能肯定會(huì)是未來一個(gè)非常大的趨勢(shì)。我們能夠通過AI去分析、收集大數(shù)據(jù),從中能得到一些趨勢(shì),然后去制造一些非常巨大的市場(chǎng)價(jià)值。同時(shí)大家也有目共睹,現(xiàn)在目前語音識(shí)別已經(jīng)增長(zhǎng)的非??欤呀?jīng)進(jìn)入了主流的狀態(tài)。所以這也是為什么我們能看到AI是一個(gè)能夠改變未來的一個(gè)非常大的趨勢(shì)。
這些改變會(huì)帶來哪一種變化?
如果我們從數(shù)據(jù)中心看,我們美光公司認(rèn)為大概僅僅三年,企業(yè)在數(shù)據(jù)中心上面的金額大概會(huì)提升2.6倍左右,這主要的原因就是由AI而引起的一些變化。因?yàn)楫?dāng)你要用AI做大數(shù)據(jù)分析的時(shí)候,往往你需要非常非常高的配置。因?yàn)楝F(xiàn)在現(xiàn)行的CPU已經(jīng)有足夠的能力去做非常高的運(yùn)算,所以瓶頸還是在IO。
所以為了讓AI發(fā)揮更大的效率,我們需要增大DARM方面的配置,同時(shí)也需要增大SSD方面(的配置)。所以我們預(yù)測(cè)如果要做一個(gè)更好的AI設(shè)備,我們大概看到我們需要從現(xiàn)有的配置把DRAM翻6倍,SSD翻2倍。
從這個(gè)觀點(diǎn)來看,我們也預(yù)測(cè)在2025年那個(gè)時(shí)候能夠提供AI服務(wù)的服務(wù)器可能占比已經(jīng)要接近大概四成左右,這也是市場(chǎng)未來的趨勢(shì),所以從這個(gè)觀點(diǎn)來看,這個(gè)市場(chǎng)會(huì)怎么去變化,你怎么善用DRAM和SSD來達(dá)到更高效率的數(shù)據(jù)處理。
另外一件事情我們也觀察到,現(xiàn)在海量的數(shù)據(jù)有一個(gè)特性,就是很多數(shù)據(jù)我們主要要做的事情是怎么能很快迅速去分析,而不是重復(fù)去寫。你寫的一遍之后,就基本上不會(huì)再重寫了。你主要要做的是怎么去高速分析你現(xiàn)有的數(shù)據(jù),因?yàn)楹芏鄻I(yè)務(wù)等等都需要知道以往的數(shù)據(jù)來做下一步的決策,所以這也是一個(gè)非常有趣的事情,跟以往可能經(jīng)常要擦寫的業(yè)務(wù)已經(jīng)有了非常巨大的改變。
從以往的業(yè)務(wù)來看,我們大家都非常清楚,以前的傳統(tǒng)業(yè)務(wù)可能就寫1次就要讀4次,從我們的調(diào)研當(dāng)中發(fā)現(xiàn)AI不是這么走的。AI通過深度學(xué)習(xí)或者機(jī)器學(xué)習(xí),基本上是要靠讀取以往的數(shù)據(jù)進(jìn)行分析,比例已經(jīng)從4:1變到5000:1,意味著你以后要的配置可能不需要他們關(guān)注寫性能,所以這也是為什么我們要在這個(gè)大會(huì)上跟大家分享這些未來的改變,看看我們?cè)趺茨軌蛏朴矛F(xiàn)有的技術(shù)來把科技推到更高。
接下來大家可以看到這個(gè)介質(zhì)是非常重要的事情,我們多年前推出MLC,現(xiàn)在在市場(chǎng)上已經(jīng)沒有看到任何廠商出任何用SLC的產(chǎn)品了,主要是因?yàn)樗鼈円呀?jīng)逐漸慢慢被MLC、TLC、QLC替代了。
當(dāng)年剛剛推出的時(shí)候,MLC的擦寫次數(shù)大概有100K左右。隨著技術(shù)的發(fā)展,我們已經(jīng)不需要那么多擦寫,因?yàn)橹骺睾湍切┸浖呀?jīng)能夠善用介質(zhì)的性能,在顆粒的層面不需要做到100K擦寫的次數(shù)那么大、那么昂貴的一種做法。從這邊來看,我們?cè)黾恿耍∟AND)密度,我們擦寫的數(shù)據(jù)已經(jīng)降到大概1.5K左右,所以這也是和我們之前看到的那些數(shù)據(jù)有相關(guān)的部分,目前QLC我們定位是在1.5K左右。
QLC這個(gè)新的介質(zhì)能夠用在所有的業(yè)務(wù)上面?當(dāng)然不是所有業(yè)務(wù)都能夠用QLC。我們分析過,這個(gè)圖片(下圖)是讓大家看一下我們覺得QLC在哪一部分能夠發(fā)揮它最佳的應(yīng)用場(chǎng)景。
首先(QLC)當(dāng)然寫性能就沒有TLC或者以往的MLC那么好,不過如果我們是做順序的大快寫這是非常好的應(yīng)用場(chǎng)景,例如做視頻的串流,都是非常適合運(yùn)行在QLC上的業(yè)務(wù),或者是機(jī)器學(xué)習(xí)、AI同樣如此。
你可以看到(上圖的PPT),我們所列的幾個(gè)業(yè)務(wù)都是非常合適在QLC上面應(yīng)用的。比如說機(jī)器學(xué)習(xí)、BigData。除此以外,最下面那一行也讓大家知道,我們看到這些技術(shù)的增長(zhǎng)速度有多快。如果你從AI和實(shí)時(shí)的數(shù)據(jù)復(fù)雜這兩大塊看,它的比大概有43%左右,這是增長(zhǎng)非常快的,所以我們也希望能夠通過QLC的產(chǎn)品來解決這個(gè)問題。
換個(gè)角度我們看看整個(gè)大市場(chǎng),我們?cè)趺茨軌蛲ㄟ^新的介質(zhì)來提升大家的運(yùn)用效率?首先我們能夠提供到8TB的產(chǎn)品來滿足需求,同時(shí)在性價(jià)比也是能夠達(dá)到一個(gè)新的等級(jí),能夠讓它更有效應(yīng)用在你們的業(yè)務(wù)里面。這個(gè)業(yè)務(wù)增長(zhǎng)非常快,這是商機(jī),大家能夠共同去開拓的一些商機(jī)。如果走出來看,這個(gè)產(chǎn)業(yè)的年比增長(zhǎng)是大概28%左右,所以我們覺得QLC這時(shí)候是可以開始為大家解決產(chǎn)業(yè)面臨的那些數(shù)據(jù)處理的問題。
接下來我要跟大家分享一下QLC會(huì)不會(huì)替代TLC?以我們的分析是不會(huì)的,因?yàn)镼LC目前現(xiàn)狀是有它自己的特性,讀寫肯定沒有TLC那么快。所以我們特別找了一些適用QLC的業(yè)務(wù),所以你們從圖片可以看到,大家所熟悉的MLC從2017年開始將逐漸降低。
我們覺得QLC可能會(huì)和TLC并存,會(huì)慢慢增長(zhǎng),慢慢把MLC那部分替代。未來我們可以看到MLC、TLC、QLC和QLC為主流流,三年后QLC占比會(huì)慢慢增加,不過不會(huì)替代TLC。我們慢慢發(fā)掘QLC的潛力,把QLC的性能全部發(fā)揮出來。
下一個(gè)問題是Needs,這個(gè)圖片是跟大家講解一下我們現(xiàn)在看到的Needs的問題。早在2016年的時(shí)候,灰色的那塊比較大。
因?yàn)闃I(yè)界的轉(zhuǎn)變,我們也慢慢看到灰色的部分開始縮小了,因?yàn)闃I(yè)務(wù)基本上用不了那么大的。就等于OP一樣,可能你有時(shí)候不需要那么大的,你就把它調(diào)大之后,從你的成本來看這基本上是最好的一個(gè)決定。
所以從這個(gè)圖片大家也可以看到,基本上我們已經(jīng)看到很多業(yè)務(wù)能夠在小于1個(gè)DWPD下操作,這個(gè)已經(jīng)發(fā)展好多年了。2017年超過七成以上業(yè)務(wù),能夠使用低于1DWPD,所以希望大家能夠從這方面思考一下,到底你們現(xiàn)在業(yè)務(wù)上所定的規(guī)格是不是需要重新考慮,把規(guī)格調(diào)低一點(diǎn),以達(dá)到更高效率的閃存能力。
在美光官網(wǎng)上可以獲取一個(gè)AI的方案文檔,這是一個(gè)很傳統(tǒng)的機(jī)器學(xué)習(xí),會(huì)做一個(gè)(數(shù)據(jù))搜集和分類,這個(gè)文檔介紹了使用QLC加速機(jī)器學(xué)習(xí)的操作。如上圖所示,使用QLC的5120 SSD和機(jī)械硬盤做了一個(gè)對(duì)比,可以發(fā)現(xiàn)基本上很多時(shí)間唄節(jié)省下來。從這個(gè)圖片來看,我們得到了幾個(gè)結(jié)論。
在你們?cè)阶鲈蕉嗟臋C(jī)器學(xué)習(xí),你能夠省的時(shí)間是越多的,從僅僅9分鐘到13分鐘而已。同時(shí)如果數(shù)據(jù)越大,能夠節(jié)省的時(shí)間越多,這是因?yàn)槲覀儼堰@個(gè)大塊的數(shù)據(jù)寫到QLC上面去,我們也能夠用很快的速度把它讀出來,所以這也是為什么讓大家覺得AI是一個(gè)新的適合使用QLC的應(yīng)用場(chǎng)景。從CPU或者GPU的角度來看,我們很多時(shí)候都讓CPU、GPU在等待結(jié)果,在QLC消除IO的瓶頸后, CPU、GPU使用效率也隨之提高,這也是我們看到的一點(diǎn)。最后當(dāng)然因?yàn)檫@個(gè)QLC是基于固態(tài)硬盤,我們?cè)诠?jié)能那邊也能達(dá)到3倍,因?yàn)檫@個(gè)盤子里面我們沒有任何機(jī)械的成分在。
首先我要跟大家總結(jié)三點(diǎn)。
以上就是我演講的全部?jī)?nèi)容,謝謝大家!