謝長(zhǎng)生的演講從主流存儲(chǔ)演變的歷史視角,為聽眾盤點(diǎn)了自人類出現(xiàn)以來,各種主流存儲(chǔ)介質(zhì)及其發(fā)展軌跡。從光存儲(chǔ)到現(xiàn)在的磁存儲(chǔ),再到電存儲(chǔ)即閃存。閃存將在2020年左右成為主流,并有超過60%的信息都將存儲(chǔ)在閃存上。
他還指出,我們要正確認(rèn)識(shí)閃存成為主流存儲(chǔ)介質(zhì)即將遇到的挑戰(zhàn)和機(jī)遇,以及意識(shí)到閃存對(duì)技術(shù)架構(gòu)和軟件生態(tài)的改變。謝長(zhǎng)生建議,圍繞3D NAND芯片構(gòu)建完整的產(chǎn)業(yè)鏈,只有上下有互動(dòng),才能促進(jìn)核心技術(shù)發(fā)展,產(chǎn)學(xué)研用結(jié)合,前沿研究和技術(shù)開發(fā)結(jié)合,加強(qiáng)高校與企業(yè)的合作,建立針對(duì)閃存產(chǎn)業(yè)連的公共測(cè)試服務(wù)平臺(tái),國(guó)家標(biāo)準(zhǔn),在國(guó)際標(biāo)準(zhǔn)上取得話語權(quán),中國(guó)有機(jī)會(huì),有責(zé)任在閃存技術(shù)和產(chǎn)業(yè)上做出應(yīng)有的貢獻(xiàn)。
以下為謝長(zhǎng)生先生的演講實(shí)錄:
大家好,我來自華中科技大學(xué)信息存儲(chǔ)教育系統(tǒng)實(shí)驗(yàn)室,我們的存儲(chǔ)實(shí)驗(yàn)室有40年的歷史,是一個(gè)學(xué)術(shù)研究和人才培養(yǎng)的單位。我們研究各種存儲(chǔ)技術(shù),如光存儲(chǔ)、閃存系統(tǒng)等研究。我們這個(gè)單位有50多位老師,300多位研究生組成,是一個(gè)具備國(guó)際水準(zhǔn)的高校研究生團(tuán)隊(duì)。我們的學(xué)校坐落在武漢,另外,有一個(gè)投資240億元的閃存基地也在武漢。
今天我演講題目是“迎接主流存儲(chǔ)的閃存時(shí)代”。主流存儲(chǔ)是在變的,我們要迎接閃存時(shí)代的到來,就需要了解什么時(shí)候是主流。這也是我今天主要闡述的問題。
我們看一下這個(gè)圖,這個(gè)河流有主流也有很多分支,河水的主要流量都集中在主流部分。那么,我們先來下一個(gè)定義,那就是什么主流存儲(chǔ)建設(shè)?那就是現(xiàn)有的條件,除人腦之類,人腦使用某種存儲(chǔ)介質(zhì)保存信息的總量如果超過60%,那么這種存儲(chǔ)介質(zhì)就稱為主流存儲(chǔ)介質(zhì)?;仡櫄v史,出現(xiàn)過很多不同的主流存儲(chǔ)介質(zhì)。
最早的主流存儲(chǔ)介質(zhì)是石刻,大約出現(xiàn)在4萬年前的西班牙某個(gè)半島上,也是人類最早在石頭上留下的痕跡。在我國(guó)寧夏的大麥地,1萬多年前也有這種文字出現(xiàn),石刻是人類最具價(jià)值的研究領(lǐng)域。我曾在盧浮宮見過非常有價(jià)值的,有幾百條法律的石刻,是300年前由石頭記錄下來。中國(guó)早期的主流介質(zhì)就是竹簡(jiǎn),我們國(guó)家大概使用了800年。雖然在世界范圍內(nèi)沒有很廣泛的流行,但是對(duì)我們中國(guó)非常重要。那個(gè)時(shí)期正好是老子、荀子、屈原那個(gè)時(shí)代,正好記錄了咱們國(guó)家思想的高峰。如果沒有竹簡(jiǎn),中國(guó)最高峰時(shí)期的思想沒有辦法被記錄下來,因此竹簡(jiǎn)對(duì)我們中華民族做出了巨大貢獻(xiàn)。中華民族思想最高峰也就出現(xiàn)在這個(gè)時(shí)期,后面就沒有再出現(xiàn)。
早在5000年前的埃及就有莎草紙,古歐洲是羊皮紙,是將麻打成紙漿制成紙張,這也是中華民族對(duì)世界最大的貢獻(xiàn)。這個(gè)歷史我們稍微回顧一下,上面講石頭、紙、竹簡(jiǎn)等等,可以在上面刻字和這個(gè)是一回事,這個(gè)是用光反射。其實(shí)這就是一個(gè)光存儲(chǔ),現(xiàn)在看到的竹簡(jiǎn)主要是在白的地方、黑的地方反射不一樣,才能辨識(shí)得出來。現(xiàn)在的藍(lán)光技術(shù)也是一種技術(shù)突破,就是在最近幾年形成的,它屬于冷數(shù)據(jù)存儲(chǔ)。日本公司已經(jīng)將其產(chǎn)業(yè)化,冷數(shù)據(jù)有很大的存儲(chǔ)量,能耗低。光存儲(chǔ)這幾年有很大突破,澳大利亞斯威本大學(xué)提出突破衍射極限的超分辨光存儲(chǔ),可以把這種密度大大提高。突破衍射技術(shù)在2014年獲得諾貝爾獎(jiǎng),可以達(dá)到100TB的存儲(chǔ)容量。
第三個(gè)是英國(guó)南開普頓大學(xué),實(shí)現(xiàn)通過玻璃介質(zhì)永久保存數(shù)據(jù)。在1000度以下的實(shí)驗(yàn)環(huán)境下,可以做到信息不丟失,做這個(gè)實(shí)驗(yàn)的是我們學(xué)院的一個(gè)學(xué)生,并以此開始創(chuàng)業(yè)。
進(jìn)入數(shù)字時(shí)代以后,當(dāng)前的主流存儲(chǔ)是磁存儲(chǔ),磁存儲(chǔ)發(fā)明很早,1878年就出現(xiàn)了。1920年德國(guó)把薄鋼片用于記錄聲音進(jìn)行廣播,1956年IBM發(fā)明了第一個(gè)硬盤。實(shí)際上這個(gè)硬盤在我們個(gè)人電腦、服務(wù)器、大型數(shù)據(jù)中心中都在被大量使用。而且目前還是我們的主流存儲(chǔ),我們來看一下第一臺(tái)硬盤,是這么大一個(gè)東西容量只有5MB,今天很小的一塊硬盤已經(jīng)達(dá)到10TB容量,這是一個(gè)巨大的成就。1956-2006年,今年正好是硬盤發(fā)明60年,這個(gè)成就非常驚人。1956年是2000bit/in2,面積速度提高5億倍,“60年5億倍”這個(gè)成就是非常驚人的成就。據(jù)統(tǒng)計(jì),80%的信息目前還存放在硬盤之中,硬盤仍是當(dāng)前大數(shù)據(jù)時(shí)代的主力。2007年,諾貝爾物理學(xué)獎(jiǎng)就是因?yàn)榫薮抛栊?yīng)在硬盤中得到應(yīng)用。而現(xiàn)在,磁存儲(chǔ)已經(jīng)接近了物理極限,發(fā)展變得很艱難。面對(duì)這一問題,我們有三個(gè)解決方案:分別是能量輔助,瓦記錄和圖案化記錄。這三種技術(shù)單獨(dú)使用只能提高5倍,如果綜合使用可以提高10倍,但目前實(shí)現(xiàn)難度還很大。由于現(xiàn)在閃存發(fā)展太快,還等不到硬盤進(jìn)入這個(gè)實(shí)踐,就已經(jīng)被閃存超越了。而且,硬盤的機(jī)械延時(shí)不可消除。
下面我想為大家分享一下閃存成為主流存儲(chǔ)的三大驅(qū)動(dòng)力,首先是新的應(yīng)用已經(jīng)爆發(fā)性增長(zhǎng),這種新的應(yīng)用只能用閃存,不能用硬盤。比如我們的手機(jī)是不可能放硬盤進(jìn)去的,目前世界上已經(jīng)有40億部手機(jī),到2020年還會(huì)增加20億。5G時(shí)代已經(jīng)到來,下載視頻是非常容易的事情,那么以后5G手機(jī)下載視頻就非常容易?,F(xiàn)在手機(jī)最高容量已經(jīng)是128G,馬上就要到512G,最后到1TB。試想一下,60億手機(jī),就是6ZB。預(yù)計(jì)到2020年,全世界數(shù)據(jù)量將達(dá)到40ZB,手機(jī)就占到15%,這個(gè)應(yīng)用是完全新增出來的。
再看現(xiàn)在的智能汽車,也能達(dá)到數(shù)百萬臺(tái)的新容量。還有無人機(jī)、智能機(jī)器人、物聯(lián)網(wǎng),這些都不能用硬盤。而是被閃存行業(yè)壟斷。
第二個(gè)驅(qū)動(dòng)力是大型數(shù)據(jù)中心對(duì)性能的要求越來越高。硬盤已經(jīng)很難滿足大數(shù)據(jù)實(shí)時(shí)分析需求,更需要速度。數(shù)據(jù)中心對(duì)能耗的考慮也要求更換硬盤為固態(tài)盤。
第三個(gè)驅(qū)動(dòng)就是價(jià)格,閃存價(jià)格持續(xù)下跌。2022年左右將與磁介質(zhì)持平,并全面替代硬盤。
第一條綠線是閃存下降趨勢(shì),第二線橘色的是硬盤下降趨勢(shì),第三條藍(lán)色線是磁帶。這些下降趨勢(shì)應(yīng)該都會(huì)提前,因?yàn)殡S著工業(yè)的進(jìn)步實(shí)際上的發(fā)展會(huì)快于預(yù)期,我個(gè)人的估計(jì)是2020年左右就會(huì)持平。
性能方面,閃存每年有40%的增加,硬盤在性能方面是具有劣勢(shì)的。如果要繼續(xù)降低閃存介質(zhì)成本的話有三個(gè)途徑,制程升級(jí)、多級(jí)化、3D NAND技術(shù)。SLC、MLC、TLC、QLC技術(shù)相應(yīng)提高,價(jià)格也慢慢降低了。3D NAND技術(shù)已經(jīng)應(yīng)用于很多產(chǎn)品,實(shí)驗(yàn)室也在致力于128層堆疊的研究。
目前幾大主流廠商,如三星、東芝、海力士、美光。三星從2013年逐漸開始?jí)汛?,現(xiàn)在到64層,多級(jí)是TLC、現(xiàn)在是QLC馬上要出3D,價(jià)格就會(huì)下降很多。
下面我想跟各位分享一下閃存時(shí)代的技術(shù)挑戰(zhàn)和機(jī)遇。第一個(gè)問題是存儲(chǔ)顆粒層次,這個(gè)層次除了剛才說的三個(gè)措施以外,還需要很多的經(jīng)驗(yàn)積累,我們的實(shí)驗(yàn)室曾測(cè)試過幾個(gè)不同廠家的顆粒,其顆粒內(nèi)部每個(gè)塊的性能都是有差異的。
第二個(gè)是固態(tài)盤控制器層次,關(guān)鍵是控制器的設(shè)計(jì),這個(gè)控制器的設(shè)計(jì)其實(shí)是一個(gè)非常復(fù)雜的事情,是一個(gè)需要?jiǎng)雍芏嗄X筋的事情。雖然從性價(jià)比來看,閃存顆粒是一個(gè)非常理想的存儲(chǔ)介質(zhì),但其存儲(chǔ)原理并不是一個(gè)簡(jiǎn)潔優(yōu)美的過程。因此,如果沒有很好的控制器設(shè)計(jì)彌補(bǔ)原理上缺陷,數(shù)據(jù)存儲(chǔ)將是不可靠的。
控制器設(shè)計(jì)是一個(gè)極具挑戰(zhàn)的工作,第一是介質(zhì)管理/信號(hào)處理問題,解決顆粒的原理導(dǎo)致的耐磨性和耐久性問題。第二個(gè)是糾錯(cuò)能力強(qiáng)的ECC算法,工藝越先進(jìn),誤碼率越高,需要更強(qiáng)大的糾錯(cuò)編碼,解決數(shù)據(jù)存儲(chǔ)的可靠性問題。
有一些數(shù)據(jù)放置策略、管理調(diào)度算法研究與設(shè)計(jì),解決與放大、性能抖動(dòng)等問題。
我們測(cè)試過一些產(chǎn)品,具體過程是這樣的,先把盤寫滿,新盤的時(shí)候大家看不出來,但是寫滿的時(shí)候,只要垃圾回收一開始運(yùn)作,就可以看出差別。慢慢有很多新的抖動(dòng),到這里下來,有時(shí)候下降的很快,很多時(shí)候資源占用下降很厲害。如果設(shè)計(jì)的好,這個(gè)性能下降就會(huì)很明顯。還有一些廠商設(shè)計(jì)的產(chǎn)品,這個(gè)延遲時(shí)間小于100微秒,有的甚至到毫秒。還有很多細(xì)節(jié),如果這邊是11和10的時(shí)候,這時(shí)候?qū)懙木幋a也有很大的影響,這個(gè)細(xì)節(jié)實(shí)際是我們需要注意的。
第三個(gè)挑戰(zhàn)是全閃存陣列層面。我們會(huì)關(guān)注硬盤和固態(tài)硬盤的差別,陣列軟硬件設(shè)計(jì)需要充分考慮閃存介質(zhì)特征。由于固態(tài)盤的失效預(yù)測(cè)比硬盤準(zhǔn)確得多,可以采用預(yù)警遷移技術(shù),使陣列的數(shù)據(jù)在失效前轉(zhuǎn)移到新的盤上或新的塊上,從損壞重構(gòu)的模式變到預(yù)警遷移模式,會(huì)大大提高盤陣的可用性。再一個(gè)把計(jì)算放到閃存里面,這個(gè)可以克服瓶頸。
軟件層面來看,傳統(tǒng)的系統(tǒng)軟件如操作系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)都是根據(jù)磁盤的特性設(shè)計(jì)的,改用固態(tài)盤后,特性很多都不一樣了,需要針對(duì)固態(tài)盤重新設(shè)計(jì),否則會(huì)浪費(fèi)固態(tài)盤的性能,有時(shí)還會(huì)帶來負(fù)面的影響。硬盤時(shí)代,協(xié)議棧的開銷與機(jī)械延遲開銷相比可以忽略,而閃存時(shí)代,協(xié)議棧的開銷就顯得比例過大,開發(fā)輕量級(jí)協(xié)議棧就顯得非常必要。
最后,我想講一下中國(guó)的閃存其實(shí)是有很大機(jī)會(huì)的,硬盤時(shí)期的機(jī)會(huì)已經(jīng)錯(cuò)過,閃存時(shí)代機(jī)會(huì)很大,因?yàn)榧呻娐?、半?dǎo)體、軟件、硬件經(jīng)過長(zhǎng)時(shí)間的積累已經(jīng)非常不錯(cuò),特別是在陣列方面已經(jīng)有十幾年的經(jīng)驗(yàn)積累。應(yīng)該說這個(gè)基礎(chǔ)比較好了,缺的是閃存顆粒,現(xiàn)在中國(guó)的國(guó)力,使我們有能力投資閃存顆粒制造企業(yè)?,F(xiàn)在武漢新芯和長(zhǎng)江存儲(chǔ)數(shù)百億美金的投入就是典型的案例,如果運(yùn)營(yíng)得當(dāng),有可能會(huì)成為世界第五家閃存芯片制造巨頭之一。閃存顆粒的國(guó)產(chǎn)化將刺激下游產(chǎn)業(yè)的大發(fā)展,我們建議圍繞芯片來部署全閃存產(chǎn)業(yè)鏈?,F(xiàn)在芯片出來,我們要根據(jù)它定制控制器,設(shè)計(jì)我們的全產(chǎn)業(yè)鏈,設(shè)計(jì)我們的數(shù)據(jù)中心,這樣我們就可以把這個(gè)產(chǎn)業(yè)鏈建立起來。
還有公共平臺(tái)的建設(shè),比如測(cè)試平臺(tái)。我們這個(gè)單位希望為行業(yè)做一個(gè)公正性的第三方測(cè)試中心,可以為各個(gè)廠商的不同的設(shè)備和陣列做一個(gè)評(píng)測(cè)。