??????????????國(guó)鑫(Gooxi)研發(fā)部總監(jiān)唐斌
唐斌以BAT的天蝎計(jì)劃為背景引出模塊化存儲(chǔ)的概念與特點(diǎn),并集中介紹了國(guó)鑫模塊化產(chǎn)品的核心優(yōu)勢(shì)。他表示,模塊化是服務(wù)器未來(lái)的發(fā)展之路,存儲(chǔ)和服務(wù)器對(duì)國(guó)鑫而言始終是融合的。
以下為演講實(shí)錄:
我今天的演講主題聚焦在存儲(chǔ)硬件領(lǐng)域。作為國(guó)內(nèi)唯一一家致力于存儲(chǔ)產(chǎn)品研發(fā)、生產(chǎn)和制造ODM的公司,國(guó)鑫根據(jù)客戶需要量身定制出的產(chǎn)品和設(shè)備??v觀這些年的存儲(chǔ)產(chǎn)品,特別是存儲(chǔ)介質(zhì)的變化很大。存儲(chǔ)軟件也發(fā)生了很大的變化,包括云存儲(chǔ)、大數(shù)據(jù)、分布式操作系統(tǒng)等等。
分布式架構(gòu)使得存儲(chǔ)系統(tǒng)不再依賴于原來(lái)這些非常專用的特殊存儲(chǔ)硬件,可以借助通用的X86存儲(chǔ)服務(wù)器實(shí)現(xiàn)高可靠和高性能。我們希望產(chǎn)品具備彈性可伸縮的特性,希望產(chǎn)品能得到加倍的維護(hù),產(chǎn)品數(shù)據(jù)中心能具有高密度、低功耗的特點(diǎn),應(yīng)用這些變化我們推出了模塊化這個(gè)概念。應(yīng)對(duì)剛才講到這些新需求,我們硬件形態(tài)發(fā)生了變革。
進(jìn)入主題之前,借助百度、騰訊、阿里天蝎計(jì)劃說(shuō)明什么是模塊化,天蝎是集中供電、集中散熱、供電管理是他們的精髓,實(shí)現(xiàn)資源的解耦。我不管上層應(yīng)用怎樣,在我們底層硬件實(shí)現(xiàn)層面,實(shí)際上我認(rèn)為有三個(gè)集中是來(lái)自于模塊化的。首先我們看到集中散熱,無(wú)論是存儲(chǔ)也好,服務(wù)器也好,風(fēng)扇是放在每個(gè)電機(jī)里面,天蝎計(jì)劃把單個(gè)風(fēng)扇抽離出來(lái),集中散熱減少風(fēng)扇數(shù)量,同時(shí)節(jié)約能耗。
集中供電,原來(lái)每個(gè)服務(wù)器也好,存儲(chǔ)也好,需要用到42×2就是84個(gè)電源模塊,集中抽里出來(lái)建成集中供電模組,在大幅度降低硬件采購(gòu)?fù)瑫r(shí),節(jié)約能耗。集中管理,使得用戶人員面對(duì)不是一臺(tái)單獨(dú)服務(wù)器和存儲(chǔ),而是一個(gè)機(jī)柜,管理力度變了,這些都是模塊化的部件。所以模塊化造就天蝎的精髓。
在很多我們傳統(tǒng)高大上產(chǎn)品里面,到處都是模塊化的身影,包括剛才提到天蝎OCP、刀片服務(wù)器、通信產(chǎn)品、一體機(jī)以及高端磁盤(pán)陣列等等。作為國(guó)鑫,我們想,為什么不能再應(yīng)用云存儲(chǔ),對(duì)于通用存儲(chǔ)需要,做得更親民化,讓普通存儲(chǔ)和應(yīng)用里面有模塊化東西。把模塊化運(yùn)用到通用的普通機(jī)架服務(wù)器里面。我們經(jīng)過(guò)這幾年努力,造就一大批的模塊化產(chǎn)品線,包括高密度、計(jì)算型、模塊化存儲(chǔ)等等一系列產(chǎn)品。
首先,模塊化服務(wù)器,這是一款刀片式,非常適合于介入,做一些虛擬化應(yīng)用,這是一款高密度刀片1U里面放3個(gè)節(jié)點(diǎn),2U里面放6個(gè)節(jié)點(diǎn),3U里面放12節(jié)點(diǎn)的機(jī)架高密度服務(wù)器。通過(guò)應(yīng)用靈活搭配低功耗處理器,可靈活選擇Xeon-D,E3 v3/v4/v5和E5 v3/v4計(jì)算節(jié)點(diǎn),根據(jù)我們需要彈性選擇不同的刀片,適用我們的應(yīng)用,甚至混搭。集中散熱模塊,冗余電源集中供電,熱插拔設(shè)計(jì),所有模塊,包括計(jì)算機(jī)節(jié)點(diǎn),風(fēng)扇等等。
?第二個(gè),模塊化服務(wù)器,就是雙子星和四子星產(chǎn)品,在超融合里面很適用。實(shí)際上把模塊化這些理念發(fā)揮到極致,我們整個(gè)設(shè)計(jì)架構(gòu)中沒(méi)有任何線,所以借助這種模塊化設(shè)計(jì)很靈活更換,能夠升級(jí)。當(dāng)我們需要不同硬盤(pán)搭配規(guī)格的時(shí)候,主板背板不需要改編,換一塊側(cè)板就可以了,可匹配不同的硬盤(pán)規(guī)格。這個(gè)設(shè)計(jì)中,需要特別指出應(yīng)對(duì)現(xiàn)在NVME需求,我們所有產(chǎn)品推出規(guī)格,8639的規(guī)格,是可以支持可預(yù)見(jiàn)熱插拔8639。非常適合高性能預(yù)算,OITP等等的應(yīng)用。
有朋友說(shuō)這里面硬盤(pán)可能數(shù)量不夠多,一刀6個(gè)硬盤(pán),我存儲(chǔ)需要更多的硬盤(pán),希望單臺(tái)計(jì)算能力不會(huì)下降,沒(méi)有問(wèn)題,我們同樣有模塊化服務(wù)器。雙路機(jī)架式產(chǎn)品,從1U到4U機(jī)型都可以,主板控制器無(wú)線,熱插拔。支持NVME,完全兼容SFF8639協(xié)議,6倍與SATA SSD的性能。
有朋友說(shuō),處理能力很強(qiáng),是偏向于計(jì)算一些,當(dāng)然我的產(chǎn)品是計(jì)算和存儲(chǔ)并重。存儲(chǔ)容量更大一些解決方案有沒(méi)有?后面將介紹我們純粹的存儲(chǔ)產(chǎn)品。首先單路機(jī)架式,跟雙路本質(zhì)上差不多,我很輕松把雙路模塊變成單路模塊,實(shí)現(xiàn)這種架構(gòu),機(jī)箱只有150毫米的深度。主板控制器無(wú)線纜,熱插拔,支持多級(jí)JBOD級(jí)聯(lián)。在設(shè)計(jì)中,為了幫客戶實(shí)現(xiàn)多級(jí)JBOD的級(jí)聯(lián),設(shè)計(jì)一些芯片,這些芯片類(lèi)似于中間器,把這些信號(hào)整合放大,通過(guò)這個(gè)信號(hào)傳輸?shù)奖嘲?,擴(kuò)展到所有硬盤(pán)。通過(guò)這樣的技術(shù),很好地支持主柜的多個(gè)JBOD方案。
?1U12,2U24和4U60,這是我們高密度存儲(chǔ)產(chǎn)品,1U里面可以放12個(gè)3.5寸大盤(pán),所有部件均可插拔,易于維護(hù),包括硬盤(pán)、主板、電源、系統(tǒng)盤(pán)等。3.5硬盤(pán)模塊化抽屜式設(shè)計(jì),每個(gè)硬盤(pán)均可以不下電情況下,從機(jī)箱中抽出。最后一個(gè)系列模塊化產(chǎn)品就是雙控磁盤(pán)陣列,這個(gè)是應(yīng)很多客戶要求開(kāi)發(fā)這個(gè)產(chǎn)品,很多客戶說(shuō)能選的硬件很少,能不能做一個(gè)更親民產(chǎn)品,我們應(yīng)這個(gè)需求做了這樣一個(gè)雙控磁盤(pán)陣列。
其實(shí)模塊化雙控存儲(chǔ)把模塊化發(fā)揮到登峰造極之作,2U12、2U24、3U16、4U24的雙控主機(jī)和JBOD全系列機(jī)型??刂破髂K熱插拔,無(wú)線纜設(shè)計(jì)。對(duì)于主機(jī)接口模塊化的設(shè)計(jì),有10GB、1GB,ISCSI和8GB/16GB? FC可選。磁盤(pán)SAS模塊化設(shè)計(jì),PMC/LSI,12GB? SAS或NVME可選。所以模塊化好處非常好,但是給我們?cè)O(shè)計(jì)帶來(lái)很大的挑戰(zhàn)。
模塊化帶來(lái)散熱的挑戰(zhàn),傳統(tǒng)設(shè)計(jì)中每個(gè)刀片都有自己的散熱風(fēng)扇,這樣風(fēng)扇散熱效果最好,為了實(shí)現(xiàn)模塊化必須把風(fēng)扇放在后面,風(fēng)道更加不順,如何平衡這個(gè)特點(diǎn),實(shí)際上給散熱帶來(lái)極大挑戰(zhàn)。我們充分利用熱仿真工具,到底風(fēng)道問(wèn)題,還是開(kāi)孔率問(wèn)題,還是散熱器本身問(wèn)題等等,解決散熱中帶來(lái)的方方面面問(wèn)題。包括散熱器用最好的VC材質(zhì),很好但是成本會(huì)上去,銅的又很重,這里我們花了很多心思。
第二個(gè)挑戰(zhàn),信號(hào)完整性的挑戰(zhàn),模塊化設(shè)計(jì)中傳統(tǒng)服務(wù)器我們通過(guò)KP線鏈接,損耗比較小,現(xiàn)在為了實(shí)現(xiàn)熱插拔,可維護(hù)方便性,這個(gè)給我們帶來(lái)信號(hào)傳輸問(wèn)題,信號(hào)衰減問(wèn)題。這個(gè)時(shí)候我們最多走13英寸,怎么解決這個(gè)問(wèn)題,可能歸結(jié)到磁盤(pán)和背板疊層結(jié)構(gòu)等問(wèn)題,從而找到原因在于芯片,電量導(dǎo)致,還是鏈接器導(dǎo)致,最后找增加了一個(gè)Re? Timer? 芯片,使得信號(hào)通過(guò)主板發(fā)出來(lái)以后,通過(guò)背板傳輸。
最后,大家有很多存儲(chǔ)軟件硬件,大家關(guān)注到一點(diǎn),數(shù)據(jù)可靠性和一致性問(wèn)題,雙控磁盤(pán)跟高端存儲(chǔ)沒(méi)有問(wèn)題,高端存儲(chǔ)有EPS。在我們軟件定義存儲(chǔ)借用普遍X86幫助下,他是沒(méi)有BBU。借助這個(gè)BBU模塊,在外部AC市電掉電后,提供長(zhǎng)達(dá)6到12分鐘以上的持續(xù)供電保護(hù)。模塊化是我們認(rèn)為的服務(wù)器未來(lái)發(fā)展之路,存儲(chǔ)和服務(wù)器對(duì)我們來(lái)說(shuō)是融合的。國(guó)鑫致力于成為模塊化服務(wù)器的領(lǐng)導(dǎo)者,謝謝大家!