“開放計算是一個非常好的平臺協(xié)作模式?!?8月10日,在北京召開的OCP China Day2022上,浪潮信息服務器產品規(guī)劃總監(jiān)陳彥靈指出,借助這個平臺,可以匯集領先的技術形成產業(yè)創(chuàng)新、產業(yè)生態(tài),行業(yè)用戶就可以非常方便地獲取這些技術帶來的改變,從而實現(xiàn)節(jié)能降耗、綠色低碳。在這個層面上,開放計算平臺還將有助于東數(shù)西算戰(zhàn)略的實現(xiàn)以及國家雙碳目標的達成。
陳彥靈認為,東數(shù)西算將現(xiàn)有數(shù)據(jù)中心的布局變得更加合理。
東數(shù)西算是將東部發(fā)達地區(qū)大量的應用轉移至西部運營成本較低的數(shù)據(jù)中心,并帶動西部經濟發(fā)展。但此舉面臨一個新的問題,即,設在西部的數(shù)據(jù)中心,在解決東部地區(qū)的應用延時會更長,因此其不適合常規(guī)的關鍵業(yè)務。為了滿足其在備份、容災以及未來元宇宙方式下成千上萬的并發(fā)應用及分層等方面的適用性,大量相關的技術創(chuàng)新及成果也在不斷更新和陸續(xù)推出中。
開放計算概念源于2011年成立的開放計算項目(Open Compute Project,OCP)基金組織,旨在成立一個能夠像軟件開放社區(qū)那樣帶來創(chuàng)新理念與創(chuàng)新設計的硬件開放社區(qū),共同推動產業(yè)的發(fā)展。
10余年的時間,開放計算得到了快速發(fā)展,業(yè)界幾乎所有的重量級企業(yè)參與其中。最新數(shù)據(jù)顯示,全球OCP社區(qū)參與者已達1.6萬人、社區(qū)成員240家,工程師超過5000人,項目數(shù)超過100個,開放計算標準服務器年銷售規(guī)模達到470萬臺,提供算力占比全球34.8%;預計到2025年,全球將有40%的服務器基于開放標準
由于開放計算、OCP逐漸從互聯(lián)網(wǎng)公司滲透拓展應用到傳統(tǒng)行業(yè),行業(yè)用戶在開放計算的市場占比將上升至21.9%。
目前在中國的OCP成員數(shù)量已經發(fā)展到數(shù)十家、社區(qū)參與者超千人、落地產品規(guī)模高達上百億,在開放計算數(shù)據(jù)中心硬件技術規(guī)范、接口協(xié)議、架構設計等多個創(chuàng)新方向做出重要貢獻,同時也推動了OCP相關技術在中國的落地。
誰來決定開放計算的方向?陳彥靈認為,答案就是用戶。超大規(guī)模數(shù)據(jù)中心客戶正在牽引著ODCC、OCP;需求決定價值,貼近行業(yè)特別是傳統(tǒng)行業(yè),才是開放計算的生命力。這也逼迫開放組織不斷自我改變。
開放的價值不止如此
開放計算主要圍繞硬件以及硬件加底層管理軟件展開,未來有可能衍生到發(fā)展側?;ヂ?lián)網(wǎng)行業(yè)已經嘗到了開放計算帶來的好處,數(shù)據(jù)中心的PUE達到1.3甚至接接近1.1,而近年來,金融、電信的采購規(guī)模也開始了躍升,但這些行業(yè)不少數(shù)據(jù)中心的PUE還在2.0左右,意味著30%的電力浪費。把領先的技術、領先的產品推廣應用到傳統(tǒng)行業(yè)任務很迫切。開放計算將幫助這些傳統(tǒng)行業(yè)降本增效,讓他們的業(yè)務運行更快更穩(wěn)、能耗和故障率變得更低,最終獲益的是廣大用戶。
后摩爾時代,以前單個CPU就能滿足各種應用的現(xiàn)象已經難以為繼,AI計算、存算一體化成為熱潮,在音視頻處理等方面,傳統(tǒng)數(shù)據(jù)中心以CPU為核心的計算能力瓶頸逐漸暴露出來,數(shù)據(jù)中心需要更強大的算力,GPU、多元算力形態(tài)應運而生。影隨算力多元化挑戰(zhàn),適應未來計算架構的變化,也是浪潮信息在努力的方向。開放計算,將有助于這一目標的實現(xiàn)。
在陳彥靈看來,不僅僅是OCP,只要是開放組織,任何單位或個人加入其中就可以共享技術資料,基于此進行開發(fā),讓這些技術普惠更多的行業(yè)企業(yè),因此,更多的組織都在陸續(xù)推出。開放組織要主導特定的方向,必須有由大量的用戶、廠商參與,以解決用戶的需求、創(chuàng)造價值和推動產業(yè)發(fā)展為目標,這也是所有開放組織的使命。
葉毓睿補充說,近幾年來,OCP逐漸稱為一個“寬進嚴出”的組織,所有參與者都可以在這個舞臺上扮演角色、分享成果,但所有的成果都需要其他成員的一致同意才能上升成為標準,而且這個標準是公開的、公平的,所有參與者都可以下載、使用和分享。
浪潮信息的開放計算經歷了三個發(fā)展階段。從2010年到2013年,主要是面向中國市場進行開放計算的探索,在國內最早研發(fā)OpenRack產品,深度參與天蝎項目,市占率達70%,產業(yè)規(guī)模第一;從2014年到2019年,浪潮信息全面擁抱開放計算,是全球唯一一家同時參與3大開放計算標準組織(ODCC、OCP、Open19)的廠商,主持和參與國內外多項開放計算頂級標準設計,生產和交付開放計算服務器百萬節(jié)點;目前浪潮信息已經進入開放計算發(fā)展的第三個階段,將繼續(xù)提升技術創(chuàng)新、產品開發(fā)以及產業(yè)引領能力,引領國內外開放計算產業(yè)持續(xù)落地,通過建標準、建生態(tài),推動數(shù)據(jù)中心高質量發(fā)展。
開放計算技術在向中小型數(shù)據(jù)中心和非互聯(lián)網(wǎng)行業(yè)推廣過程中面臨著較大困難。陳彥靈表示,這主要是由于傳統(tǒng)行業(yè)和互聯(lián)網(wǎng)行業(yè)用戶的應用模式和基礎設施能力不同導致的。對此,可以讓行業(yè)客戶把一些開放“組件”先用起來,比如OCP NIC 3.0的網(wǎng)卡、關聯(lián)的技術SAI等等,其次隨著開放計算技術的逐漸標準化,浪潮信息也會探索出一套適合傳統(tǒng)行業(yè)的標準框架,比如用標準服務器加標準機柜,來組合成一套可以滿足部分整機柜特性的產品,來幫助傳統(tǒng)企業(yè)提升算力應用的水平。
為什么達到一定體量后要做標準的制定者、在領域內擁有一定的話語權?
葉毓睿解釋說,若僅作為跟隨者,一旦新的標準出現(xiàn),原先整套的研發(fā)設計體系,包括長期積累的資源有可能就會浪費,但如果成為一個引領者,這些研發(fā)資源都可以復用,能夠降低生產成本,更快為客戶所接受。浪潮信息一直積極牽頭和參與開放計算標準的建立,這也是其服務器市場規(guī)??焖侔l(fā)展并保持領先的原因之一。
在OCP組織,浪潮信息重點開展了哪些工作?
葉毓睿舉例說,以前服務器的管理模塊和主板內嵌在一起,在計算芯片迭代時往往會受制于管理模塊。而DC-SCM(DataCenter-ready Secure Control Module)將計算和安全管理進行解耦,降低了主板的設計難度,節(jié)省了設計和驗證時間,有利于在計算層面主板的更新迭代和擴展,并且降低整機成本。浪潮信息于2021年12月加入OCP Hardware Management Module (硬件管理模塊)項目組后,參與了DC-SCM2.0規(guī)范的制定與完善,在產品研發(fā)中對DC-SCM標準進行了設計實現(xiàn),并在x86和ARM平臺實現(xiàn)了DC-SCM標準的驗證和實踐。此外,浪潮信息還積極應用DC-SCM2.0規(guī)范中的新技術方向,進一步強化數(shù)據(jù)中心安全管理體系的建設。
去年OCP峰會上,浪潮信息曾經分享過關于服務器存儲模塊振動的研究與實踐。風扇的噪音會影響硬盤讀寫性能和可靠性,為解決此問題,各個公司研發(fā)著各自的產品和技術,由于每個公司對存儲、服務器發(fā)展的目標有差異,花了兩年時間迭代出來的產品,如硬盤、主板、風扇、機箱等,組裝起來時出現(xiàn)兼容性的問題,則需要重新設計。為此,OCP成立了相關組織,組聚集了行業(yè)內的一線研發(fā)人員,共同商討對策,統(tǒng)一測量標準,開放設計經驗,以期在硬盤容量、散熱風扇并肩發(fā)展的趨勢中找到新的平衡點。浪潮信息也參與到了這個全球的標準制定過程,并積極應用實踐,不僅擁有OCP定義的3.5英寸HDDAcoustic Surrogate,而且自主設計了2.5”HDDAcoustic Surrogate,在采集振動的硬盤假體的應用中也積累了一些經驗,可以進行各種服務器、存儲機箱的噪聲和振動信號分析,結合硬盤的敏感度曲線可以在研發(fā)早期進行有效的風險評估,并輔助機箱和風扇的聲學優(yōu)化和結構動力學設計。
類似的研究還有很多,如針對多核情況下的散熱處理,CPU不帶內存但通過CXL總線做復雜擴展,甚至針對未來計算模式、算力節(jié)點的發(fā)展方向等等,浪潮信息都有在針對性研討,并且始終認定要通過標準來建設好,降低先進技術的應用門檻,普惠大眾。
目前,浪潮信息已在多個新興技術領域推動與開放計算項目的融合,促進整機柜、OAI/OAM、邊緣、存儲、網(wǎng)絡、液冷等前沿應用和技術標準化與產業(yè)化。未來,浪潮信息將繼續(xù)堅持開放、開源的技術路線,持續(xù)推動開放計算產業(yè)化,加速開源技術普惠。