浪潮 發(fā)表于:14年07月23日 00:00 [來(lái)稿] DOIT.com.cn
新的集群讓?xiě)?yīng)用的運(yùn)算時(shí)間縮短了1/10,這對(duì)整體研發(fā)效率的提升作用是顯而易見(jiàn)的,讓我們能夠更加專注于對(duì)航空、航天、航海理論的研究和更多研究模型的建立。同時(shí),浪潮視我們?nèi)鏟artner的感覺(jué),也確實(shí)幫助我們解決了大量的應(yīng)用問(wèn)題。
——西北工業(yè)大學(xué)網(wǎng)絡(luò)中心負(fù)責(zé)人
西北工業(yè)大學(xué)是我國(guó)唯一一所以發(fā)展航空、航天、航海工程教育和科學(xué)研究為特色的研究型、多學(xué)科和開(kāi)放式的科學(xué)技術(shù)大學(xué),在三航的高性能計(jì)算領(lǐng)域承擔(dān)了多項(xiàng)國(guó)家自然科學(xué)基金重點(diǎn)課題,如大型航空整體結(jié)構(gòu)軟件變型機(jī)理及精度保障技術(shù)、空天飛行器材料與結(jié)構(gòu)的性能評(píng)價(jià)及關(guān)鍵理論研究、材料與制品性能預(yù)測(cè)的多尺度模型與計(jì)算方法等。
又快又準(zhǔn)的雙重挑戰(zhàn)
航空、航天、航海領(lǐng)域的很多研究都離不開(kāi)超級(jí)計(jì)算機(jī),如飛行器材料篩選、外觀設(shè)計(jì)、飛行安全性預(yù)測(cè)、發(fā)動(dòng)機(jī)機(jī)艙燃燒模擬、宇宙飛船所在的外太空分子模擬等。三航領(lǐng)域?qū)Τ?jí)計(jì)算機(jī)的要求非常高,不僅要求計(jì)算效率要足夠快、更重要的是要求計(jì)算出來(lái)的數(shù)據(jù)絕對(duì)可靠和精準(zhǔn),否則一個(gè)小小的偏差則有可能在實(shí)際制作中損失大量的經(jīng)費(fèi)。
西北工業(yè)大學(xué)計(jì)劃興建一套高性能計(jì)算集群,主要用于西工大航空、航天、航海、材料、機(jī)電等學(xué)科領(lǐng)域的材料計(jì)算、結(jié)構(gòu)計(jì)算、流體計(jì)算、電磁計(jì)算、分子動(dòng)力學(xué)計(jì)算、有限元計(jì)算等方面,并承擔(dān)西北工業(yè)大學(xué)Chinagrid教學(xué)科研平臺(tái)的一些任務(wù)。
新瓶如何裝舊酒?
西北工業(yè)大學(xué)原有的高性能計(jì)算集群上已運(yùn)行了多個(gè)三航應(yīng)用程序,如何將這些既有的應(yīng)用順暢的遷移到新的集群之中,是迫切需要解決的問(wèn)題。如西北工業(yè)大學(xué)的材料云管理系統(tǒng),用戶主要通過(guò)該系統(tǒng)進(jìn)行計(jì)算任務(wù)的提交和管理工作,為了方便用戶使用新集群,需要把新集群的管理系統(tǒng)ClusterEngine和原有系統(tǒng)進(jìn)行整合。但是ClusterEngine和西北工大材料云系統(tǒng)的開(kāi)發(fā)語(yǔ)言和框架完全不同,整合難度和工作量非常大。
針對(duì)三航應(yīng)用的特點(diǎn),浪潮為西北工業(yè)大學(xué)設(shè)計(jì)構(gòu)建了峰值計(jì)算性能達(dá)80萬(wàn)億次的超級(jí)計(jì)算機(jī)系統(tǒng),在國(guó)內(nèi)高校和三航應(yīng)用領(lǐng)域處于領(lǐng)先地位。該集群具有計(jì)算性能優(yōu)越、功耗控制領(lǐng)先、監(jiān)控管理系統(tǒng)方便易用、系統(tǒng)開(kāi)放易于擴(kuò)展、服務(wù)體系完善等特點(diǎn)。
首先,系統(tǒng)采用性能強(qiáng)勁的Intel Sandybridge E5-2670處理器,CPU總體理論計(jì)算峰值高達(dá)53TFlops;系統(tǒng)存儲(chǔ)總?cè)萘?19TB,分為并行存儲(chǔ)系統(tǒng)179TB,光纖存儲(chǔ)系統(tǒng)40TB;另外,考慮到節(jié)能、空間、擴(kuò)展、維護(hù)等因素,浪潮選用了高密度刀片服務(wù)器作為計(jì)算服務(wù)器組;在網(wǎng)絡(luò)方面采用Mellanox Infiniband 高速網(wǎng)絡(luò)組成胖樹(shù)架構(gòu)的計(jì)算網(wǎng)絡(luò),保障全線速互聯(lián);并且為了更好的協(xié)助用戶提升新架構(gòu)應(yīng)用水平與能力,浪潮配置了最新Kepler K20 GPU加速節(jié)點(diǎn)。整體項(xiàng)目中采用了浪潮高擴(kuò)展性并行存儲(chǔ)系統(tǒng)TSExaStor,具有更高的帶寬、更強(qiáng)的穩(wěn)定性、更友好的界面和更多的備份策略,并且配置了一套IPMI網(wǎng)絡(luò),便于管理員的帶外管理。
軟硬一體化服務(wù)提升科研效率
為了讓客戶盡快使用集群,現(xiàn)場(chǎng)實(shí)施工程師和后臺(tái)研發(fā)工程師從客戶處要來(lái)資料熟悉材料云的實(shí)現(xiàn)方式,經(jīng)過(guò)一周的努力,把ClusterEngine的主要模塊進(jìn)行了移植,通過(guò)材料云管理系統(tǒng)可以無(wú)縫的對(duì)新集群進(jìn)行管理和任務(wù)提交。
新的高性能計(jì)算集群進(jìn)一步縮短了三航應(yīng)用的運(yùn)算時(shí)間,縮短了大約1/10左右的研發(fā)時(shí)間。同時(shí),浪潮也深入?yún)⑴c到三航領(lǐng)域的高性能計(jì)算管理軟件的開(kāi)發(fā)和應(yīng)用軟件開(kāi)發(fā)。目前,雙方共同開(kāi)發(fā)的面向三航的ClusterEngine高性能計(jì)算服務(wù)平臺(tái)已獲得了顯著的成果。
同時(shí),西北工業(yè)大學(xué)之前使用了多個(gè)商用軟件,這些軟件按照使用的license數(shù)量進(jìn)行計(jì)費(fèi)。為提高浮動(dòng) license的使用效率,西工大與浪潮合作開(kāi)發(fā)了浮動(dòng) license調(diào)度系統(tǒng),該系統(tǒng)可以自動(dòng)調(diào)度 license,提高了浮動(dòng) license的使用效率,加快了科研進(jìn)度。
在異構(gòu)應(yīng)用研究領(lǐng)域,雙方共同開(kāi)展基于GPU、MIC平臺(tái)的計(jì)算流體力學(xué)應(yīng)用優(yōu)化也取得了豐碩成果,其中基于MIC平臺(tái)的計(jì)算流體力學(xué)應(yīng)用優(yōu)化算法成為2012年IDF12大會(huì)的唯一MIC展示案例。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.