CAE(計算機輔助工程)技術(shù)的信任度和依賴性越來越高,CAE應(yīng)用范圍和深度在不斷拓展、延伸。單一或少量零、部件的CAE分析逐漸過渡到了系統(tǒng)級的仿真計算(如整車);單一物理場的研究演變多物理場耦合問題的研究;單一目標(biāo)的求解發(fā)展為多目標(biāo)、甚至直接探求問題機理的求解計算……工程計算的規(guī)模和復(fù)雜度正迅速膨脹,專業(yè)CAE應(yīng)用對計算機性能的要求也相應(yīng)提高。
演示截圖
CAE包括的FEA(有限元分析)和CFD(計算流體力學(xué))分析手段,在工程設(shè)計和分析中,已經(jīng)成為解決復(fù)雜的工程分析計算問題的有效途徑,現(xiàn)在從汽車到航天飛機幾乎所有的設(shè)計制造都已離不開有限元分析和計算流體力學(xué)計算,其在機械制造、材料加工、航空航天、汽車、土木建筑、電子電器,國防軍工,船舶,鐵道,石化,能源,科學(xué)研究等各個領(lǐng)域的廣泛使用已使設(shè)計水平發(fā)生了質(zhì)的飛躍。隨著計算機運行速度與存儲容量不斷地增加,CAE所能解決問題的尺度與復(fù)雜度也逐漸加大,目前已能夠為用戶解決各種復(fù)雜的工程問題。
CAE的HPC(高性能計算)應(yīng)用軟件使用最廣泛是ANSYS、Fluent、CFX(流體)以及LS-DYNA(碰撞)等,用戶使用這些軟件進行復(fù)雜和大規(guī)模問題的求解,對計算機內(nèi)存、處理器和I/O帶寬的要求非常高。早期的數(shù)值分析軟件是在大中型計算機上開發(fā)和運行的,后來又發(fā)展到以工程工作站(EWS,Engineering Work Station)上,它們都是用UNIX操作系統(tǒng),所有這些成本太高,非一般單位的工程設(shè)計人員所能擁有的,現(xiàn)在不同了,四核64位處理器普及配合微軟的高性能計算Windows系統(tǒng),將極大地降低高性能計算的應(yīng)用門檻,讓更多的工程技術(shù)和研發(fā)人員有機會享受高性能計算的強大性能,高性能計算不再是高成本的時代了。
最快的超級跑車
這是一款目前世界最快的跑車,如果你駕駛這部在機場跑道和飛機等速起跑,那是多么爽快的事情,今天我們用最快的處理器-Xeon 5365,打造一款能夠進行高性能計算的高速工作站,讓這臺機器的運算速度在工程設(shè)計發(fā)揮極致。這套配置是將當(dāng)前服務(wù)器最高規(guī)格產(chǎn)品合理的搭配,構(gòu)成一臺高性能運算工作站。
參考配置
Intel V8高性能工作站的"亮點"
CAE對系統(tǒng)的浮點運算性能和內(nèi)存帶寬要求非常高,影響計算性能的主要環(huán)節(jié)是:CPU運算單元 → CPU二級緩存 → 前端總線 → 北橋芯片 → 內(nèi)存 → 硬盤,每一個環(huán)節(jié)都不能忽視,基于最新英特爾酷睿2架構(gòu)的四核Xeon處理器,擁有眾多性能卓越的技術(shù),包括基于Core架構(gòu)的酷睿CPU核心,多達8MB的共享 L2 緩存、高達 1333 MHz 的前端總線。眾多的先進技術(shù)實現(xiàn)了Intel Xeon 5365超強的計算性能,比老Xeon快400%,比雙核Xeon快50%,為確保工作站高速高效還要合理的成本。
這套配置體現(xiàn)在:
CPU采用2顆Xeon 5365,8×3G頻率、8M二級緩存、1333Mhz前端總線頻率,整臺工作站擁有八個計算單元,從而處理器的峰值速度達到3G×4×8=96Gflop/S,或近1000億次/秒。
主板采用泰安S2696WA2NRF 支持最新四核Xeon5300系列,PCI-E16X顯卡,四通道內(nèi)存,支持8個SAS硬盤,支持RAID0、1。
內(nèi)存容量8G ,4根2G內(nèi)存構(gòu)成四通道,有限元分析軟件的計算速度提升完全靠大內(nèi)存的支持,只有內(nèi)存足夠大,才能把所有數(shù)據(jù)一次放進內(nèi)存,才能最快對數(shù)據(jù)計算和得到結(jié)果,否則當(dāng)物理內(nèi)存不足的時候,系統(tǒng)就會使用虛擬內(nèi)存(磁盤部分作為虛擬內(nèi)存),這樣降大大降低性能。
硬盤采用目前最高轉(zhuǎn)速15000轉(zhuǎn),SAS接口,充分保證速度讀寫對頻繁數(shù)據(jù)訪問要求,CAE應(yīng)用在初始化、中間結(jié)果保存和計算結(jié)果輸出時都會有密集的數(shù)據(jù)IO操作,而且目前并行計算程序的IO操作大多還是串行進行的,因此IO的性能經(jīng)常是并行計算程序的瓶頸所在,所以SAS15000轉(zhuǎn)這個目前最快的硬盤是非常必要的,如果資金允許,可以在通過RAID進一步提升讀取速度,通過多塊磁盤RAID,磁盤的IO速度可以成倍提高。
顯卡Quadro FX560 一款中低端解決方案,計算產(chǎn)生的數(shù)據(jù)則需做可視化處理,經(jīng)由適當(dāng)?shù)挠嬎銠C繪圖技術(shù)將結(jié)果表示出來。
將上述產(chǎn)品結(jié)合搭建的四核Xeon高性能計算工作站,滿足了軟件對硬件的高性能、經(jīng)濟實用,并具有靈活配置調(diào)整,相對于品牌工作站來講配置更合理,價格更便宜,性能得到最大滿足。
基于FEA/CFD工作站關(guān)鍵配件選型
CPU 四核 Xeon5365 4 x 3G / 8M L2二級緩存/1333Mhz前端總線
技術(shù)要點:
Intel寬位動態(tài)執(zhí)行,支持?jǐn)?shù)據(jù)流分析(Data Flow Analysis)、預(yù)測執(zhí)行(Speculative Execution)、亂序執(zhí)行(Out of Order Execution)及超標(biāo)量(Super Scalar)等RISC處理器先進技術(shù),每時鐘周期可傳遞更多的指令,一個周期指令原來3條,提升到4條。
Intel高級數(shù)字多媒體增強技術(shù),新一代Core架構(gòu)擁有128Bit SIMD 算法及128bit SIMD雙倍精準(zhǔn)度浮動點運算, 并且只需要一個頻率周期就能完成,執(zhí)成效率提升達一倍,現(xiàn)時SSE指令集已經(jīng)十分普遍地用于主流的軟件中,包括繪圖、影像、音像、加密、數(shù)學(xué)運算等用途,單周期128Bit處理器能力以頻率以外的方法提升效能,令處理器擁有高效能的表現(xiàn)。
Intel高級智能高速緩存,在二級緩存方面,提供性能更強效率更高的緩存子系統(tǒng)。專為多核處理器做了優(yōu)化。包括一個共享的二級高速緩存或內(nèi)存庫,它通過最大限度地降低內(nèi)存"流量"減少能耗;并在一個內(nèi)核閑置時,通過支持另一個內(nèi)核利用全部高速緩存來提升性能。
主板 泰安S2696WA2NRF 采用5000X芯片組,支持雙路四核Xeon
上面我們分析了有限元分析軟件對運算的極高要求,為了保證計算的每個環(huán)節(jié)最高性能,市場滿足這些要求的主板有Intel S5000XVNSAS、超微X7DA3、泰安S2696WA2NRF,從性能和品質(zhì)講,這三個型號應(yīng)該不分上下,很多客戶都是根據(jù)個人使用和了解,對某些品牌有所偏好,但是TYAN S2696WA2NRF這款主板是目前市場上唯一現(xiàn)貨的工作站主板,TYAN的S2696WA2NRF是泰安眾多工作站主板一款配置最高經(jīng)典設(shè)計。
泰安這款S2696WA2NRF專為高性能計算要求而設(shè)計的工作站主板,它的配置完全滿足有限元分析軟件的最高要求。
下面是該主板技術(shù)參數(shù):
支持目前最高規(guī)格的Intel 基于Core2架構(gòu)的四核Xeon5365處理器
雙路處理器和北橋之間是雙獨立總線結(jié)構(gòu),以重點解決前端總線方面的瓶頸,將具有1333MHz的處理器系統(tǒng)總線和核心邏輯來支持芯片,并且能夠很好的支持兩條這樣的總線。加寬CPU總線帶寬
5000芯片組示意圖
內(nèi)存采用目前最快的DDR2-667 FBD全緩沖,并通過優(yōu)化可用數(shù)據(jù)帶寬的使用率來提高系統(tǒng)性能
北橋芯片采用Intel5000X,北橋和內(nèi)存之間四通道,北橋和內(nèi)存最大帶寬5.3GB/S×4=21GB/S
主板內(nèi)存插槽
板載LSI 1068E,支持帶RAID功能的SATA2/3G和SAS接口和許多其他功能,能夠為您的系統(tǒng)搭配組建SAS RAID 0/1++/5/10,支持目前最快的SAS硬盤,SAS硬盤數(shù)量達到8個,SATA4個。
集成雙千兆網(wǎng)卡,1394a火線接口,板載聲卡,USB2.0接口,并且擁有多條PCI-E 插槽。 此外還具有PCI-X插槽。
性價比之王–麗臺Quadro FX560專業(yè)顯卡
有限元分析軟件對圖形功能的要求不是很高,只要對所計算的結(jié)果通過圖形有所表現(xiàn),基本就可以了,但是所有圖形處理都是借助OPEN GL函數(shù)實現(xiàn)的,為此顯卡方面推薦專業(yè)圖形卡麗臺NVIDIA Quadro FX 560是比較合適的,該卡配備128MB超高速GDDR3緩存、19.0GB/s內(nèi)存帶寬、128位內(nèi)存總線,以及支持高分辨率(2048 x 1536)數(shù)字屏幕;下一代PCI Express總線架構(gòu)在幾何與填充率上有超過兩倍的改善,為CAE專業(yè)用戶帶來高性價比的圖像解決方案。 麗臺Quadro FX 560不但有親和力的價格,在功能/性能上也毫不含糊,提供完整且先進的功能與價值,兼顧精確度、效能表現(xiàn)和可程序化功能。
麗臺NVIDIA Quadro FX 560
Quadro FX 560采用G73L芯片,顯存容量128MB,位寬128bit,顯存規(guī)格DDR3,插槽規(guī)格PCI-E,核心頻率350MHz,顯存頻率600MHZ,Proe03 55.60,Ugs04 34.11,3Dsmax03 39.24。
硬盤方面
硬盤采用SAS接口,選用轉(zhuǎn)速15000轉(zhuǎn)最高規(guī)格,保證數(shù)據(jù)讀取等待,如果再配上RAID功能,數(shù)據(jù)讀寫更快。
總結(jié):
通過上述配件搭配,完全考慮到影響CPU運算速度的各個環(huán)節(jié),CPU, 二級緩存,內(nèi)存,以及之間的通道,比之老Xeon性能得到質(zhì)的飛躍,DIY的最大好處,結(jié)合應(yīng)用軟件合理配置硬件,可以搭配出性價比最高的一套配置,相對于品牌要合理合算的多。目前很多設(shè)計研發(fā)單位在資金有限情況下,要求最小投入最大回報,這是一個明智的選擇。
英特爾四核處理器逐漸成為高性能計算更強大引擎。高性能計算作為企業(yè)工程設(shè)計中的一個重要組成部分,成為核心競爭力的來源.扮演支持業(yè)務(wù)發(fā)展的重要角色。隨著IT軟硬件技術(shù)及其相關(guān)的配套系統(tǒng)的快速發(fā)展,高性能計算不再像以前那樣高不可及,已經(jīng)成為更加標(biāo)準(zhǔn)化和商品化的lT基礎(chǔ)架構(gòu),進入門檻足夠低,架構(gòu)靈活性和可擴展能力更高。因此,國內(nèi)企業(yè)應(yīng)該把握住這一時機,加速應(yīng)用高性能計算,籍此提升自身的核心競爭力。