高性能
節(jié)點服務器采用曙光天闊A820r-F(2U,16臺)和A610r-FX(1U,62臺),采用AMD Opteron 8354及AMD Opteron 2354四核64位處理器,提供強大的運算能力(5萬億次/秒)。
所有計算節(jié)點和I/O管理節(jié)點配置的網卡均支持I/O加速功能,可以有效提升系統(tǒng)性能,降低網絡傳輸對CPU的占用率;
高可靠性
集群專用存儲陣列柜設計,配置48塊300GB 15Krpm 4Gb接口磁盤,做為整個集群的數據存儲使用,集群計算節(jié)點與存儲系統(tǒng)采用4GB光纖通道連接,具有很高數據讀寫、存取性能;同時具有72小時鋰電池不間斷數據保護。
雙網共存設計,設計兩套千兆網絡,一套用于集群計算(H3C-S5100-48P-EI),另一套用于I/O及集群管理,同時兩套網絡相互備援,在其中一套網絡出現(xiàn)異常時另一網絡可動態(tài)切換使用。
I/O管理節(jié)點對集群提供DCOS(集群管理)、DCJM(作業(yè)調度)、NFS(文件服務)和SEP(系統(tǒng)登錄點)4個功能。
高擴展能力
曙光集群機柜和交換機均支持堆疊擴展,當需要增加計算節(jié)點時,只需要增加相同型號的機柜和交換機堆疊,就可以為增加節(jié)點提供更多的空間和端口,同時也不影響整體計算性能,這樣保證了當前的投資,而且保證了系統(tǒng)的完整性;
曙光SKVM視頻切換系統(tǒng)可以在線管理86個節(jié)點;
曙光集群管理軟件(DCOS)和集群作業(yè)調度軟件(DCJM)軟件可以無縫擴展,無須另外購買軟件許可即可將擴容的節(jié)點機納入當前的系統(tǒng)中進行管理、調度
高可管理性
視頻切換采用曙光SKVM,SKVM專為集群系統(tǒng)設計使用,通過普通網線級連所有節(jié)點,采用SKVM可以實現(xiàn)遠程操作,最大連接距離可以達到150米;
SKVM采用普通網線連接,連接簡潔、美觀,管理方便;
曙光DCOS、DCJM將新集群與老集群有效的整合管理和調度,同時DCOS和DCJM均支持基于WEB的管理方式,使得集群管理更加方便
高性能計算在高??蒲蓄I域的應用中一般會遇到兩個突出的問題,一是高性能帶來了高要求,使用者為某一學術領域的權威人物,但不一定是高性能計算方面的專家,對這個"龐然大物"的使用管理有一定困難;二是高性能帶來了高投入,然而客戶希望節(jié)約科研經費,支持更多的科研項目進行。
以曙光4000A為基礎的這套凝聚態(tài)物理高性能計算平臺很好的解決了這兩個問題,真正的把高性能計算機做成了人人可駕馭的科技工具,最大程度上節(jié)約了部署費用。這套系統(tǒng)將輔助浙江師范大學攻克一個個科學難關,成為科研領域不可或缺的"助推器"。