藍調(diào) 發(fā)表于:13年11月29日 10:43 [原創(chuàng)] DOIT.com.cn
近日,NVIDIA發(fā)布了新一代Tesla GPU K40加速器。作為NVIDIA的重要OEM合作伙伴,浪潮公司在第一時間對其進行測試,并同步發(fā)布了基于Tesla GPU K40的服務器產(chǎn)品。DOIT記者采訪了浪潮集團高性能服務器產(chǎn)品部總經(jīng)理劉軍、NVIDIA(英偉達)中國區(qū)技術與解決方案高級顧問鄧培智、浪潮公司HPC應用技術經(jīng)理張清。
圖1 左起依次為浪潮公司HPC應用技術經(jīng)理張清、浪潮集團高性能服務器產(chǎn)品部總經(jīng)理劉軍、NVIDIA(英偉達)中國區(qū)技術與解決方案高級顧問鄧培智
K40亮點:顯存空間提升 降低編程難度
從K40的性能指標可以看出,相比之前的K20而言,最大的改進就是顯存容量增加了一倍,這對于數(shù)據(jù)量高的應用是一個很好的改進。其次是,K40新增了GPU Boost的功能,應用可以充分利用GPU Boost功能,提升GPU的能力,GPU Boost最高可以提高10-20%的性能。盡管性能有所提升,但Tesla K40的熱設計功耗依然保持在235W,而散熱方式除了被動式之外還增加了主動式。
浪潮高性能計算專家張清表示,“Tesla K40性能方面提升了10-30%,更重要的是編程方面的進一步改進,我想CUDA 6.0版本出來之后,對CPU和GPU會建立統(tǒng)一的尋址方式,對編程的難度會有進一步的降低。另外,顯存空間的提升,以及PCI-E帶寬的提升,對這種大數(shù)據(jù)量高性能行業(yè)應用是一個福音。我們之前做了很多應用,數(shù)據(jù)擱不下,導致編程難度加大。所以硬件直接升級,將大大降低編程的難度”。
由于Tesla K40和K20的制程工藝沒有差別,因此,用戶在升級時可以直接用K40加速卡替換K20。對于服務器廠商而言,也無需改變服務器的設計。當然,K20和K40在市場上將會并行存在一段時間,并逐步過渡到K40。
聯(lián)手推動GPU的應用 關鍵在應用和人才
理論上,很多其他行業(yè)的大數(shù)據(jù)問題,都可以通過高性能計算機來解決。只是,應用軟件的缺乏導致高性能計算機的計算能力沒有卻辦法“動起來”,而應用軟件缺乏的主要原因則是人才的缺乏。
用一個不恰當?shù)谋扔鱽砝斫,高性能計算機就好比是米飯,而應用軟件就像是電飯煲,而人才就是會用電飯煲做飯的巧婦。如果空有米飯,卻沒有電飯煲和會使用電飯煲的巧婦,那我們永遠都吃不到香噴噴的米飯。
浪潮和NVIDIA的一致共識就是要從應用端去推動GPU的應用。目前,許多客戶在使用的商業(yè)軟件或是使用國際上比較成熟的計算軟件,已經(jīng)有CUDA的版本,可以利用GPU的加速技術。據(jù)了解,在中國一些比較典型的行業(yè)應用,比如石油、生命科學、互聯(lián)網(wǎng)、圖像等方面,浪潮通過與軟件開發(fā)者進行廣泛合作,開發(fā)了基于Tesla GPU加速器的軟件版本。
除了傳統(tǒng)的超大型超算中心之外,目前,GPU客戶的范圍正在不斷擴展,還有很多其他新興行業(yè)的客戶,比如互聯(lián)網(wǎng)、通訊、金融等等。從浪潮的銷售數(shù)據(jù)來看,GPU的增長速度已經(jīng)達到了三倍,超過了NVIDIA統(tǒng)計的兩倍的增長速度。未來,GPU在互聯(lián)網(wǎng)的應用需求將非常大,所以我們也在和NVIDIA一起積極推進互聯(lián)網(wǎng)行業(yè)的應用。據(jù)介紹,浪潮和NVIDIA的戰(zhàn)略合作中,有一個專門的研究課題,就是針對GPU和大數(shù)據(jù)結合的研究。
“在互聯(lián)網(wǎng)領域,目前是采用CPU來做計算,但是互聯(lián)網(wǎng)的圖片搜索,視頻、音頻的轉(zhuǎn)碼分析這一塊陸續(xù)即將要采用GPU的架構來做,像奇虎和阿里巴巴等互聯(lián)網(wǎng)企業(yè),都在一起做這一方面的合作,還有在安防行業(yè),也準備采用GPU架構來做這一方面的加速”,張清介紹了互聯(lián)網(wǎng)領域如何跟GPU相結合。
事實上,浪潮和NVIDIA去年就共同發(fā)布了“GPU卓越人才計劃”,目前,通過認證的工程師已經(jīng)達到了100人。雙方在人才和應用方面的共同發(fā)力,將會對GPU的應用和生態(tài)系統(tǒng)的進一步完善,起到非常重要的推動作用。