云中子 發(fā)表于:14年11月24日 00:59 [轉(zhuǎn)載] 賽迪網(wǎng)
NVIDIA今天推出了一款全新的NVIDIA Tesla加速計算平臺:Tesla K80雙GPU加速器。該產(chǎn)品是全球性能最高的加速器,專為各種機器學習、數(shù)據(jù)分析、科學計算以及高性能計算(HPC)應用而設計。
Tesla K80雙GPU加速器的性能和內(nèi)存帶寬幾乎可達上一代產(chǎn)品Tesla K40 GPU加速器的兩倍。Tesla K80雙GPU加速器在性能方面比當今最快的CPU高10倍,在數(shù)百款復雜的分析應用以及計算量繁重的大型科學計算應用上完勝CPU和同類加速器。
憑借該加速器的強化版NVIDIA GPU Boost技術(PDF),用戶可以在各種應用上獲得前所未有的性能。這一技術可將處理能力的余量動態(tài)地轉(zhuǎn)化為每一款應用的最佳性能提升。
Tesla K80雙GPU是Tesla加速計算平臺系列中的全新旗艦產(chǎn)品,Tesla加速計算平臺是領先的平臺,用于探索與深入了解。該平臺可為數(shù)據(jù)中心的GPU加速應用提供硬件、軟件以及一個廣泛的支持生態(tài)系統(tǒng)。
行業(yè)領先的性能用于科學、數(shù)據(jù)分析以及機器學習
從天體物理學、基因組學和量子化學到數(shù)據(jù)分析,Tesla K80雙GPU加速器在設計過程中考慮到了各個領域中最艱難的計算挑戰(zhàn)。 該加速器還針對先進的深度學習任務而進行了優(yōu)化,深度學習是機器學習領域中發(fā)展最快的一個細分領域。
Yann LeCun現(xiàn)任Facebook人工智能研究總監(jiān),同時也是紐約大學計算機科學與神經(jīng)科學銀牌教授。他表示:“NVIDIA GPU現(xiàn)已成為深度學習界實際運用的計算平臺。因為深度學習系統(tǒng)的精度會隨著模型與數(shù)據(jù)集的變大而不斷改善,所以我們會不斷尋找最快的硬件。Tesla K80加速器擁有雙GPU架構(gòu)和大容量內(nèi)存,它讓我們在單一服務器上獲得了前所未有的計算性能和內(nèi)存容量,從而讓我們能夠在深度學習領域中更快地取得進展。”
Tesla K80在計算性能上勝過所有其它的加速器(單精度峰值浮點性能為8.74 Teraflops,雙精度峰值浮點性能為2.91Teraflops)。在AMBER、GROMACS、Quantum Espresso以及LSMS等領先的科學與工程應用上,Tesla K80的性能比當今最快的CPU快10倍。
德國德累斯頓工業(yè)大學信息服務與HPC中心主任Wolfgang Nagel表示:“當我們在一些主要應用中實現(xiàn)科學突破時,Tesla K80雙GPU加速器最多比CPU快10倍,而且能耗更低。我們的研究人員廣泛使用Taurus超級計算機上可用的GPU資源來成就更完善的癌癥療法、通過觀察活的細胞來了解這些細胞、通過研究小行星來為歐洲空間局羅塞塔號任務貢獻力量。”
Tesla K80雙GPU加速器的主要特性包括:
每塊卡配備兩顆GPU,讓那些為充分利用多GPU而設計的應用能夠?qū)崿F(xiàn)吞吐量翻倍。
24GB超快GDDR5內(nèi)存每顆GPU 12GB內(nèi)存,是Tesla K40 GPU內(nèi)存容量的2倍,讓用戶能夠處理大小翻倍的數(shù)據(jù)集。
480 GB/s內(nèi)存帶寬,更高的數(shù)據(jù)吞吐量讓數(shù)據(jù)科學家能夠處理數(shù)以拍字節(jié)(Petabytes)的信息,而且處理時間僅為Tesla K10加速器的一半。針對能源勘探、視頻與圖像處理以及數(shù)據(jù)分析等應用而進行了優(yōu)化。
4,992個CUDA并行處理核心,與單獨使用CPU時相比可令應用最高實現(xiàn)10倍速度提升。
動態(tài)NVIDIA GPU Boost技術,可根據(jù)單個應用的特性而動態(tài)提升GPU時鐘頻率,以便最大限度提升性能。
動態(tài)并行機制,讓GPU線程能夠動態(tài)地生成新線程,從而讓用戶可以快速而輕松地處理自適應和動態(tài)數(shù)據(jù)結(jié)構(gòu)。
Tesla K80能夠加速最廣泛的各種應用,其中包括科學、工程、商業(yè)、企業(yè)HPC以及數(shù)據(jù)中心等應用,總數(shù)量超過280款。大家可免費下載GPU加速應用(PDF)的完整目錄。