NVIDIA-Proviz亞太區(qū)業(yè)務主管沈威

vGPU解決方案了解一下

自2013年NVIDIA發(fā)布第一個vGPU解決方案以來,通過將數(shù)據(jù)中心GPU進行虛擬化,用戶便可在多個虛擬機中共享該GPU,大大提升了應用程序和桌面的性能,并支持組織構建虛擬桌面基礎架構(VDI),繼而在整個企業(yè)范圍內經濟高效地擴展此性能。如今,IT部門可充分利用GPU技術,體驗媲美本地PC的虛擬化桌面服務。

NVIDIA vGPU軟件可提供具有豐富圖形效果的、由全球最強大的數(shù)據(jù)中心 GPU NVIDIA Tesla 加速器加速的虛擬桌面和工作站。

此軟件可以轉換服務器上安裝的物理GPU,以創(chuàng)建可在多個虛擬機中共享的虛擬GPU。GPU 與用戶之間的關系不再是一對一,而是一對多。

NVIDIA vGPU 軟件還包括一個適用于所有虛擬機的顯卡驅動程序,該顯卡有時也被稱為服務器端顯卡。而且,NVIDIA vGPU 使每個虛擬機都能像物理桌面一樣利用 GPU。但是,由于通常由 CPU 完成的工作轉移到了GPU,因而能為用戶帶來更出色的體驗,并且可為更多用戶提供支持。

NVIDIA的虛擬GPU產品包括三款旨在應對數(shù)字化工作環(huán)境挑戰(zhàn)的產品:面向知識工作者的 NVIDIA GRID 虛擬 PC (GRID vPC) 和 NVIDIA GRID 虛擬應用程序 (GRID vApp),以及面向設計師、工程師和建筑師的NVIDIA Quadro 虛擬數(shù)據(jù)中心工作站 (Quadro vDWS)。

NVIDIA中國區(qū)高級市場總監(jiān)劉念寧

在前不久,NVIDIA發(fā)布了最新版本的虛擬化平臺vGPU7.x,新版本可實現(xiàn)將多個物理GPU虛擬化分配給單一用戶??蓪崿F(xiàn)兩個功能:

①針對性能要求不高的場景,如圖形場景、教學場景和開發(fā)測試場景;

②針對算力要求非常高的用戶,這時候可以使用多vGPU功能分配給每一個虛機,提供給用戶。

因此,當前的解決方案會比之前的版本更加靈活,同時也符合vGPU解決方案的發(fā)展趨勢。

首先,通過虛擬化手段,盡量多的滿足用戶不同場景的需求;其次,通過虛擬化手段,不斷增強GPU在數(shù)據(jù)中心中的特性。因為越來越多的人工智能應用在數(shù)據(jù)中心做訓練,完成后要做上線推理。如用戶與智能音箱交互時,后臺會有GPU服務器做支撐。所以,大量GPU數(shù)據(jù)中心需要被管理起來,需要具備數(shù)據(jù)中心的特性,這事傳統(tǒng)物理GPU所不具備的。因此,需要通過虛擬化手段彌補其在數(shù)據(jù)中心中的一些特性的缺失。

NVIDIA-GPU虛擬化高級解決方案架構師張潔

據(jù)NVIDIA GPU虛擬化高級解決方案架構師張潔介紹,vGPU解決方案和NVIDIA的發(fā)展是相匹配的。最初NVIDIA基于GPU做圖形顯示,通過圖形方式幫助用戶做加速,分為企業(yè)級和非企業(yè)級。比較有代表性的企業(yè)級解決方案是專業(yè)的圖形工作站,非企業(yè)級解決方案如游戲顯卡。

虛擬化也是如此,最初是將圖形負載做了虛擬化。將大量圖形虛擬化用戶拉倒數(shù)據(jù)中心,以前用圖形工作站的用戶,企業(yè)中有100位設計人員,需要配備100個圖形工作站,每個圖形工作站有一張GPU做圖形加速,這是很典型的應用場景。

到了后期,出于管理和安全的訴求,越來越多的企業(yè)需要將圖形設計與員工的數(shù)據(jù)集中管理,一般企業(yè)會采用虛擬化的方式,將傳統(tǒng)的物理圖形工作站變?yōu)樘摂M化的工作站,放到數(shù)據(jù)中心運行。

但在數(shù)據(jù)中心,為每個用戶配備一個物理GPU,無論是從空間還是成本角度考慮都是不現(xiàn)實的。因此推出了GPU虛擬化技術,將性能非常強勁的GPU卡虛擬成很多很小的邏輯的、虛擬的vGPU,這樣可以方便地把圖形用戶從傳統(tǒng)的物理工作負載遷移到數(shù)據(jù)中心。

vGPU 7.x特性帶來的新場景應用

vGPU7.x版本一個比較明顯的區(qū)別是多GPU的支持,基于對算力比較高的用戶的需求,7.x版本通過虛擬化方式將多個物理GPU給到虛擬機,以滿足不同用戶對算力的不同需求。張潔以教學場景為例,學生需要低算力的GPU做教學實踐和實訓,而老師做科研需要很高算力的GPU,多GPU支持則很好的滿足了兩者的不同需要。

vMotion動態(tài)遷移。將一些不適合通過硬件形式實現(xiàn)的功能,通過軟件的形式實現(xiàn)。如在數(shù)據(jù)中心進行熱遷移,目前已經可以支持VMware和Citrix的服務器虛擬化平臺在數(shù)據(jù)中心中掛上vGPU,可在數(shù)據(jù)中心進行業(yè)務不中斷的遷移。

圖形虛擬化技術已經相對成熟。如今需要將虛擬化中大量的計算特性加到vGPU中,讓vGPU的特性和物理GPU解決方案平滑、無縫地遷移到數(shù)據(jù)中心。

支持Tesla T4。這是全新基于圖靈架構的GPU,支持Tensor Core做人工智能加速,RT Core做實時光線追蹤加速,有CUDA Core做圖形和計算。

基于vGPU 7.x的最新特性,也帶來了場景應用上的拓展。2020年1月,微軟將會正是停止對Win7的支持,越來越多的用戶會遷移到Win10,因此會有越來越多的虛擬桌面用戶遷移到Win10,而Win10對GPU的要求比較高。因此,在虛擬桌面場景,有GPU用戶體驗會大大增強。

在vGPU 5.x版本中,GPU支持做計算。一些對算力要求非常高的離線渲染場景可以用GPU實現(xiàn),而支持多GPU分配的7.x版本,可以提升渲染的效率。

自2016年人工智能技術受到廣泛關注后,GPU開始在越來越多的AI場景中應用,如深度學習推理。

經過5年多的發(fā)展,NVIDIA vGPU虛擬化平臺經過7代的版本迭代,從只能限定的幾款GPU上實現(xiàn)虛擬化,到如今支持多達7家虛擬化平臺及所有GPU,完善了整個生態(tài),加入計算功能及對國內廠商的大范圍支持等等,助力企業(yè)客戶實現(xiàn)堪比本地PC的服務體驗。

分享到

Fred

baiyan

相關推薦