“核心問題在于市場產(chǎn)生了多少數(shù)據(jù),以及我們能否有效處理和應(yīng)用這些數(shù)據(jù)?”AMD CVP兼總經(jīng)理、計(jì)算和圖形首席架構(gòu)師Sebastien Nussbaum在分析當(dāng)前客戶端人工智能愿景時(shí)指出。
自1970年微處理器誕生以來,信息的擴(kuò)展和訪問速度顯著加快?;ヂ?lián)網(wǎng)時(shí)代的到來,尤其是2000年后的爆炸性增長,使得智能手機(jī)普及,信息量激增。預(yù)計(jì)到2020年,互聯(lián)網(wǎng)上的數(shù)據(jù)量將超過64 ZB字節(jié),并在未來幾年內(nèi)迅速增長至200ZB字節(jié)以上。
這種數(shù)據(jù)量的激增推動(dòng)了信息技術(shù)的快速迭代和主流應(yīng)用,人工智能技術(shù)也以驚人的速度和效率擴(kuò)展,計(jì)算模型的增長達(dá)到了前所未有的水平。
當(dāng)前客戶端人工智能愿景
目前,全球有超過74萬個(gè)在線人工智能模型,它們創(chuàng)造了多樣化的用例并解決了眾多問題。過去一年中,至少產(chǎn)生了155億張AI生成的圖像。預(yù)計(jì)到2024年,全球人工智能工具用戶將達(dá)到3.14億。
人工智能應(yīng)用正逐漸成為主流,通用人工智能(AGI)時(shí)代正逐步到來。繼生成式AI之后,AI應(yīng)用的下一個(gè)目標(biāo)是發(fā)展自主式AI,這涉及到在特定領(lǐng)域訓(xùn)練的簡單模型,以滿足特定需求并確保推理和目標(biāo)的應(yīng)用。
AMD正在聯(lián)手各類型合作伙伴,把各類新技術(shù)應(yīng)用到云、醫(yī)療保健、工業(yè)制造、汽車、通信、PC、游戲和機(jī)器人等廣泛的領(lǐng)域,推動(dòng)人工智能無處不在。
這些目標(biāo)的實(shí)現(xiàn),離不開與微軟長達(dá)5年的緊密合作。AMD推出的銳龍 9000系列桌面處理器和第三代Ryzen AI以某種方式改變并帶來了全新的PC體驗(yàn),凸顯了公司致力于設(shè)計(jì)和技術(shù)創(chuàng)新的決心;特別是微軟最近推出CoPilot+,將PC重新定義為AI PC,此舉超出了傳統(tǒng)漸進(jìn)主義無法實(shí)現(xiàn)的目標(biāo);而與賽靈思的并購合作,將AMD XDNA集成到AMD APU,也加速了這一進(jìn)程。
人工智能:開啟PC新進(jìn)化的關(guān)鍵
Sebastien Nussbaum認(rèn)為,解鎖PC下一代演進(jìn)的關(guān)鍵在于技術(shù)驅(qū)動(dòng)因素和基礎(chǔ)設(shè)施內(nèi)部的變化。AI被視為重要的加速器,輔助框架功能。
將AI功能嵌入操作系統(tǒng)和其他核心功能至關(guān)重要。未來AI將具備三大特征:基于自然語言的人機(jī)交互、自主和無縫的體驗(yàn),以及始終在線的數(shù)據(jù)驅(qū)動(dòng)用戶體驗(yàn)。
那么,AI PC體驗(yàn)從何開始,又將走向何方?
Sebastien Nussbaum以游戲?yàn)槔榻B說,游戲是一種一直在尋找新的技術(shù)來解決種種難題,每一項(xiàng)新的開發(fā)都需要花費(fèi)開發(fā)團(tuán)隊(duì)大量的精力。而通過AI輔助游戲開發(fā),時(shí)間就要快得多。比如,開發(fā)者不僅可以快速重新制作相同的內(nèi)容,還能夠?qū)鹘y(tǒng)的分析計(jì)算功能 (例如視覺處理) 移動(dòng)到基于AI的模型中,從而改善投影或特定場景的效果。
這些增強(qiáng)的功能只是開發(fā)流程的一部分。
North Star計(jì)劃:對(duì)大型語言模型體驗(yàn)的不懈追求
人工智能應(yīng)用分為本地和云端兩種形態(tài)。本地AI的優(yōu)勢(shì)在于隱私保護(hù)、數(shù)據(jù)安全性和高性能,但可擴(kuò)展性有限。而云端AI則提供了遠(yuǎn)超本地的容量和吞吐量。
因此,對(duì)大模型的應(yīng)用是在邊緣端還是在云端,是一個(gè)值得掂量的話題。
如何才能充分利用這兩個(gè)世界的優(yōu)勢(shì)呢?
AMD正在推動(dòng)技術(shù)創(chuàng)新,以充分利用本地和云端的優(yōu)勢(shì)?;赗yzen AI 300處理器系列,AMD支持高達(dá)70億參數(shù)(量化精度為int4)的大型語言模型(LLM),輸入序列長度高達(dá)2K,提供每秒20個(gè)Token的生成速度,首個(gè)Token生成的延遲為1至4秒。
這遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)實(shí)需求。
為此,AMD正在盡全力推動(dòng)技術(shù)創(chuàng)新,如提供更大的邏輯面積、性能更強(qiáng)的NPU,并且在內(nèi)存總線的限制方面也取得突破,以硬件和軟件性能的巨大提升來應(yīng)用未來的長期發(fā)展。正在研發(fā)的新型Ryzen AI PC芯片,將支持以每秒100個(gè)Token的速度在本地運(yùn)行300億參數(shù)(量化精度為int4)的LLM,實(shí)現(xiàn)3K的語義長度,生成首個(gè)Token的延遲目標(biāo)設(shè)置為低于100毫秒。
這就是AMD名為“北極星(North Star)”的計(jì)劃。
“North Star”計(jì)劃旨在實(shí)現(xiàn)15GB的內(nèi)存和超過1.5 TBps的帶寬,性能接近配備HBM2的40GB Nvidia A100 PCIe卡。這一目標(biāo)對(duì)AMD來說是一個(gè)巨大的挑戰(zhàn),但同時(shí)也彰顯了其在AI領(lǐng)域的雄心和信心。
這樣,憑借獨(dú)特的優(yōu)勢(shì),AMD成功地將云、企業(yè)和AIPC連接在一起,利用為云創(chuàng)建的基礎(chǔ)設(shè)施開發(fā)、部署,并增強(qiáng)AIPC的功能和可用性。
結(jié)合本地和云端的人工智能
AMD與云合作伙伴共同開發(fā)技術(shù)組件,實(shí)現(xiàn)了無縫處理。例如,將生成式AI集成到視頻處理中,提高了效率和準(zhǔn)確性。
一個(gè)典型的案例就是將生成式AI集成到視頻處理中,以提高效率和準(zhǔn)確性。例如,在洛杉磯的電影開發(fā)工作室有效地應(yīng)用AIPC在本地作為最終渲染的預(yù)覽,實(shí)現(xiàn)了非常快速和高質(zhì)量的迭代過程。
技術(shù)遷移對(duì)于從云端到AI PC的快速轉(zhuǎn)移至關(guān)重要,AMD通過結(jié)合本地技術(shù)和數(shù)據(jù)中心性能,實(shí)現(xiàn)了混合客戶端到云的數(shù)據(jù)遷移。
要實(shí)現(xiàn)最佳效果,就必須有正確的技術(shù)解決方案,以便能夠以安全的方式在端點(diǎn)和云之間進(jìn)行更多數(shù)據(jù)遷移。AMD將本地技術(shù)與專為大規(guī)模模型設(shè)計(jì)的數(shù)據(jù)中心以超過本地上百倍吞吐量的性能結(jié)合在一起,通過安全數(shù)據(jù)傳輸和機(jī)密計(jì)算安全實(shí)現(xiàn)了從混合客戶端到云的數(shù)據(jù)遷移,提高了處理能力和混合AI性能。
Blackmagic Design的應(yīng)用是另一個(gè)成功的故事。該公司與AMD的合作實(shí)現(xiàn)了1.5倍的光線加速、3倍扭曲速度和4倍快的魔法面具。Blackmagic Design公司達(dá)芬奇軟件工程總監(jiān)Rohit Gupta表示,“我們與AMD的合作使我們能夠利用DirectML在我們最具影響力的ML模型上實(shí)現(xiàn)出色的性能提升?!?/p>
這種混合云與本地相結(jié)合的方法,利用更大、更準(zhǔn)確的模型獲得專業(yè)成果,同時(shí)通過機(jī)器學(xué)習(xí)優(yōu)化增強(qiáng)本地設(shè)備能力,毫無疑問具有強(qiáng)大的生命力,因?yàn)椋呀?jīng)成為每個(gè)人工作方式的基礎(chǔ)。
結(jié)語
看得出來,Ryzen AI 300展現(xiàn)了AMD在人工智能優(yōu)化GPU設(shè)計(jì)和工作負(fù)載處理方面的強(qiáng)大能力。
很顯然,AMD利用人工智能和技術(shù)進(jìn)步推動(dòng)了計(jì)算性能和創(chuàng)新的邊界,為未來發(fā)展奠定基礎(chǔ)。