這一系列模型涵蓋了Micro、Lite、Pro、Premier四大版本的語言模型,每一款都各具特色,滿足不同場景下的應(yīng)用需求。此外,還有令人矚目的圖像生成模型Canvas以及視頻生成模型Reel驚艷亮相。特別是Reel,目前已能流暢生成6秒視頻,而未來不久,其生成時長將拓展至2分鐘,為用戶帶來前所未有的視覺盛宴。
風(fēng)云變幻的生成式AI時代
在即將登臺發(fā)表演講之際,亞馬遜云科技新任首席執(zhí)行官Matt Garman提出了一個引人深思的見解:人工智能是一場永無止境的競賽,它將會持續(xù)不斷地向前推進。
目前,這場競賽尚處于初期階段。在經(jīng)歷了“全力投入大模型”的狂熱之后,業(yè)界開始深思:在這場持久戰(zhàn)中,接下來應(yīng)把重點放在“細水長流”的穩(wěn)健發(fā)展上。
對于各行各業(yè)的用戶而言,可持續(xù)發(fā)展面臨的首要挑戰(zhàn)便是成本問題。如果說去年我們還在探索如何適應(yīng)新興的生成式AI技術(shù),那么到了2024年末,更為關(guān)鍵的是:如何不斷降低生成式AI的應(yīng)用成本,即提高生成式AI技術(shù)應(yīng)用的性價比。
在今日凌晨的主旨演講中,Matt Garman分享了亞馬遜云科技在人工智能和計算等領(lǐng)域取得的“新技術(shù)、新產(chǎn)品、新服務(wù)”成果,標志著生成式AI技術(shù)棧的又一次革新。
我們見證了一系列前沿的技術(shù)能力發(fā)布,這些發(fā)布令人震撼且源源不斷。與此同時,技術(shù)的落地成本降低到了令人難以置信的水平。
這一系列升級,無疑堪稱“真正的革命性變革”。在變幻莫測的生成式AI時代,亞馬遜云科技再次展現(xiàn)了其“掌控全場”的實力。
將性價比做到極致
去年4月,亞馬遜云科技正式踏入生成式AI大模型的競技舞臺,其首發(fā)的Amazon Titan系列模型當時專注于文本內(nèi)容的生成與高效搜索功能的打造。僅僅一年多時間,亞馬遜云科技已在基礎(chǔ)模型層面完成了全面布局,正朝著涵蓋文本、圖像、視頻及語音的全模態(tài)體系全力邁進,在與OpenAI、谷歌、Anthropic等業(yè)界巨頭的競爭中,展現(xiàn)出了強勁的實力。
在今年的re:Invent大會上,亞馬遜云科技自主研發(fā)的生成式AI多模態(tài)Amazon Nova系列模型驚艷亮相。該系列模型不僅在多種任務(wù)中達到了業(yè)界領(lǐng)先的智能水平,更在性價比方面樹立了新的標桿。
亞馬遜總裁兼CEO安迪·賈西(Andy Jassy)親自見證了這一重要時刻。此次發(fā)布的Amazon Nova系列模型共包含四個版本:
純文本模型Amazon Nova Micro,支持高達128k的上下文,能夠以極低的成本實現(xiàn)最低延遲的響應(yīng);
成本效益顯著的多模態(tài)模型Amazon Nova Lite,支持300k上下文或30分鐘視頻輸入,能夠迅速處理圖像、視頻及文本信息;
功能全面的多模態(tài)模型Amazon Nova Pro,同樣支持300k上下文或30分鐘視頻輸入,在準確性、速度與成本之間實現(xiàn)了完美平衡,適用于各種復(fù)雜任務(wù);
以及性能最為強大的多模態(tài)模型Amazon Nova Premier,專為復(fù)雜推理任務(wù)設(shè)計,同時可作為自定義蒸餾模型的最佳教師模型。
在基準測試中,Amazon Nova系列模型展現(xiàn)出了非凡的實力。純文本模型Amazon Nova Micro在與LLaMa 3.1 8B、Gemini 1.5 Flash-8B等模型的對比中,表現(xiàn)相當甚至更優(yōu)。其210 tokens/s的輸出速度更是業(yè)界領(lǐng)先,對于追求快速響應(yīng)的應(yīng)用場景而言,無疑是最佳選擇。而多模態(tài)模型Amazon Nova Lite與Amazon Nova Pro在與OpenAI、谷歌、Anthropic等主流廠商的模型中,也在絕大多數(shù)基準測試中表現(xiàn)出色,尤其在處理輕量級任務(wù)時,Lite更是以極低的成本提供了卓越的多模態(tài)處理能力。
目前,Amazon Nova Micro、Lite、Pro三款模型已正式推出,并集成至Amazon Bedrock平臺,支持自定義微調(diào)和蒸餾。而Amazon Nova Premier則計劃于2025年第一季度面世。在性能全面提升的同時,Amazon Nova系列模型中的Micro、Lite與Pro版本的價格相比Amazon Bedrock中同類別的最強模型,至少降低了75%。這對于那些需要大模型服務(wù)、預(yù)算有限但又追求模型效果的客戶來說,無疑是一個極具吸引力的選擇。
此外,在圖像與視頻生成模型競爭日益激烈的當下,亞馬遜云科技也展示了其強大的內(nèi)容創(chuàng)作實力。獨立的圖像生成模型Amazon Nova Canvas與視頻生成模型Amazon Nova Reel相繼亮相:Canvas支持圖像的生成與編輯,提供了豐富的配色方案與布局控件;而Reel則能根據(jù)關(guān)鍵提示詞和參考圖像生成6秒視頻,并支持用戶調(diào)整攝像頭運動以實現(xiàn)平移、360度旋轉(zhuǎn)和縮放等操作,未來還將支持2分鐘視頻的生成。
安迪·賈西還預(yù)告了另外兩款即將推出的Amazon Nova模型:Amazon Nova Speech-to-Speech與Amazon Nova Any-to-Any。前者旨在實現(xiàn)自然、類人的口頭交互體驗;后者則致力于用同一個模型解決多種任務(wù),包括多模態(tài)轉(zhuǎn)換、內(nèi)容編輯以及AI智能體操作等。這兩款模型預(yù)計將于2025年第一季度和中期分別面世。
從文本到視頻,Amazon Nova系列模型一次性全部上線,并直接對標了最新的技術(shù)發(fā)展方向。亞馬遜云科技自研大模型的進化速度之快,讓全場觀眾都為之震撼。
算力革命即將到來
過去十年,AI行業(yè)已達成共識:模型參數(shù)量的增長和計算復(fù)雜度的提升,離不開強大算力的支持。這一結(jié)論可以從兩個簡單維度來理解:一是向上擴展,即使用更強大的計算機;二是向外擴展,即使用更多的計算機。
然而,在生成式AI時代,由于模型涉及數(shù)十億甚至上千億的參數(shù),設(shè)計、訓(xùn)練和部署這些模型都需要消耗巨大的計算資源。例如,每次訓(xùn)練都需要對海量數(shù)據(jù)進行復(fù)雜的矩陣運算和梯度計算,這對算力基礎(chǔ)設(shè)施的要求遠超以往。
對于希望應(yīng)用生成式AI的企業(yè)而言,要追上OpenAI、谷歌等頂尖公司,就必須購買越來越多的高端芯片和云服務(wù),這導(dǎo)致計算成本顯著上升。據(jù)Gartner分析,到2025年,隨著AI技術(shù)基礎(chǔ)設(shè)施的不斷升級,各個云支出領(lǐng)域的增長率都將達到兩位數(shù)。
當前,核心問題在于如何在算力資源短缺的環(huán)境下擴大算力來源,并如何在高昂的計算成本壓力下高效利用算力。對此,亞馬遜云科技的自研AI芯片Trainium為企業(yè)用戶提供了一個速度快、能耗低的優(yōu)質(zhì)選擇。
Trainium是亞馬遜云科技自研的AI芯片,自2020年首次推出以來,便因其高效的AI模型訓(xùn)練能力而備受矚目。在今年的re:Invent大會上,亞馬遜云科技宣布Trainium2芯片已全面正式可用,助力行業(yè)訓(xùn)練和部署大型語言模型。Trainium2的速度是其上一代產(chǎn)品的四倍,于一年前首次發(fā)布。
單個Trainium2驅(qū)動的EC2實例配備16個Trainium2芯片,可提供高達20.8 PetaFLOPS的計算性能。在測試中,與其他云服務(wù)商的類似產(chǎn)品相比,使用Amazon Bedrock Trn2 EC2實例的Llama 3.1 405B模型在token生成吞吐量上提高了三倍以上。
此外,亞馬遜云科技與Anthropic正合作構(gòu)建一個名為Project Rainier的Trn2 UltraServer集群。生成式AI爆發(fā)后,Anthropic大量使用了亞馬遜云科技的算力設(shè)施,并一直緊追OpenAI。今年11月底,亞馬遜宣布向Anthropic追加40億美元投資,累計投資達80億美元。基于深厚的合作關(guān)系,Anthropic將使用亞馬遜云科技的Trainium AI芯片來訓(xùn)練和運行其AI模型。
Project Rainier集群將包含數(shù)十萬個Trainium2芯片,為Anthropic提供足夠的可擴展分布式計算能力,以訓(xùn)練下一代大模型。與Anthropic用于訓(xùn)練當前一代模型的集群相比,新集群的計算能力達到其五倍,并將成為全球最大的AI計算集群。
對于規(guī)模更大的萬億級參數(shù)LLM,亞馬遜發(fā)布了第二層Trainium2實例——Trn2 UltraServer,同時提供64個Trainium2芯片用于AI模型訓(xùn)練或推理。它將允許用戶超越單個Trn2服務(wù)器的限制,提供高達83.2 PetaFLOPS的峰值計算能力。
同時,亞馬遜云科技的下一代自研AI芯片Trainium3也在研發(fā)中。這是該公司首款采用3nm工藝制造的芯片,性能將是Trainium2的兩倍,能耗降低40%,性能可與英偉達的新一代AI芯片相媲美。
首批基于Trainium3的實例預(yù)計將于2025年上市。亞馬遜云科技表示,搭載Trainium3的UltraServer性能將比搭載Trainium2芯片的UltraServer高出四倍。
在生成式AI技術(shù)快速發(fā)展的背景下,不斷進化的亞馬遜云科技為用戶提供了一個可靠的“算力”選擇。當業(yè)界熱議“追逐Scaling Law是否還有意義”時,亞馬遜云科技的Trainium系列和其一整套AI基礎(chǔ)設(shè)施,無疑為各行各業(yè)的用戶在這場技術(shù)浪潮中提供了堅實的“船槳”。
Any-to-Any萬能模型
亞馬遜云科技在大會上還推出了任意轉(zhuǎn)任意(Any-to-Any)萬能模型的預(yù)覽。這一模型能夠接受文本、圖像、音頻和視頻作為輸入,并以任意模態(tài)生成輸出,將簡化應(yīng)用開發(fā),使同一模型能夠執(zhí)行多種任務(wù),如內(nèi)容模態(tài)轉(zhuǎn)換、內(nèi)容編輯,以及驅(qū)動能夠理解和生成所有模態(tài)的AI代理。這一突破性的進展無疑將徹底改變生成式AI的游戲規(guī)則。
結(jié)語
亞馬遜云科技在re:Invent大會上的連串發(fā)布,彰顯了其在云計算與AI領(lǐng)域的深厚底蘊與不竭的創(chuàng)新動力。這些嶄新的產(chǎn)品與技術(shù),無疑將為生成式AI的發(fā)展注入強勁動力,加速其應(yīng)用的廣泛落地,為各行各業(yè)開辟更為廣闊的創(chuàng)新空間與變革之路。(文/宋雨涵)