3月底,Claude3旗下最強(qiáng)的Opus模型在Chatbot Arena榜單上超越了原來一直排在第一位的GPT-4,標(biāo)志著ChatGPT遇到了自發(fā)布以來真正意義上可以匹敵的對(duì)手。
或許是亞馬遜很滿意Claude3的表現(xiàn)。差不多同一時(shí)間,亞馬遜宣布向Anthropic追加27.5億美元投資,加上去年已經(jīng)投的12.5億美元,總投資達(dá)40億美元。
一直以來,盡管有一些專業(yè)的Benchmark方案,但用戶的實(shí)際體驗(yàn)跟評(píng)分之間經(jīng)常有不小差距?;趯?shí)際體驗(yàn),很多人都將ChatGPT視為最強(qiáng)的聊天機(jī)器人。
而Chatbot Arena榜單是一個(gè)用人的主觀判斷來給模型打分的網(wǎng)站,在評(píng)判前用戶不知道對(duì)面是哪個(gè)模型。用戶對(duì)模型產(chǎn)出的結(jié)果做出主觀判斷后才能看到具體用的是哪個(gè)模型。
在Chatbot Arena榜單上打敗GPT-4,一定程度上證明了Anthropic有著與OpenAI相近的實(shí)力。
而亞馬遜對(duì)Anthropic的40億美元投資,不僅戰(zhàn)略上讓亞馬遜在生成式AI技術(shù)領(lǐng)域拿到了更多籌碼,從實(shí)際發(fā)展來講,對(duì)于其云計(jì)算業(yè)務(wù)的發(fā)展有不少積極意義。
眼下,很多人都意識(shí)到,人工智能技術(shù)這么發(fā)展下去,對(duì)算力資源的需求似乎是無窮無盡的,對(duì)于能源的需求也帶來了很大挑戰(zhàn)。
此前,有媒體報(bào)道稱,OpenAI的CEO薩姆·奧特曼與一些投資者溝通,計(jì)劃籌集7萬億美元做芯片,提高全球芯片產(chǎn)量,從而推動(dòng)人工智能發(fā)展。
最近,有媒體報(bào)道說微軟跟OpenAI要斥資1000億美元打造名為Stargate星際之門的AI超算,興建AI數(shù)據(jù)中心。
亞馬遜也沒閑著,計(jì)劃未來15年要投資1500億美元新建數(shù)據(jù)中心,以應(yīng)對(duì)人工智能和其他數(shù)字服務(wù)需求的激增。
AI的發(fā)展也引發(fā)了科技公司對(duì)于能源問題的擔(dān)憂,因?yàn)橛秒娏刻?,包括亞馬遜、谷歌和微軟等科技公司,也將目光投向包括核能和地?zé)崮茉趦?nèi)的清潔能源。
此前,OpenAI CEO薩姆·奧特曼也說過,AI需要更多能源,可能需要核聚變技術(shù)或者太陽能存儲(chǔ)技術(shù)上的突破。大型科技公司也投了很多能源創(chuàng)新企業(yè),都在尋找技術(shù)突破。
從目前來看,云計(jì)算服務(wù)商在解決算力和能源短缺方面有先天優(yōu)勢(shì),是大模型最合適的基礎(chǔ)設(shè)施。
因?yàn)?,云廠商不僅有數(shù)量龐大的數(shù)據(jù)中心資源,為了降低數(shù)據(jù)中心的運(yùn)營(yíng)成本,提高效率,云廠商在降低PUE和采用清潔能源上已經(jīng)有了非常多的探索。
想必OpenAI選擇與微軟的合作會(huì)有這一方面的考慮,而Anthropic與亞馬遜的合作也必然有同樣的考慮。
為了迎接生成式AI技術(shù)浪潮,亞馬遜做的準(zhǔn)備遠(yuǎn)不止投資Anthropic。
2023年的re:Invent大會(huì)上,亞馬遜云科技介紹了生成式AI相關(guān)的三層技術(shù)棧。
最底層是高性能基礎(chǔ)設(shè)施,可以提供包括最新的英偉達(dá)GH200芯片在內(nèi)的多種計(jì)算資源。同時(shí),亞馬遜也自研了Amazon Trainium訓(xùn)練芯片,為了提高訓(xùn)練效率,亞馬遜云科技的UltralClusters集群支持讓10萬多個(gè)Amazon Trainium2芯片一起做并行訓(xùn)練。
中間層,亞馬遜云科技通過Amazon Bedrock提供多種基礎(chǔ)模型,其中包括知名的開源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非開源模型。
Amazon Bedrock托管了這些模型,用戶可以直接通過API來調(diào)用,也可以在此基礎(chǔ)上做一些定制開發(fā)。用戶可以用它來創(chuàng)建知識(shí)庫,可以開發(fā)各種Agent代理,落地負(fù)責(zé)任的AI,同時(shí),還能幫助企業(yè)保持?jǐn)?shù)據(jù)的安全性和合規(guī)。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理 陳曉建表示,“從模型能力到真正的運(yùn)營(yíng)生產(chǎn)之間,企業(yè)還需要增加很多輔助能力。Amazon Bedrock提供一系列廣泛的能力,這些工程化的能力是企業(yè)在真正上生產(chǎn)環(huán)境時(shí)一定會(huì)需要的?!?/p>
第三層則是一些開箱即用的SaaS化的服務(wù),最有代表性的是對(duì)標(biāo)微軟Copilot的智能聊天機(jī)器人Amazon Q,這是一種專門為工作場(chǎng)景設(shè)計(jì)的ChatBot智能助手。此外,還有面向編程開發(fā)人員的平臺(tái)Amazon CodeWhisperer等。
Anthropic與亞馬遜的合作中,Anthropic將亞馬遜云科技作為首選云服務(wù)提供商,利用底層提供的Amazon Trainium及Amazon Inferentia芯片構(gòu)建模型。同時(shí),利用Amazon Bedrock來為提供Claude3基礎(chǔ)模型的長(zhǎng)期訪問權(quán)限。
Claude3剛發(fā)布的時(shí)候就上線到了Amazon Bedrock平臺(tái)上,現(xiàn)在是Amazon Bedrock上最強(qiáng)的大模型。
Claude 3 包含Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus三個(gè)模型,Claude 3 Opus是最強(qiáng)大的,在各種評(píng)測(cè)指標(biāo)上都表現(xiàn)出色,接近人類水平的理解和流暢度。Claude 3 Sonnet在能力和速度之間實(shí)現(xiàn)了一個(gè)平衡,Claude 3 Haiku最小,但速度最快。
Claude 3創(chuàng)造模型智能水平的新紀(jì)錄——在數(shù)學(xué)問題、編程練習(xí)和科學(xué)推理等標(biāo)準(zhǔn)評(píng)估中超越了所有現(xiàn)有模型。而且,它本身就具有多模態(tài)能力,支持圖像的輸入,支持更長(zhǎng)的上下文處理能力。而且,Claude 3能夠降低幻覺,提升回答準(zhǔn)確率。
彩蛋:本文的標(biāo)題就是Claude 3的Sonnet生成的,略有調(diào)整。