如上圖所示,Llama3 70B的表現(xiàn)甚至超越了谷歌的Gemini Pro1.5以及Anthropic的Claude 3 Sonnet。

Llama3顯著降低了錯誤拒絕率,提高了模型的對齊性,增加了模型響應(yīng)的多樣性。此外,它在邏輯推理、代碼生成和指令跟隨等方面的能力也大幅提升,整體的可控性也更強。

除了常規(guī)的跑分以外,這次Meta還開發(fā)了一個更接近真實體驗的測試。

Meta的測試中整理了1800個提示詞,把這些提示詞給到Meta3,Claude Sonnet,Mistral Medium和GPT-3.5這些模型,然后由人來評估這些回答的結(jié)果。

結(jié)果顯示,Llama3 70B指令優(yōu)化版比Claude Sonnet、Mistral Medium、OpenIA GPT-3.5以及Llama2都要更強一些。

看得出來,Llama3還是很強的,那么,要如何才能體驗到這款更強的新模型呢?

在Llama3發(fā)布后不久,亞馬遜云科技就發(fā)布了新聞稿,與此前幾次上架到Amazon Bedrock的不一樣,這次是上架到了Amazon SageMaker JumpStart上。

Amazon SageMaker JumpStart是亞馬遜云科技專門構(gòu)建的一個機器學(xué)習(xí)服務(wù),提供預(yù)訓(xùn)練的模型、內(nèi)置算法和預(yù)構(gòu)建的解決方案,幫助用戶快速了解評估模型,快速開發(fā)AI項目。

通過Amazon SageMaker JumpStart部署Llama 3,過程會相當(dāng)絲滑。用戶在JumpStart后臺能看到包括HuggingFace、Meta、Stability.ai等開發(fā)商的模型。

Meta標(biāo)簽下提供了多個Llama模型的版本,點擊查看Llama3 70B指令優(yōu)化版,這里有模型的介紹頁面,右上角還有顯眼的“Deploy”部署按鈕。

點擊“Deploy”按鈕之后,這里可以選擇云主機的規(guī)格,進行一些主要的設(shè)置。最后,就可以點擊部署來將其部署到對應(yīng)的實例上了。

模型部署操作非常簡單直白,部署后,用戶就可以用自己習(xí)慣的方式來進行開發(fā)了。

開發(fā)過程中,可以使用SageMaker Pipelines、SageMaker Debugger或容器日志等功能,來提升模型性能和并實施MLOps控制。

由于以上這些操作都是在亞馬遜云科技的平臺上完成的,無論是模型本身,還是涉及的相關(guān)數(shù)據(jù),都出于亞馬遜云科技提供的安全措施的保護之下。

如果想親自上手試試如何部署、開發(fā),可以查閱一下亞馬遜云科技的技術(shù)博客:

https://aws.amazon.com/cn/blogs/machine-learning/meta-llama-3-models-are-now-available-in-amazon-sagemaker-jumpstart/

Meta在博客中表示,未來還將開源更大的400B的版本,目前400B的還在訓(xùn)練中,如果未來某一天Llama3 400B突然發(fā)布了,也可以考慮來Amazon SageMaker JumpStart在第一時間上手。

眼下,各種新的更強的大模型還在不斷出現(xiàn),今天的最強可能明天就會被超越,面對大模型技術(shù)躍躍欲試的同時,又總會感到迷茫和焦慮。

對此,亞馬遜云科技CEO Adam Selipsky說:“事情發(fā)展得如此之快,在這種環(huán)境中,適應(yīng)能力是您可以擁有的最有價值的能力。不會有一個統(tǒng)治一切的模型,也肯定不會有一家公司能提供所有人使用的模型?!?/p>

既然新技術(shù)不斷出現(xiàn),就應(yīng)該試著去了解更新的技術(shù)。

過程中可以考慮利用亞馬遜云科技提供的便利的平臺和工具,亞馬遜云科技一直在做的事情就是讓各種技術(shù)的使用變得更簡單,在大模型面前,Amazon SageMaker JumpStart和Amazon Bedrock都是很好的開始。

分享到

zhupb

相關(guān)推薦