英偉達的智能體應用開發(fā)三層式架構

英偉達在今年CES大會中提出了智能體應用開發(fā)三層式架構軟件堆疊,協(xié)助企業(yè)快速實現(xiàn)應用落地,壯大智能體生態(tài)系。

英偉達的智能體架構是以區(qū)塊為基礎,最底層是模型預訓練的AI微服務NIM。NIM將GenAI執(zhí)行所需的模型和軟件進行優(yōu)化與封裝,并部署于任一環(huán)境中。這些微服務涵蓋多種AI模型,例如視覺模型、語言理解模型、語音模型(用于動畫)、數(shù)位生物學模型,以及最新的物理AI模型等。

再上一層是NeMo框架,類似數(shù)字員工養(yǎng)成的Pipeline,讓智能體能夠擔任多種工作角色,例如創(chuàng)作者、定制者、評價者、守護者,以及RAG檢索者,實現(xiàn)多樣化的應用場景。

為了讓智能體具備特定領域的專業(yè)技能與知識,英偉達采用類似員工培訓的方式,對智能體進行數(shù)字勞動力優(yōu)化。經(jīng)過培訓的智能體能代理多種工作角色,包括輔助研究助手、虛擬實驗室AI、軟件安全專家、影像分析師、AI銷售代表、客服人員、金融分析師、員工支援以及工廠運維管理者等,滿足各行業(yè)的多元需求。

比如影像分析AI代理,是基于英偉達Metropolis藍圖,整合英偉達Cosmos、Nemotron視覺語言模型、Llama Nemotron LLM和MeMo Retriever等,能快速分析攝影機的數(shù)據(jù),每天生成高達10萬TB的影片內(nèi)容。Metropolis代理可以應用到不同場景,例如在工業(yè)場域中,可以用來監(jiān)測作業(yè)流程并提供改善建議,同時從數(shù)據(jù)中偵測異常情況,調(diào)整工作者或機器的路線,協(xié)助避免意外事件的發(fā)生,提升生產(chǎn)效率與安全性。

英偉達提出智能體最后一層是數(shù)字AI代理人藍圖,英偉達提供多種開放原始碼藍圖,開發(fā)者可直接修改與擴展,用于建構特定領域的AI代理應用。在該藍圖中提供開發(fā)人員各種代理AI構建模組,包括CrewAI、Daily、LangChain、LlamaIndex和Weights & Biases等,協(xié)助其建立下一代智能體應用。

黃仁勛表示,企業(yè)智能體將成為AI工廠的核心驅(qū)動力,這些工廠將通過生成Token,為各行各業(yè)帶來前所未有的智慧化與生產(chǎn)力提升。他特別看好智能體在軟件行業(yè)的應用,并認為下一個人工智能服務的重要時刻將聚焦于軟件,這是所有開發(fā)者都需要的基礎。甚至預測,智能體有潛力成為下一個機器人產(chǎn)業(yè)的關鍵應用,創(chuàng)造兆億美元的商機。

不僅僅是應用在軟件行業(yè),隨著智能體應用逐漸成熟,也將影響企業(yè)內(nèi)部IT的運作模式。黃仁勛表示:“企業(yè)IT部門將轉型為類似智能體的HR部門?!彼M一步解釋,過去IT部門主要負責管理和維護大量來自IT行業(yè)的軟件,而未來的重點將轉向維護、培養(yǎng)和優(yōu)化數(shù)位代理,并將它們應用于企業(yè)內(nèi)部,提升運營效率。

分享到

崔歡歡

相關推薦