本周,Genspark官宣推出超級智能體(Super Agent),不僅能理解任務(wù)、制定計劃,還能自動執(zhí)行、調(diào)用80+外部工具完成工作。它能打電話訂餐、總結(jié)5小時的視頻并做成PPT、生成視頻劇本,甚至寫代碼、搭網(wǎng)站、建3D模型,全程無需人工干預(yù)。

不同于傳統(tǒng)LLM(大模型)輸出一問一答的方式,Genspark超級智能體是一個“多智能體混合系統(tǒng)”(Mixture-of-Agents)。它整合了8個規(guī)模各異、專長不同的語言模型(LLMs),類似一個AI團隊協(xié)作完成任務(wù):小模型快速響應(yīng),大模型負責(zé)復(fù)雜推理,從而實現(xiàn)更強的泛化能力與穩(wěn)定性。

比如你讓它“寫一個旅行計劃并幫我訂好酒店餐廳”,Super Agent不會只給你一串建議,而是能調(diào)用搜索工具篩選信息、調(diào)用語音工具打電話確認、調(diào)用文檔工具整理成行程表,把“計劃”落實成“執(zhí)行”。

而這背后就是Mixture-of-Agents架構(gòu)的優(yōu)勢——每個模型像一名專業(yè)的智能員工,協(xié)同完成多步驟流程,打破了傳統(tǒng)智能體“單線程”的執(zhí)行瓶頸。

光會“想”不夠,Super Agent真正打動用戶的,是它“動手”的能力。

官方披露,Super Agent集成了超過80種工具,包括:

? 搜索工具:用于信息提取、實時網(wǎng)頁抓取;

? 數(shù)據(jù)分析工具:處理表格、數(shù)據(jù)建模;

? 通信工具:能打電話、發(fā)郵件、與其他服務(wù)交互;

? 音視頻工具:生成圖像、音頻、剪輯視頻;

? 代碼工具:快速構(gòu)建前端應(yīng)用、生成腳本、部署網(wǎng)頁;

? AI工具:調(diào)用其他模型如DeepSeek R1或OpenAI GPT-4進行任務(wù)協(xié)作。

甚至,Super Agent會自動寫腳本、生成畫面、編輯字幕,輸出一條可直接發(fā)布到社交媒體的短視頻。全程無需打開任何編輯軟件,真正做到了0幀起號不是夢。

目前,Super Agent無需邀請碼、完全免費使用。

值得一提的是,Genspark背后的公司MainFunc,其創(chuàng)始人是原百度副總裁、前小度CEO景鯤,與前小度CTO朱凱華共同打造。公司成立于2024年6月,總部設(shè)在美國硅谷和新加坡。起初,Genspark主打AI搜索,憑借Agent驅(qū)動的搜索體驗完成6000萬美元種子輪融資,估值達4.35億元人民幣。

2025年3月,Genspark宣布完成A輪融資,新增1億美元,估值突破5.3億美元。但就在3月31日,他們發(fā)布重磅預(yù)告:“再見,AI搜索。你好,智能體時代。”

分享到

崔歡歡

相關(guān)推薦