圖片來源:視覺中國
藍鯨新聞5月17日訊(記者 朱俊熹)AI Agent(智能體)賽道持續升溫。繼本周Manus向所有人開放注冊、無需等待名單后,大模型獨角獸MiniMax也在其AI助手中開啟Agent內測。
內測頁面顯示,用戶可自行選擇“標準”或“深度”兩種模式,輸入任務并交由MiniMax Agent執行。其中,“深度”模式會進行深度推理,耗時較長,任務完成質量也相對較高。官方示例既包括對文檔進行事實核查等研究型任務,也支持搭建網站、規劃旅游行程等綜合性任務。目前MiniMax尚未對Agent設置額度或費用限制,而Manus已在3月底公布其分檔收費方案,按積分進行計費。
圖片來源:MiniMax網頁
藍鯨新聞實測發現,MiniMax內測中的Agent頁面與Manus存在相似之處。在執行過程中,MiniMax的Agent會對任務進行拆解,以思維鏈的方式呈現出具體步驟。它可以搜索、瀏覽中文互聯網的部分內容,包括一些實時資訊,并在思考過程中列出資料來源。
相比之下,Manus的思維鏈會更為簡潔,僅顯示關鍵步驟。而MiniMax會提供每一個步驟的初步結論,反復深度思考,對內容進行補充和糾錯。以“生成一份中國市場Agent的行業報告”這一相同任務為例,Manus在40分鐘內完成了一份1.2萬字的報告,MiniMax則在50分鐘內給出了8千字的報告。
圖片來源:MiniMax網頁
MiniMax還加入了顯示“當前進程”的視窗,用戶可以實時看到Agent的工作流。如果說另一家獨角獸智譜AI推出的智能體“AutoGLM沉思”,是通過跳轉打開不同網頁來可視化信息搜集的過程,MiniMax就更像是在“當前進程”一個窗口里集中呈現。
圖片來源:MiniMax網頁
事實上,MiniMax此前就曾透露過在發力智能體這一方向。據新華社報道,4月29日在向總書記現場匯報時,MiniMax創始人閆俊杰提及公司正在抓緊研發智能體。在閆俊杰參加的“下一代智能體的自主進化”沙龍活動中,現場參與者圍繞模態內容、上下文窗口、模型調用、任務復雜度、智能體協作五方面展開探討。其中,模態內容強調的是要向文本、語音、視覺多模態融合的方向進化。
圖片來源:CCTV
MiniMax對多模態的重視從早期便顯現出來。截至目前,公司自主研發了文本、語音、音樂、視頻、圖像等模型。基于這些不同模態的通用大模型,又推出了多款AI原生應用,包括Chatbot類智能助手MiniMax、海螺視頻,以及注重多模態的陪伴產品星野。
5月15日,MiniMax發布了最新的語音模型Speech 02。據其介紹,該模型具有足夠強的泛化能力,能夠駕馭32語種、不同口音、不同情緒的人聲。在兩項全球語音基準測評榜單中,MiniMax Speech 02排在第一,表現超越了OpenAI等模型。
在MiniMax提供的Agent示例中,它還可以幫忙生成一個3分鐘的通用冥想引導音頻,用戶甚至可以要求“使用溫柔的女性聲音”。盡管Manus也能完成同樣的任務,但生成的人聲效果明顯不及MiniMax。
“大模型六小龍”中,MiniMax是繼智譜AI之后第二家推出Agent的公司。去年10月以來,智譜陸續推出了能模擬人類操作手機、計算機等電子設備的智能體,支持跨應用操作,一句話讓AI幫忙發微信紅包或下單采購外賣。3月發布的AutoGLM沉思則主推“邊想邊干”。此外,月之暗面、階躍星辰也在探索Agent方向。據階躍星辰CEO姜大昕最新透露,其重點押注的是智能終端Agent,同樣強調要充分發揮多模態的優勢。
在科技行業看來,2025年有望成為AI Agent元年。目前這一賽道上已集聚了不同體量的玩家,既涌現出Manus、Genspark、Lovart等創業新秀,也有字節跳動、百度等互聯網大廠。就在本周早些時候,騰訊還表態稱借助微信生態,將有望打造一類獨特的智能體,連接起社交、內容、小程序等不同組件。
一位Agent創業者此前對藍鯨新聞表示,Agent領域仍在發展早期,滲透率還非常低。入局者們都還處于嘗試定義問題,并初步解決的階段。“其實當下不是大家關心競爭的時候,而是如何把產品做好。”