继DeepSeek在AI圈掀起风暴之后,3月6日凌晨,来自中国的AI创业团队发布全球首款通用型AI智能体产品Manus,风头盖过了正在发布新品的苹果公司,也带来一场AI智能体的全民“科普教育”。
早在大语言模型横空出世的2022年,专家就预测到AI领域的下一个爆点将是AI智能体,因为它是普通人接触AI的“门户”,一如互联网时代的网页、移动互联网时代的App。然而,这两年它的发展一直不温不火,原因之一可能就来自缺乏一款能够让普通大众感知、理解“何为智能体”的普及型产品。如今,Manus一夜之间完成了这场期待已久的“市场教育”。
业内普遍认为,2025年是AI智能体元年。专家判断,今年的AI智能体将迎来属于自己的春天,和以往不同的是,胜出者未必是AI大厂,每个人都有机会。
智能体(Agent)一词出自人工智能创始人之一、认知科学家马文·明斯基在1985年出版的《心智社会》一书。当时,他只给出了模糊的解释,即当环境给予反馈时,智能体可根据反馈来改变策略,以便更好地与环境交互。
直到如今,科学界对智能体仍没有明确概念,但人们其实很早就接触到了智能体,比如2016年击败李世石的阿尔法狗。以通往通用人工智能(AGI)为终极目标,OpenAI将AI发展分为五个等级,AI Agent处于第三等级。第一等级和第二等级分别是对话机器人和推理模型,部分科技公司已较好实现了这两个等级,先进的推理模型综合表现已可达到博士生水平。
如果把第一和第二等级视为“修炼内功”阶段,那么处于第三等级的通用智能体则是AI真正开始执行复杂任务,并能做出合理的决策来实现人机协作。同时,AI智能体在大量实践中才能带来AI的能力跃升,进而升级至第四等级的创新者和第五等级的组织者。
Manus团队将其定义为“通用型AI智能体产品”,在其官网4分钟的演示视频中,Manus展示了其强大的工作能力。它可根据用户指令分解任务,比如解压一个包含10份简历的压缩包、自主浏览文件并根据候选人资料和评估给出招聘建议,或者分析股票市场。用户在下达指令后无需等候在电脑前,任务可在云端完成后发送通知,用户Kaiyun体育官方网站 开云登录网站查收即可。
相较于公众的热情追捧,业内对Manus的反应颇为冷静,因为AI智能体即将爆发已成为行业共识。据市场咨询机构高德纳预测,比智能体更智能的代理式人工智能(Agentic)在2025年十大战略技术趋势中位居首位,到2028年,将有15%的日常决策由代理式人工智能自主完成。
上海期智研究院学术带头人吴翼曾预判2024年会迎来AI智能体的爆发,2023年下半年发布的GPT-4V(有视觉功能的GPT-4 )已经展露了AI智能体的雏形,而大语言模型的能力提升则进一步解锁了AI的动作执行能力。去年底,谷歌发布的Gemini(双子座)2.0一口气推出3款AI智能体,除了搜网页、写代码等常规能力,它还可以在会线分钟的记忆,并以人类正常语速与人对话。
OpenAI、字节跳动、科大讯飞等国内外大厂也在“押宝”智能体。今年1月,OpenAI推出了名为“Operator”的AI智能体,并演示了其独立完成订票、购物、订餐等复杂任务的场景。该公司总裁兼联合创始人格雷格·布罗克曼在社交媒体上表示,2025年将是智能体元年。
全球第二大开源AI生态社区开放传神创始人陈冉也通过社区动向敏锐捕捉着行业热点,据他观察,搭建AI智能体“脚手架”的开发者正在迅速变多。智能体“脚手架”是指帮助用户快速构建、测试和部署智能体的基础框架和数据集,让普通人无需编程也能获取属于自己的AI助手。
无论是DeepSeek还是开发Manus的蝴蝶效应公司,越来越多“一夜刷屏”的产品和技术,来自名不见经传的小团队、小公司。陈冉认为,这样的趋势在智能体时代将成为常态。
陈冉展示了一个正在开发中的AI智能体,设有开发者和普通人两个入口,点击普通人入口时,只要对着屏幕说出自己想要的场景,后台就能自动生成相应画面,后续任何调整也只需通过“说”来完成。相较于大模型,智能体的开发门槛更kaiyun体育全站 Kaiyun登录网页低、适用场景更多。事实上,每一种人类与世界的交互都可以做成智能体,每个人都能根据自己的需求创建智能体,未来的工作模式将是一个人带着一群智能体完成。
日前举行的2025年信息与通信技术行业趋势年会上,中国工程院院士邬贺铨表示,2025年不仅是智能体的元年,也将是AI终端的元年。从个人助手、心灵导师到知心闺蜜、虚拟分身,尽管过去几年这条AI智能体赛道已熙熙攘攘,但Manus的“出圈”让公众真实意识到其中的潜力。
正如吴翼所说,“不一定非要成为优秀的程序员,用自然语言交互的方式,每个人都可以是自己的产品经理。也许智能体没有爆款,只有适合。”