大家好,我是海潮。
今天是5月11日,晚上8点。
过去两个月,我们聊了AI写作、AI绘画、AI编程、AI办公……几乎每一个话题的尽头,都会指向同一个方向:AI什么时候能替我把整件事干了,而不是只帮我写一段话、画一张图?
这个方向,就是当前AI领域最热的赛道——AI Agent(智能体)。
2026年春天,全球科技巨头几乎在同一时间亮出了自己的Agent产品:OpenAI发布Workspace Agents,Google推出Gemini Enterprise智能体平台,Manus的通用Agent引发热议。中信建投更是明确喊出:2026年,是Agent快速落地的元年。
种种信号都在提示,AI正在从“会聊天”走向“能干活”。今天这篇文章,我们就来系统梳理一下:AI Agent到底是什么?它走到了哪一步?以及——它什么时候能真正成为我们的“同事”?
一、从“聊天”到“干活”:一场主战场切换
先看一组数据。
OpenRouter数据显示,仅2026年4月,中国AI大模型周调用量已达12.96万亿Token,是美国的4倍多。更惊人的是,Agent对Token的消耗正以百倍、千倍的速度增长。
这组数字,指向了一个根本性的变化:2025年还是“千模混战”,2026年主战场已全面转向智能体。IDC中国研究总监卢言霞指出,强化Agent能力是基础大模型2026年的重要发展方向,覆盖深度研究、智能办公、AI代码助手等通用场景。
为什么会有这个转变?答案很朴素:模型再强,不能干活,对企业来说就没有价值。
360集团创始人周鸿祎用一个比喻说得很清楚:AI产业正进入“大模型+智能体”的双线进化阶段——大模型不断提升认知能力,智能体持续强化执行能力。两者一个负责“想”,一个负责“做”,缺一不可。
从市场规模来看,根据中商产业研究院的报告,2025年全球AI智能体市场规模约113亿美元,预计2026年将达175亿美元,2030年将超470亿美元。中国企业级AI智能体市场更为迅猛,预计从2024年的56亿元增至2029年的591亿元,复合年增长率高达60.2%。

二、AI Agent的核心能力:它凭什么“能干活”?
要回答这个问题,先要厘清一个概念:AI Agent和传统大模型到底有什么不同?
传统大模型,比如我们现在用的DeepSeek、Kimi,本质上是“对话系统”。你问一个问题,它给你一个答案。它的工作方式是“一次性的”:输入→输出,结束。
AI Agent则完全不同。它要完成的是“多步骤任务”——比如“帮我订一张下周五去上海的机票,顺便查一下那边的天气,再推荐几家附近的餐厅”。
要完成这个任务,Agent需要具备三个核心能力:
能力一:自主规划与任务分解
Agent拿到的是一个“目标”,而不是一个具体问题。它需要自己判断:为了达成这个目标,需要做哪几件事?先后顺序是什么?依赖关系是什么?
这才是Agent的“智能”所在。它不是按固定流程执行的机器人,而是能根据目标动态规划执行路径的自主系统。最新技术框架中,AutoAgent等系统已实现“演化认知”(evolving cognition)——Agent能从过去的经验中学习,不断优化自己的决策逻辑,在动态环境中做出可靠的上下文感知决策。
能力二:工具调用与执行
规划好了,还得会“做”。Agent需要有能力调用各种外部工具:浏览器、日历、邮件、API、数据库……2026年,业界正在推进Agent互操作性协议,让不同厂商的Agent能够互相协作、共享任务上下文。这意味着未来可能出现“Agent团队”——一个Agent负责查资料,另一个负责写报告,第三个负责发送。
能力三:持久化记忆与持续学习
这是当前Agent技术最前沿的方向,也是最关键的突破点。
做过Agent工程的人大概都有这种体感:“模型之外的东西比模型本身更重要”。换了最新的基座模型,Agent表现没有质的飞跃;但给模型加上持久化记忆、可复用的技能文档和标准化的工具接口,效果立竿见影。
近期值得关注的突破来自EverOS,它推出了业界首个专为自演化Agent设计的记忆层,配合技能演化引擎,让Agent能够从交互中自动提炼技能,复杂任务成功率最高提升了234.8%。此外,CA3Mem框架受人类海马体启发,将经验组织成结构化记忆图谱,在OSWorld和WebArena等测试平台上显著提升了长期规划、任务泛化和持续适应能力。
在商业实践中,记忆能力同样是区分Agent“能用”和“好用”的关键分水岭。Adobe近期升级的Firefly AI助手,核心亮点之一就是支持持久记忆和跨应用技能迁移,让智能体在不同设计任务间保持连贯的工作上下文。
三、全球格局:三股力量同台竞技
2026年Q1,五家头部机构同时推出不同形态的智能体产品,标志着AI Agent从实验室走向规模化应用。目前主要玩家可以分为三股力量:
第一股:科技巨头的平台级布局
OpenAI:4月23日正式发布Workspace Agents,内部已部署软件审查员、产品反馈路由器、周度指标报告员等5种应用实例。OpenAI的Operator在复杂浏览器任务基准测试中得分87%。企业营收已占OpenAI总营收的40%。
Google:同期发布Gemini Enterprise智能体平台,为企业提供构建、管理和治理AI智能体的一站式方案。在企业Agent市场,据调查,Anthropic以32%的份额领先,OpenAI占25%,Google占20%,但B2B市场仍处于早期阶段,格局远未定型。
国内阵营:阿里千问升级Agent能力,DeepSeek也在强化相关布局。
第二股:垂直场景的深度渗透
在制造、IT运维、内容生产等垂直领域,Agent已经不再是产线外的“观察员”,而是真正“入职”了制造业。以下三个案例的落地深度,代表了当前Agent应用的最高水平:
GE Appliances使用Gemini Enterprise,在其制造、物流和供应链运营中部署了800多个AI智能体,用于快速分析轮班数据、加速决策和提升产品质量。
ServiceNow与Google Cloud深度合作,将AI智能体串联成自主运作链条,覆盖5G网络、零售和IT系统,实现跨云、跨模型、跨数据源的企业级工作编排。
Adobe推出Firefly AI助手,深度融合企业级工作流并支持跨应用持久记忆;Canva 2.0以易用性见长,更适合中小企业。
第三股:通用智能体的探索
最具代表性的当属Manus。作为全球首款通用型AI智能体,它能自主完成深度研究、代码编写、市场分析等高复杂度任务,核心定位是“拥有广泛能力、能够解决开放式问题的系统”。
值得注意的是,Manus后来被Meta以20亿美元收购,但该交易最终被中国监管部门否决。这一事件的背后,折射出通用Agent作为战略性技术资产的敏感性。
Manus的起落提示我们:真正能解决开放式问题的通用Agent,仍然是AI领域最前沿、最具挑战性的技术高地。
四、落地现实:从“能跑”到“好用”有多远?
兴奋之余,必须面对一个冷静的现实:Agent的规模化落地,还远未到“开箱即用”的阶段。
根据行业调研机构2025年发布的《智能体工程状态报告》,企业AI Agent部署率已达57%,但规模化成功案例仅占23%,形成显著反差。这种“高部署、低成功”的矛盾,在金融等行业尤为突出。原因在于,一个真正可用的Agent,需要同时解决三个问题:规划准不准、调用顺不顺、记忆牢不牢。任何一个环节出问题,整个任务就会失败。
斯坦福大学教授吴恩达在近期对谈中指出,Agentic Workflow(智能体工作流)的核心价值在于通过迭代循环提升输出质量。他认为这个方向非常令人振奋,但距离成熟还有一段路要走。Manus联合创始人张涛则认为,通用智能体的终极形态应该是一个“拥有广泛能力、能够解决开放式问题的系统”。
对于开发者来说,目前构建Agent的主流框架包括LangChain、AutoGen、CrewAI等,各有侧重。这也是在5月9日工作流搭建指南的基础上,我们后续会专门深入的内容。
五、未来展望:Agent成为“同事”,还有多远?
从当前的发展态势来看,Agent的演进大致可以分为三个阶段:
第一阶段(我们现在所处的位置):“增强型工具”阶段。Agent作为辅助工具,在特定任务上帮助人类提高效率。比如自动整理会议纪要、自动筛选简历。这个阶段,Agent是你的助手,听你指挥。
第二阶段(1-2年内):“协作者”阶段。Agent能够独立完成端到端的任务,比如“帮我订酒店”这种多步骤任务。它不需要你每一步都确认,但关键决策点仍需你点头。这个阶段,Agent是你的同事,你们协作完成任务。
第三阶段(3-5年后):“自主执行者”阶段。Agent能够自主规划、执行、验证,并在完成后向你汇报。这个阶段,Agent是你的下属,你只需要交代目标,它自己想办法完成。
周鸿祎的判断是,AI正在从“会回答问题”走向“能动手干活”。这个转变一旦完成,企业的工作方式将被彻底重构。
写在最后
写这篇文章的时候,我在想一个问题:当AI真的能替我们“干活”了,我们做什么?
答案可能是:做AI做不了的那部分——判断、决策、创意、情感连接,以及承担后果。
AI Agent的能力越强,人类的角色就越需要从“执行者”转向“判断者”。我们不再需要操心“怎么做”,但必须想清楚“做什么”和“为什么做”。这不是AI的替代,而是任务分工的重组——就像工业革命把体力劳动交给机器,AI革命正在把脑力劳动中的重复部分交给智能体。
从这个角度看,2026年被称为“Agent元年”,或许还有一个更深层的含义:它不只是技术转折的节点,更是人与AI关系重新定义的起点。
Agent正在成为我们的“同事”。而我们要做的,是想清楚如何与这位新同事共事。
下期预告:5月13日(周三)晚8点,《程序员进阶:用AI写代码的5个高阶技巧(附实测案例)》。
夜雨聆风