乐于分享
好东西不私藏

三件事,说明AI Agent已经不是去年那个AI Agent了

三件事,说明AI Agent已经不是去年那个AI Agent了

2026.04.26 · 虾王观点

AI Agent行业观察MCP

去年这个时候,大家聊AI Agent还在说”前景广阔”。今年四月,三件事同时发生,我觉得有必要认真聊聊——Agent这个赛道,确实在发生结构性的变化。

我不是来报新闻的。作为一个每天都在用Agent干活、也在自己搭Agent的人,这个月发生的几件事让我有了一个比较强烈的感受:AI Agent正在同时完成架构、协议、落地三个层面的成熟。

这不是某个单点的突破。而是基础设施、行业标准、真实场景,三条线在同一个时间窗口里同时到位。

下面具体说。

第一件事:Anthropic把Agent拆成了”脑”和”手”

四月初,Anthropic发布了Claude Managed Agents公测版。Notion、Rakuten、Asana、Sentry这些公司排着队站台。

但真正值得关注的不是又多了一个Agent产品,而是它背后的架构思路——“脑手分离”

简单说,Managed Agents把一个Agent系统拆成了三个独立的组件:

🧠 Session(记忆)

一个只能追加写入的不可变事件日志,是整个系统的”真相来源”。独立于任何运行时组件存在。

🧠 Harness(大脑)

Claude的推理和工具路由循环。被设计为无状态组件——崩溃了可以立刻换一个,不影响任务继续。

🤚 Sandbox(双手)

隔离的执行环境,Agent在里面跑代码、调工具、编辑文件。和大脑物理隔离,安全凭据不会泄露。

这个设计解决了一个非常实际的问题:模型升级的时候,Agent系统不用跟着推倒重来。

我之前搭过Agent系统,深有体会。每次模型版本更新,原来跑得好好的提示词、工具调用逻辑、上下文管理,总有一部分要重新调。因为大多数Agent框架把模型调用、状态管理、执行环境耦合在一个进程里——改了一处,牵一发动全身。

阿里云开发者社区的分析文章这样评价:”Managed Agents并非给模型’加功能’,而是对智能体进行系统级重构:将大脑(决策)、手(执行)、记忆(状态)解耦为独立可调度角色。它让智能体真正具备可管理、可扩展、可编排的系统属性。”

用操作系统的类比来理解:Session相当于文件系统,Harness相当于CPU调度器,Sandbox相当于用户态进程。三者各自独立演进,通过稳定的接口交互。

据新浪报道,Anthropic称企业部署Agent的周期可以从”几个月缩短到几天”。这个数字有没有水分我不确定,但架构层面的思路确实是对的——Agent要进生产环境,首先要解决的不是模型有多聪明,而是系统有多可靠。

第二件事:MCP从”Anthropic的协议”变成了行业标准

如果你去年年底听说过MCP(Model Context Protocol),大概率会把它当作Anthropic自己搞的一套东西。毕竟2024年底才刚发布。

但现在的情况是这样的:

月SDK下载量:9700万次

活跃公共服务器:10000+

支持厂商:Anthropic、OpenAI、Google DeepMind、Microsoft、AWS全部原生支持

治理架构:已捐赠给Linux基金会旗下的Agentic AI Foundation

16个月,从一个公司的内部协议,变成全行业的事实标准。这个速度相当罕见。

为什么MCP能跑出来?我的理解是它解决了一个很具体的工程痛点:Agent怎么连接外部工具和数据源,需要一套统一的方式。

没有MCP之前

每接一个工具写一套适配代码。换模型、换框架,全部重写。N个模型×M个工具 = N×M个适配器。

有MCP之后

工具实现一次MCP Server,所有支持MCP的模型都能用。N+M个适配器搞定。像USB-C一样,一根线走天下。

今年3月发布的2026 MCP Roadmap里,几个重点方向值得关注:

Agent间通信:多Agent协作不再各搭各的桥,MCP要提供标准的Agent-to-Agent通道

Server Cards:类似npm包的描述文件,让Agent能自动发现和选择合适的MCP Server

DPoP认证扩展:企业级安全认证,解决生产环境的凭据管理

MCP Registry GA:从预览版走向正式发布,成为社区驱动的Server发现平台

MCP核心维护者Peter Alexander在1月的更新中写道:”2026将是MCP忙碌的一年。目前有多个活跃的SEP(规范增强提案)正在推进中,包括DPoP认证扩展、多轮SSE传输、以及Server Cards发现机制。”

Oracle已经在生产环境跑通了一个案例:Oracle Integration Cloud作为MCP工具提供方,AI Agent可以自动发现和调用预构建的集成流程——比如文档提取、风险评估——全程不需要人工干预。

我自己在用OpenClaw的过程中,MCP的体感变化也很明显。去年底接一个新工具,要写Skill文件、配命令、调参数。现在越来越多的服务直接提供MCP Server,装上就能用。工具集成的门槛,确实在快速降低。

第三件事:制造业一线员工开始自己造Agent了

这件事可能比前两件更有说服力。

4月21日,”飞书AI先锋大赛·先进制造专场”决赛。73家企业,146个参赛方案。台上站着的不是程序员,是工厂的一线工程师、产品经理、供应链负责人。他们带来的不是PPT里的概念,而是已经在产线上跑了几个月的真实Agent

几个数据很说明问题:

📊 TCL华星:年度降本200万+

委外供应商管理部门用飞书AI智能体构建了实时管理看板,成员”零介入”就能生成,AI自动给出不良品处理建议。据TCL华星禹志豪介绍:”AI智能体让我们从繁重的表格整理中解放出来,大幅缩短了不良品发现的响应时间。”

📊 海信集团:数据质量从95.4%→99.92%

没有急着上花哨的AI应用,而是先啃最难的骨头——底层数据治理。把主数据质量从95.4%提升到99.92%,为后续大规模智能化打下基础。

📊 亿咖通科技:库存周转天数65天→27天

构建智能协同平台,把库存周转天数从65天优化到27天,还同时覆盖杭州、香港、马来西亚、新加坡、越南五地的业务中心协同。

📊 北汽福田”长超小福”:全场冠军

依托飞书多维表格和OpenClaw技术框架,为工厂量身定制的AI智能体。针对商用车制造多品种、强柔性、高复杂度的特点,深入经营管理核心环节。

这些案例有一个共同特点:不是技术团队主导,是业务人员自己在用。

新华财经的报道标题说得很直白——”工厂一线员工成为AI开发者”。环球网的报道则用了另一个表述——”AI Agent’入职’中国制造”。

这意味着什么?Agent的使用门槛已经低到了业务人员可以自己上手的程度。不需要写代码,不需要懂模型原理,用飞书的低代码工具就能搭出解决实际问题的Agent。

三条线交汇:Agent行业的”成熟信号”

把这三件事放在一起看,会发现它们不是孤立的:

Managed Agents解决了”怎么造”——给Agent系统提供了生产级的架构范式

MCP解决了”怎么连”——让Agent和外部世界的对接有了统一标准

制造业落地证明了”能用”——不是实验室Demo,是真金白银的降本增效

与此同时,开源生态也在加速。OpenClaw在4月22日的更新中星标数已突破28万,社区技能包超过5000个,全球独立部署实例超过100万。CSDN的博客文章将2026年称为”智能体元年”,Anthropic的报告则说软件开发正在经历”自图形界面诞生以来最大规模的结构性革命”。

这些说法是不是夸张了?可能。但方向没问题。

去年大家讨论Agent,焦点还在”模型够不够聪明”。今年的焦点已经转向了“系统够不够可靠”、”工具够不够丰富”、”业务人员能不能用起来”。这才是一个技术从炒概念走向真落地的标志。

给虾友的三条实用建议

基于这个月的观察,我有几个具体的建议:

1. 关注MCP生态,现在入场正好

MCP Registry即将GA,Server Cards机制正在完善。如果你有现成的API或工具,现在封装成MCP Server发布出去,能吃到早期生态红利。MCP的TypeScript和Python SDK都已经很成熟,上手门槛不高。

2. 设计Agent时,先想解耦

Anthropic的”脑手分离”架构不一定要照搬,但核心思路值得学习:把推理逻辑、执行环境、状态存储分开。这样模型升级的时候不至于推倒重来,系统也更容易排查问题。

3. 找身边的”TCL华星”场景

不需要搞多宏大的Agent项目。找一个重复性高、规则明确、数据可获取的业务环节,用低代码工具搭一个Agent跑起来。先解决一个具体问题,再慢慢扩展。制造业一线员工都能做到的事,你也可以。

去年写Agent相关内容,经常有人问”这东西到底能不能用”。

现在我的回答是:能用,而且正在被大规模地用。

问题已经不是”能不能”,而是”你什么时候开始”。

🦐 虾王

AI智能体领域的自媒体

开发者 · 实践者 · 使用者

👆 关注虾王,一起在Agent浪潮里做个明白人

每天分享AI Agent一手实践经验和行业观察