昨晚,Anthropic 正式发布了 Claude Managed Agents。 官方的产品说法很直接:它是一组可组合的 API,用来构建和部署云端托管的 agents,目标是让团队把生产级 agent 从“几个月”缩短到“几天”。它已经以 public beta 的形式在 Claude Platform 上开放。(https://claude.com/blog/claude-managed-agents)
如果只看表面,这像是又一个 Agent 基础设施产品。
但我认为,这次发布真正重要的,不是 Anthropic 又补了一块能力,而是它把 ToB Agent 市场里一个更深的变化公开摆到了台面上:
ToB Agent 创业,正在从“做 agent 功能”进入“抢 runtime 层”的阶段。
换句话说,过去大家竞争的是:
谁更会做 Prompt、RAG、工作流、工具调用、多 Agent 编排。
而从现在开始,竞争会越来越变成: 谁能把 agent 真正变成企业里一个可持续运行、可管理、可审计、可恢复的“数字员工”。
这,才是 Claude Managed Agents 这次最值得看懂的地方。
一、这不是一个单纯的“Agent 产品发布”,而是 Anthropic 在定义新分工
Anthropic 官方产品文里,反复强调一件事:
做生产级 agent,真正花时间的不是前台体验,而是后面的基础设施——包括 sandboxed code execution、checkpointing、credential management、scoped permissions、end-to-end tracing。官方的原话甚至是:这些事往往会让团队在用户看见任何价值之前,就先花掉几个月。(Claude)
这句话的分量很重。
因为它实际上在重新定义 ToB Agent 市场的分工:
- 应用层团队,负责用户体验、场景理解、业务闭环
- 平台层,负责 agent runtime、权限、状态、恢复、治理
- 模型层,负责智能能力本身
也就是说,Anthropic 不只是说“我帮你托管 agent”,而是在说:
未来很多 ToB Agent 团队,不应该再自己重复造一套 agent runtime。
这对创业公司的含义非常现实。
过去一波 ToB Agent 创业,很多团队默认自己要全包:
- 自己封装 harness
- 自己管长会话
- 自己做状态持久化
- 自己管执行环境
- 自己做权限隔离
- 自己做 tracing 和 debug
- 自己处理模型升级导致的框架失效
但 Anthropic 这次相当于公开说: 这些东西会越来越重,而且还会随着模型演进不断过时。工程文里把这个问题讲得非常透:harness 会编码很多关于“模型还不会什么”的假设,而这些假设会随着模型进步而变陈旧。 他们甚至举了 context reset 的例子:在 Sonnet 4.5 上必要的机制,到了 Opus 4.5 上就变成了 dead weight。(https://www.anthropic.com/engineering/managed-agents)
所以这次发布的真正信号不是“Anthropic 多了个新功能”,而是:
Agent 创业公司的自建边界,正在被重新划线。
二、ToB Agent 创业,接下来最危险的公司,是“看起来什么都做,其实什么都在重复造轮子”
我觉得这次发布,对 ToB Agent 创业最直接的启发是:
以后最危险的一类公司,是把自己定义成“某某行业 Agent 公司”,但 60% 的精力其实花在自建 runtime 和运维底座上。
因为这类公司表面上在做行业场景,实际上在做的是:
- 云端托管执行
- 会话管理
- 权限体系
- 长任务恢复
- 沙箱环境
- Agent tracing
- 多 agent 调度
- 模型升级适配
问题在于,这些能力并不天然属于你的业务壁垒。
相反,它们更像一套越来越标准化的平台能力。
Anthropic 这次就把其中很大一块拿出来做成产品了:
长时间 autonomous sessions、多 agent coordination、trusted governance、sandboxing、tool execution、session tracing,这些都在它的产品定义里。(Claude)
这会直接带来一个创业层面的分化:
第一类公司,会被平台层“吃掉”
它们原来以为自己的壁垒是“能跑 agent”,
但后来发现,那只是平台厂商迟早会下沉提供的共性能力。
第二类公司,会被迫上移
它们必须把自己真正的价值,转到更靠近客户结果的地方去,比如:
- 行业任务模型
- 组织嵌入能力
- 业务闭环设计
- 人机协同机制
- 结果验收标准
- 角色切分与责任设计
- 数据与流程的组织化沉淀
这也是为什么我认为,ToB Agent 创业的窗口并没有缩小,但门槛变了。
以后不是“你会不会做 agent”就够了。
而是你要回答:
当 agent runtime 被平台层接管后,你还剩下什么独特价值?
三、这对“数字员工”品类,是一次很关键的外部验证
如果从“数字员工”这个品类看,这次发布的意义更大。
因为它其实在验证一个判断:
数字员工不是一个会聊天的前端形态,而是一个有运行系统支撑的岗位形态。
为什么这么说?
Anthropic 工程文里最核心的设计,不是什么华丽的多 Agent,而是把 agent 系统拆成了更稳定的接口:
- session:发生过什么的 append-only log
- harness:调用 Claude、路由工具调用的 loop
- sandbox:执行代码和编辑文件的环境 (https://www.anthropic.com/engineering/managed-agents)
这背后真正说明的,是 Agent 正在从“模型的一次使用”变成“一个可持续运行的执行单元”。
而一个企业里的“员工”,本来就不该只被理解为一个会说话的接口。
它至少还需要:
- 持续的状态
- 稳定的权限边界
- 明确的职责范围
- 可以恢复的任务过程
- 被追踪和审计的行为链
- 可以挂接不同工具和环境的执行能力
这次 Managed Agents 本质上就是把这些东西,开始产品化。
所以我会认为,它对“数字员工”品类最大的启发不是“Anthropic 也在做数字员工”,而是:
数字员工这个品类,正在从叙事概念进入系统概念。
以前很多公司讲数字员工,更多是在讲:
- 像人
- 会聊天
- 会调用工具
- 会做几个自动化动作
但以后这个品类如果想真正成立,定义它的核心会越来越变成:
它是不是一个能被企业纳入管理体系、能长时间运行、能承担职责并留下过程记录的执行主体。
从这个角度讲,Managed Agents 不是在定义“数字员工长什么样”,而是在定义:
数字员工至少要运行在什么样的系统之上。
四、Anthropic 这次其实在抢一个更高的位置:数字员工时代的“操作系统接口”
我觉得工程文里最不该被忽略的一句话,是它借用了传统计算机系统设计的思路:
为“尚未被想出来的程序”设计抽象。它把 session、harness、sandbox 这些接口,类比成操作系统里那些能长期稳定存在、而具体实现可以不断变化的抽象层。(Anthropic)
这很像什么?
很像在数字员工时代,争夺“操作系统接口”。
今天很多人还把 Agent 看成“应用功能”。
但 Anthropic 这次做的事更像是:
把 Agent 运行时里最底层的几个核心抽象先占住。
如果这条路成立,未来大量企业应用层 Agent 都可能长成这样:
- 上层是垂直场景、岗位流程、业务结果
- 中间是行业化的人机协作逻辑
- 底层跑在某家平台提供的 agent runtime 上
这意味着谁控制 runtime,谁就控制了:
- agent 如何被创建
- 如何接工具
- 如何拿权限
- 如何保状态
- 如何恢复
- 如何追踪
- 如何并行扩展
- 如何随着模型升级继续兼容
工程文里甚至给出了非常具体的架构收益:
把 brain 从 container 里拿出来、与 hands 解耦之后,他们的 p50 TTFT 下降约 60%,p95 下降超过 90%;而且 harness 和 container 都可以像 cattle 一样被替换,不再是必须“养着”的 pet。(Anthropic)
这说明 runtime 不是后台配角,反而是决定 Agent 能否规模化的主战场之一。
五、所以,ToB Agent 创业下一阶段该怎么选位置?
如果把这次发布翻译成创业判断,我会给一个很直接的结论:
不要再把“会跑 agent”当成产品定义
以后“能托管运行一个 agent”会越来越像云服务的基础能力。
这部分还值得做,但更像平台生意,不像多数垂直创业公司的主要壁垒。
真正值得占的,是“岗位结果层”
也就是你是否真正理解一个岗位要完成什么结果,而不是只理解它会调用哪些工具。
换句话说,未来更值钱的不是“某岗位 Agent”,而是:
某岗位的完成定义、责任边界、协作路径、异常处理和结果验收标准。
数字员工公司的核心,不该是“像人”,而该是“像岗位”
这个差别很大。
“像人”更容易做成演示。
“像岗位”才可能做成 ToB 产品。
岗位意味着什么?
意味着它有:
- 输入
- 输出
- 责任
- SLA
- 权限
- 升级机制
- 交接机制
- 审计要求
而这些东西,恰恰需要 runtime 和业务设计一起完成,不是一个会聊天的模型就能定义出来的。
创业机会没有消失,反而更清晰了
Anthropic 把底层拿走,并不意味着创业机会变少。
恰恰相反,它让很多团队终于可以不用再重复造底座,而把精力放在更难被复制的地方:
- 垂直行业 know-how
- 组织流程重构
- 人机协作设计
- 业务数据闭环
- 结果可验证性
- 复盘与持续改进机制
也就是说,ToB Agent 创业正在从“工程堆叠竞争”进入“组织理解竞争”。
结尾
所以,昨晚 Anthropic 发布 Managed Agents,我认为最重要的不是它又多了一个 Agent 产品。
真正重要的是,它把一个行业趋势讲清楚了:
Agent 正在从一种“模型使用方式”,变成一种“企业执行单元”;而数字员工真正的竞争,也正在从“前台智能感”转向“后台运行系统 + 岗位结果设计”。
这对 ToB Agent 创业者的提醒很直接:
不要再问,
“我能不能也做一个 Agent 平台?”
更该问的是:
当平台层把 runtime、权限、会话、沙箱、恢复都标准化之后,你还能为企业提供什么不可替代的岗位结果?
这,才是下一阶段真正的分水岭。
参考
Anthropic 将 Claude Managed Agents 定义为一组用于构建和部署云端托管 agents 的可组合 API,目前为 public beta,并强调生产级 agent 需要 sandboxing、checkpointing、credential management、scoped permissions、tracing 等基础设施。(Claude)
Anthropic 工程文解释了其核心架构:将 session、harness、sandbox 虚拟化为稳定接口,把 brain 与 hands 解耦,以支持长任务、恢复、权限隔离与 many brains / many hands 的扩展。(Anthropic)
Lance Martin 在 X 上也将其概括为“预构建、可配置、运行在托管基础设施上的 agent harness”。(X (formerly Twitter))
夜雨聆风