AI博客解读:Anthropic 发布 Managed Agents:ToB Agent 创业,开始从“做功能”转向“抢岗位”

昨晚，Anthropic 正式发布了 Claude Managed Agents。官方的产品说法很直接：它是一组可组合的 API，用来构建和部署云端托管的 agents，目标是让团队把生产级 agent 从“几个月”缩短到“几天”。它已经以 public beta 的形式在 Claude Platform 上开放。(https://claude.com/blog/claude-managed-agents)

如果只看表面，这像是又一个 Agent 基础设施产品。

但我认为，这次发布真正重要的，不是 Anthropic 又补了一块能力，而是它把 ToB Agent 市场里一个更深的变化公开摆到了台面上：

ToB Agent 创业，正在从“做 agent 功能”进入“抢 runtime 层”的阶段。

换句话说，过去大家竞争的是：

谁更会做 Prompt、RAG、工作流、工具调用、多 Agent 编排。

而从现在开始，竞争会越来越变成：谁能把 agent 真正变成企业里一个可持续运行、可管理、可审计、可恢复的“数字员工”。

这，才是 Claude Managed Agents 这次最值得看懂的地方。

一、这不是一个单纯的“Agent 产品发布”，而是 Anthropic 在定义新分工

Anthropic 官方产品文里，反复强调一件事：

做生产级 agent，真正花时间的不是前台体验，而是后面的基础设施——包括 sandboxed code execution、checkpointing、credential management、scoped permissions、end-to-end tracing。官方的原话甚至是：这些事往往会让团队在用户看见任何价值之前，就先花掉几个月。(Claude)

这句话的分量很重。

因为它实际上在重新定义 ToB Agent 市场的分工：

应用层团队，负责用户体验、场景理解、业务闭环
平台层，负责 agent runtime、权限、状态、恢复、治理
模型层，负责智能能力本身

也就是说，Anthropic 不只是说“我帮你托管 agent”，而是在说：

未来很多 ToB Agent 团队，不应该再自己重复造一套 agent runtime。

这对创业公司的含义非常现实。

过去一波 ToB Agent 创业，很多团队默认自己要全包：

自己封装 harness
自己管长会话
自己做状态持久化
自己管执行环境
自己做权限隔离
自己做 tracing 和 debug
自己处理模型升级导致的框架失效

但 Anthropic 这次相当于公开说：这些东西会越来越重，而且还会随着模型演进不断过时。工程文里把这个问题讲得非常透：harness 会编码很多关于“模型还不会什么”的假设，而这些假设会随着模型进步而变陈旧。他们甚至举了 context reset 的例子：在 Sonnet 4.5 上必要的机制，到了 Opus 4.5 上就变成了 dead weight。(https://www.anthropic.com/engineering/managed-agents)

所以这次发布的真正信号不是“Anthropic 多了个新功能”，而是：

Agent 创业公司的自建边界，正在被重新划线。

二、ToB Agent 创业，接下来最危险的公司，是“看起来什么都做，其实什么都在重复造轮子”

我觉得这次发布，对 ToB Agent 创业最直接的启发是：

以后最危险的一类公司，是把自己定义成“某某行业 Agent 公司”，但 60% 的精力其实花在自建 runtime 和运维底座上。

因为这类公司表面上在做行业场景，实际上在做的是：

云端托管执行
会话管理
权限体系
长任务恢复
沙箱环境
Agent tracing
多 agent 调度
模型升级适配

问题在于，这些能力并不天然属于你的业务壁垒。

相反，它们更像一套越来越标准化的平台能力。

Anthropic 这次就把其中很大一块拿出来做成产品了：

长时间 autonomous sessions、多 agent coordination、trusted governance、sandboxing、tool execution、session tracing，这些都在它的产品定义里。(Claude)

这会直接带来一个创业层面的分化：

第一类公司，会被平台层“吃掉”

它们原来以为自己的壁垒是“能跑 agent”，

但后来发现，那只是平台厂商迟早会下沉提供的共性能力。

第二类公司，会被迫上移

它们必须把自己真正的价值，转到更靠近客户结果的地方去，比如：

行业任务模型
组织嵌入能力
业务闭环设计
人机协同机制
结果验收标准
角色切分与责任设计
数据与流程的组织化沉淀

这也是为什么我认为，ToB Agent 创业的窗口并没有缩小，但门槛变了。

以后不是“你会不会做 agent”就够了。

而是你要回答：

当 agent runtime 被平台层接管后，你还剩下什么独特价值？

三、这对“数字员工”品类，是一次很关键的外部验证

如果从“数字员工”这个品类看，这次发布的意义更大。

因为它其实在验证一个判断：

数字员工不是一个会聊天的前端形态，而是一个有运行系统支撑的岗位形态。

为什么这么说？

Anthropic 工程文里最核心的设计，不是什么华丽的多 Agent，而是把 agent 系统拆成了更稳定的接口：

session：发生过什么的 append-only log
harness：调用 Claude、路由工具调用的 loop
sandbox：执行代码和编辑文件的环境 (https://www.anthropic.com/engineering/managed-agents)

这背后真正说明的，是 Agent 正在从“模型的一次使用”变成“一个可持续运行的执行单元”。

而一个企业里的“员工”，本来就不该只被理解为一个会说话的接口。

它至少还需要：

持续的状态
稳定的权限边界
明确的职责范围
可以恢复的任务过程
被追踪和审计的行为链
可以挂接不同工具和环境的执行能力

这次 Managed Agents 本质上就是把这些东西，开始产品化。

所以我会认为，它对“数字员工”品类最大的启发不是“Anthropic 也在做数字员工”，而是：

数字员工这个品类，正在从叙事概念进入系统概念。

以前很多公司讲数字员工，更多是在讲：

像人
会聊天
会调用工具
会做几个自动化动作

但以后这个品类如果想真正成立，定义它的核心会越来越变成：

它是不是一个能被企业纳入管理体系、能长时间运行、能承担职责并留下过程记录的执行主体。

从这个角度讲，Managed Agents 不是在定义“数字员工长什么样”，而是在定义：

数字员工至少要运行在什么样的系统之上。

四、Anthropic 这次其实在抢一个更高的位置：数字员工时代的“操作系统接口”

我觉得工程文里最不该被忽略的一句话，是它借用了传统计算机系统设计的思路：

为“尚未被想出来的程序”设计抽象。它把 session、harness、sandbox 这些接口，类比成操作系统里那些能长期稳定存在、而具体实现可以不断变化的抽象层。(Anthropic)

这很像什么？

很像在数字员工时代，争夺“操作系统接口”。

今天很多人还把 Agent 看成“应用功能”。

但 Anthropic 这次做的事更像是：

把 Agent 运行时里最底层的几个核心抽象先占住。

如果这条路成立，未来大量企业应用层 Agent 都可能长成这样：

上层是垂直场景、岗位流程、业务结果
中间是行业化的人机协作逻辑
底层跑在某家平台提供的 agent runtime 上

这意味着谁控制 runtime，谁就控制了：

agent 如何被创建
如何接工具
如何拿权限
如何保状态
如何恢复
如何追踪
如何并行扩展
如何随着模型升级继续兼容

工程文里甚至给出了非常具体的架构收益：

把 brain 从 container 里拿出来、与 hands 解耦之后，他们的 p50 TTFT 下降约 60%，p95 下降超过 90%；而且 harness 和 container 都可以像 cattle 一样被替换，不再是必须“养着”的 pet。(Anthropic)

这说明 runtime 不是后台配角，反而是决定 Agent 能否规模化的主战场之一。

五、所以，ToB Agent 创业下一阶段该怎么选位置？

如果把这次发布翻译成创业判断，我会给一个很直接的结论：

不要再把“会跑 agent”当成产品定义

以后“能托管运行一个 agent”会越来越像云服务的基础能力。

这部分还值得做，但更像平台生意，不像多数垂直创业公司的主要壁垒。

真正值得占的，是“岗位结果层”

也就是你是否真正理解一个岗位要完成什么结果，而不是只理解它会调用哪些工具。

换句话说，未来更值钱的不是“某岗位 Agent”，而是：

某岗位的完成定义、责任边界、协作路径、异常处理和结果验收标准。

数字员工公司的核心，不该是“像人”，而该是“像岗位”

这个差别很大。

“像人”更容易做成演示。

“像岗位”才可能做成 ToB 产品。

岗位意味着什么？

意味着它有：

输入
输出
责任
SLA
权限
升级机制
交接机制
审计要求

而这些东西，恰恰需要 runtime 和业务设计一起完成，不是一个会聊天的模型就能定义出来的。

创业机会没有消失，反而更清晰了

Anthropic 把底层拿走，并不意味着创业机会变少。

恰恰相反，它让很多团队终于可以不用再重复造底座，而把精力放在更难被复制的地方：

垂直行业 know-how
组织流程重构
人机协作设计
业务数据闭环
结果可验证性
复盘与持续改进机制

也就是说，ToB Agent 创业正在从“工程堆叠竞争”进入“组织理解竞争”。

结尾

所以，昨晚 Anthropic 发布 Managed Agents，我认为最重要的不是它又多了一个 Agent 产品。

真正重要的是，它把一个行业趋势讲清楚了：

Agent 正在从一种“模型使用方式”，变成一种“企业执行单元”；而数字员工真正的竞争，也正在从“前台智能感”转向“后台运行系统 + 岗位结果设计”。

这对 ToB Agent 创业者的提醒很直接：

不要再问，

“我能不能也做一个 Agent 平台？”

更该问的是：

当平台层把 runtime、权限、会话、沙箱、恢复都标准化之后，你还能为企业提供什么不可替代的岗位结果？

这，才是下一阶段真正的分水岭。

参考

Anthropic 将 Claude Managed Agents 定义为一组用于构建和部署云端托管 agents 的可组合 API，目前为 public beta，并强调生产级 agent 需要 sandboxing、checkpointing、credential management、scoped permissions、tracing 等基础设施。(Claude)

Anthropic 工程文解释了其核心架构：将 session、harness、sandbox 虚拟化为稳定接口，把 brain 与 hands 解耦，以支持长任务、恢复、权限隔离与 many brains / many hands 的扩展。(Anthropic)

Lance Martin 在 X 上也将其概括为“预构建、可配置、运行在托管基础设施上的 agent harness”。(X (formerly Twitter))