不是帮我写 meta 描述,不是生成关键词列表那种。
是真的,改代码,部署上线。
我去倒了杯水,回来,活儿做完了。
盯着屏幕看了一会儿,说不出话来。
不是因为技术有多牛,而是那一瞬间我意识到,这件事以前需要我打开 IDE,找到对应文件,改好,跑 CI,推上去,等 deploy,再回来检查。整条链路,Agent 自己跑完了。
我用的是 OpenClaw,配合 Claude Code,做建站自动化跑了一段时间了。一开始半信半疑,用着用着很难回去了。
坦率的讲,那时候我觉得我大概知道 Agent 是怎么回事了,更强的模型,加上更多的工具,加上更耐用的上下文管理。大脑更聪明,手更多,记性更好。
然后同一周,我读了两个东西,想法变了。
还有 openclaw 更新完最新版,经常不回复我,用claude给我定位了问题,最后是100% cpu卡死,造成事件无法回复我。我也要迁移到Hermes 爱马仕了

第一个是 Hermes。
Nous Research 做的开源 Agent 框架,国内中文资料不多。
老实说,开头我以为又是一个「支持 40 个工具、15 个平台、MCP 接 6000+ 应用」的 Agent 框架,这种开局我看麻了。
但有一个细节让我停住了。
Hermes 完成一个复杂任务之后,涉及五次以上工具调用的那种,会把整个解决过程沉淀成一份结构化的技能文档,存成 Markdown 文件。下次遇到类似任务,直接加载这份文档,不用从头推理。
更关键的是,这些技能在执行过程中会自我迭代。Agent 发现了更好的方法,会自动更新那份文档。有 Reddit 用户测试过,两小时内 Hermes 自己生成了三份技能文档,之后重复性研究任务的速度提升了 40%。
我看到这里停了一下。
因为我突然明白它在干什么。

它不是在等模型变聪明,它是在自己建自己的操作手册。每做完一件复杂的事,就把经验固化下来,下次不用从头推理,直接调用。用久了的 Agent,会越来越会做那些事。
这跟 OpenClaw 的路子完全不一样。OpenClaw 的技能系统主要靠人工写和社区贡献,ClawHub 上有个技能市场,找到合适的装上去用。Hermes 这边是把「写技能」这件事本身,也交给了 Agent 自己。
如果说 OpenClaw 是把工具交给 Agent,Hermes 是在教 Agent 自己造工具。
然后我在 X 上刷到了 Anthropic 发布 Claude Managed Agents 的消息。
然后看到了马东锡发的那条推。对了,这个不是韩国演员的马东锡

「本地的 Harness 是徒劳的,因为随着模型迭代把问题本身解决,针对旧模型局限而精心设计的 harness,便失去了存在的意义。换句话说,模型的局限性厂家最清楚,它可以完全按照模型的特性设计不同的 harness,然后打包卖给你。这个包,就是 Managed Agents。」
我当时就停下来了。
因为这句话在说我。
我一直以为,想让 Agent 跑得好,需要自己把调度逻辑搭好,自己设计 Harness,自己想清楚怎么管上下文、怎么处理工具调用的边界。这些我觉得是「用好 Agent」应该做的事。
但马东锡说的是,你对着模型当前局限性设计的那些东西,模型升级之后是累赘。
Anthropic 工程博客有个真实案例。Claude Sonnet 4.5 快到上下文窗口极限时会「焦虑」,草草结束任务,他们专门在调度框架里加了上下文重置来应对。Claude Opus 4.5 出来后,这个毛病消失了,之前那个补丁反而成了多余的逻辑。
你自己维护 Harness,每次模型升级你都得跟着改。交给 Anthropic,他们替你优化,打包卖给你。
那 Managed Agents 到底是什么?
一句话,你告诉 Anthropic 想要什么样的 AI Agent,它帮你在云端跑起来,基础设施全包,按用量收费。
和 Claude Code 的区别很直接。Claude Code 跑在你自己电脑上,关了电脑就停了。Managed Agents 跑在 Anthropic 的云上,24 小时不间断,断线了也不丢进度,你的产品可以直接内嵌 Agent 能力。
Notion 让用户在工作区里直接把任务分配给 Claude Agent,Agent 在后台跑完把结果交回来,全程不用离开 Notion。Sentry 做了从发现 bug 到提交修复代码的全自动流程,几周就上线了。Rakuten 在工程、产品、销售、财务各部门都部署了专项 Agent,每个一周内上线,通过 Slack 和 Teams 接任务,交回来的是表格、PPT、App 这些实际交付物。
之前这些事,需要一整个工程师团队干几个月。
背后的架构,Anthropic 管它叫「大脑和手分离」。

最早他们把所有东西塞进一个容器,AI 的推理循环、代码执行环境、会话记录,全在一起。好处是简单,坏处是鸡蛋全在一个篮子里,容器一挂,整个会话就没了。
后来做了一个关键拆分。大脑是 Claude 和调度框架,负责思考和决策。手是沙盒和各种工具,负责执行。记忆是独立的会话日志,记录发生的一切。三者互不依赖,任何一个挂了都不影响另外两个。
这个拆分带来几个实际的好处。首先是快,只有 Agent 真的需要跑代码时才按需启动沙盒,首次响应延迟中位数降了约 60%,极端情况降了超过 90%。然后是安全,代码跑在沙盒里,访问外部系统的凭证存在沙盒外面的安全保险箱里,两边物理隔离,Agent 全程不经手凭证本身。还有灵活,工程博客里有句话我觉得说得很好,调度框架不知道沙盒到底是一个容器、一部手机、还是一个宝可梦模拟器,只要符合「名字和输入进去,字符串出来」的接口就行。
你敢信???宝可梦模拟器那句不是我瞎编的,原文就这么写的。
我把这两件事放在一起想了一下。
Hermes 和 Managed Agents,一个是 5 美元 VPS 就能跑的开源框架,一个是 Anthropic 卖给企业的云端托管服务,看起来毫无关系。
但它们在解决同一个问题,谁来管 Harness?
Anthropic 的答案,我来管,云端运行,打包卖给你。
Hermes 的答案,Agent 自己来管,把经验沉淀成 Skill,Harness 随着使用越来越好。
两个截然不同的路径,收敛到了同一个判断。
Agent 的竞争,已经不在模型本身了。
真正的战场,在 Harness 上。
Anthropic 发布的 Claude Managed Agents 是一套可组合的 API,用于构建和部署云托管的 AI Agent。但跟市面上的 Agent 框架不同,Anthropic 卖的核心是 Harness(Agent 编排引擎):一个经过调优的编排循环,自动处理工具调用决策、上下文管理、错误恢复,并且随模型能力升级自动演进

这让我想到了 AWS。
2006 年之前,想跑一个互联网服务,得自己买服务器、租机房、配网络。AWS 出来之后,这些事全包了。
但 AWS 真正改变的不只是省了买服务器的钱,而是让「搭基础设施」这件事本身,从核心竞争力变成了可以外包的商品。
那批做托管机房的公司,业务空间开始被压缩。
真正赚到钱的,是那些想清楚了「只有在云上才能跑的产品是什么」的人。
现在,同样的事正在 Agent 这个赛道上发生。
Anthropic 在卖托管好的 Agent 运行服务,不只卖 token,而是卖 sandbox,卖 execution,卖 memory,卖完整的 Agent runtime。OpenAI 也推出了自己的 Agent 平台 Frontier。这个赛道的竞争刚刚开始。顺便说一下,Anthropic 的年经常性收入刚突破 300 亿美元,是去年 12 月的三倍,大部分增长来自企业客户。华尔街已经开始紧张了,WSJ 说投资者对传统 SaaS 公司的股价越来越谨慎,担心这类产品会让一些传统软件服务变得多余。
那批做通用 Agent 调度框架、通用 orchestration 封装的团队,日子开始难过了,因为上游平台在把这一层慢慢吃掉。
真正的问题变成了,你想清楚了没有,什么是只有 Agent 跑起来才能交付的东西?
我回头想了想我做的建站自动化。
我让 Agent 做 SEO 优化,它改了代码,部署上线,活做完了。
这件事真正难的不是 Agent 调用了多少个工具,而是这个任务有一个明确的「做完了」的标准,部署成功,SEO 指标改了,代码没挂,就算做好了。
Agent 最能发挥价值的地方,往往就是这种有明确交付物、可以验证结果的场景。做站、SEO 优化、QA 跑测试、外链检查,这些有个共同点,你可以清楚地知道它有没有做好。这比「帮我想想有没有什么好生意」这种任务,对 Agent 来说容易太多了。

所以我现在反而不担心 Agent 基础设施那一层了。Anthropic 在做,Hermes 在做,这层会越来越好,越来越便宜,越来越不需要自己操心。
我更在意的是,在你的行业,在你的具体场景里,那个「做完了」的标准是什么,以及能不能把这个判断标准教给 Agent。
那才是值得花时间的事。
怎么说呢,两件事加在一起,给了我一个有点意外的结论。
AI Agent 不再比谁更聪明了。
它在比谁的系统更会跑,比谁的经验积累更快,比谁更清楚在真实场景里「做完」意味着什么。
模型是里面那颗脑子,Harness 才是让它真正能干活的那套系统。
而 Harness 这件事,要么交给 Anthropic,要么交给 Hermes 的自进化循环,要么自己死磕,然后等模型升级,发现自己写的那些代码成了累赘。
更值得做的,是跑在 Harness 上的那一层,你的场景,你的流程,你的交付标准。
那些,是别人替代不了的。
永远对世界保持好奇。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
俊哥AI 前字节牛马 AI编程教练 链接我进交流群

夜雨聆风