今天 AI Agent 圈最明显的变化,不是又多了一个聊天入口,而是“后台常驻”和“可治理执行”开始变成主线。
OpenClaw 继续快速发版,Hermes Agent 没有新正式版,但 PR 还在围绕安全、浏览器工具、看板路由这些细节往前补。大厂这边,Google、Anthropic、OpenAI、DeepSeek 相关动态也都指向同一件事:Agent 不再只负责回答问题,而是要长期接住任务、进入流程、留下记录。
OpenClaw 与 Hermes Agent 项目动态
OpenClaw 今天有明确新动态。GitHub Release 显示,[openclaw/openclaw](https://github.com/openclaw/openclaw) 在 5 月 23 日发布了 v2026.5.22-beta.1,仓库当前约 37.4 万 Star、7.8 万 Fork,主语言 TypeScript,MIT 协议,最近推送时间在 5 月 23 日晚间。
这次 beta 不是一个“单点炫技”版本,更像一次工程化补课。Release 里大量内容集中在文档、Gateway 启动路径、WhatsApp QR 与 408 恢复、cron 输出语言提示、插件 fallback、浏览器 CDP 诊断、Plugin SDK allowlist、队列恢复和远程 onboarding token 等细节上。
这些词看起来很碎,但对真正跑 Agent 的人很关键。一个个人 AI 助手要长期在线,最难的往往不是“能不能调用模型”,而是出错后用户能不能恢复、插件能不能被安全限制、网关重启后状态会不会丢、远程接入时 token 和权限能不能讲清楚。
OpenClaw 最近几个 PR 也很有代表性。比如 fix(agents): derive overflow budgets from provider errors 处理 provider 错误里的上下文溢出预算,fix: robust token usage normalization for OpenAI-compatible providers 统一 OpenAI 兼容服务的 token 用量,add .catch() to fire-and-forget subagent lifecycle promises 则补上子智能体生命周期里容易被忽略的异步错误。
这些都不是普通用户会截图转发的功能,但它们决定 Agent 能不能稳定跑。开发者如果要把 OpenClaw 放进真实工作流,今天更应该关注这些“看不见的修补”:预算、错误、生命周期、恢复提示。Agent 从 Demo 走向日常工具,拼的就是这些地方。
Hermes Agent 这边,今天没有新的正式 Release。主仓库 [NousResearch/hermes-agent](https://github.com/NousResearch/hermes-agent) 最新正式版仍是 5 月 16 日的 v2026.5.16,也就是 v0.14.0。GitHub API 显示,仓库当前约 16.4 万 Star、2.7 万 Fork,主语言 Python,MIT 协议,最近推送时间在 5 月 23 日。
没有新 Release,但代码层面并不安静。最近更新的 PR 包括 fix(security): use exact-or-subpath match for skills_guard trusted-repo tier、feat(kanban): add chat triage board routing、fix(browser_tool.py): use AGENT_BROWSER_ARGS for sandbox bypass、fix(gateway): match extract_media extension list to extract_local_files。
这组 PR 的共同点很清楚:Hermes 正在补“可信执行”的边界。skills guard 的路径匹配是安全问题,看板路由是多任务协作问题,浏览器参数是工具执行环境问题,媒体提取扩展名则是输入输出一致性问题。它们都不性感,但都很实际。
Hermes v0.14.0 的 Release 体量也值得记一下:官方写明自 v0.13.0 以来有 808 次提交、633 个合并 PR、1393 个文件变更、16.5 万行新增、545 个 issue 关闭。这个版本的重点是安装运行、OAuth Provider、本地 OpenAI 兼容代理、X 搜索、工具和技能生态。换个角度看,Hermes 已经不是“一个 Agent CLI”,而是在把模型账号、工具调用、长期记忆、任务追踪和本地代理拼成一套开发者操作系统。
今天对 OpenClaw 和 Hermes 的判断可以很明确:两边都在从“能跑任务”转向“能被管理”。OpenClaw 更像个人助手和多平台入口,Hermes 更像开发者工作台和技能系统。下一阶段真正拉开差距的,不会是一次回答有多聪明,而是谁能把权限、恢复、日志、预算和多 Agent 调度做得更稳。
AI 行业热门新闻解读
第一条行业新闻,还是 Google I/O 余波。百度 AI 搜索今天抓到的行业汇总里,Gemini、Chrome Agent 化、个人智能、Veo 和通用世界模型 Project Genie 仍是高频词。相关报道提到,Google 正在把 Chrome 重构成 AI 优先、代理化的浏览器,并把 Gemini 应用和搜索里的个人智能继续往前推。
这对开发者的信号很直接:浏览器会变成 Agent 的主战场。过去我们让 Agent 调 API、跑命令、改代码;下一步,它要在浏览器里理解页面、跨站点操作、处理登录态、管理通知和表单。浏览器工具链的稳定性,会像今天的 shell 工具链一样重要。
这也解释了为什么 OpenClaw 和 Hermes 都在补浏览器、Gateway、权限和恢复能力。Agent 一旦进入浏览器,就会碰到真实世界最麻烦的部分:验证码、弹窗、跨域、会话过期、文件上传、隐私权限。模型本身再强,也绕不过这些工程细节。
第二条是 AI 编程 Agent 继续升温。过去一周,Claude Code、OpenAI Codex、GitHub Copilot Cloud Agent、DeepSeek Agent Harness 等名字被频繁放在一起讨论。它们争的不是“谁更会补全一行代码”,而是谁能拿到一个目标后自己拆任务、改文件、跑测试、给出可审计结果。
这里有个很现实的拐点:AI 编程工具正在从 IDE 插件变成异步同事。IDE 插件是你盯着它写;异步同事是你把 issue 丢过去,它自己开分支、跑命令、遇到权限问题再回来问。这个变化会把竞争焦点从模型能力推到工作流能力。
但越是异步,越不能只看速度。真正要进团队的 Agent,至少要做到三件事:每一步能追溯,危险操作有边界,失败后能恢复。否则它写代码越快,团队背锅也越快。
第三条是企业侧继续加码。搜索结果里关于 Google、Meta、OpenAI、Anthropic 的投资和企业落地信息很多,其中共同主线是 AI 资本开支继续上升,模型 API 调用和企业工作流都在增长。Anthropic 过去几天围绕企业客户、工具链、API、SDK、MCP Server 的动作,也能看出它想从模型供应商变成企业执行层。
企业为什么会买 Agent?答案不是“聊天更自然”,而是大量流程可以被拆成可执行步骤:资料收集、文档比对、代码修改、审计记录、报告生成、审批流推进。模型只是其中一环,真正值钱的是把这些步骤接进已有系统,并且让负责人敢签字。
这也是开发者工具的新机会。未来的 Agent 产品不一定要比 Gemini、Claude、GPT 更会推理,但必须更懂某个场景的工具链。谁能把权限、数据、日志、回滚、成本和审批打通,谁就能在垂直领域拿到位置。
今日总结
今天的主线可以压成一句话:Agent 生态正在从“能力展示”进入“治理竞争”。OpenClaw 的新 beta 在补恢复、网关、插件和队列细节;Hermes Agent 在补安全、看板、浏览器工具和媒体处理;行业里的大厂则在把 Agent 推向浏览器、企业流程和长期任务。
对开发者来说,接下来几个月不要只盯模型排行榜。更值得盯的是几个朴素问题:Agent 能不能解释自己做了什么,能不能限制自己不能做什么,能不能在失败后恢复,能不能把成本算清楚,能不能被团队协作流程接住。
今天的结论很简单:Agent 的上半场拼“会不会干活”,下半场拼“能不能放心托管”。会干活只是入场券,能被管理才是护城河。
夜雨聆风