AI编程工具一周大乱斗:4款主流工具集体升级,谁在真进步?

这一周（5/31-6/6）AI 编程工具圈几乎在"集体冲刺"——四款主流工具全部发了新版本：

• OpenClaw 2026.6.1（6/1）— 技能工坊、通道加固、多智能体编排• Claude Code 2.1.166（6/6 凌晨）— 20+ 修复 + fallback 模型 + 跨会话加固• Codex CLI 0.137.0（6/4）— Multi-agent v2 稳定、企业管理、TUI 升级• Hermes Agent v0.16.0（6/5）— 桌面应用正式发布、170 位贡献者

我把这四份 release notes 全部精读了一遍。下面是一次性深度对比：谁在真进步，谁在凑热闹，谁在悄悄掉队。

一、OpenClaw 2026.6.1：技能生态+多模型+多通道全方位加固

从 2026.5.28 升级到 2026.6.1，老金（我自己）已实装运行。这版的发布说明分三层：

🔧 稳定性（Highlights 第 1-4 条） • Agent/CLI 运行时更稳：工具调用中断、会话绑定失效、压缩交接、媒体重试都修了 • 9 个通道加固：Telegram / WhatsApp / iMessage / Slack / Discord / Teams / Google Chat / Meet / iOS Talk • 所有 provider 和 plugin 请求加超时封顶——OAuth 设备码、媒体下载、本地服务探针、内容轮询 • Skills/session/gateway/plugin 状态在热路径上做了去重🎯 核心新功能（Highlights 第 5-8 条） • Skill Workshop 完整版：在 Control UI 里能列提案、修订、审阅、搜索、文件预览、复用会话路由 • Workboard 编排：多 agent 规划和运行追踪、任务看板评论 • Code Mode 命名空间：scoped agent/global session、精确命名空间工具分发、MCP API 文件 • Chat/UI 启动优化：发送不被历史加载阻塞、流式增量渲染、跳过 markdown、首输出延迟追踪🤖 模型/Provider 接入 • MiniMax M3 模型支持（1M 上下文）——OpenClaw 用户第一次可以原生用 M3 • Google/Vertex 目录修复、OpenRouter SQLite 缓存 • Copilot Claude 1M 能力、Foundry 推理对齐、OpenAI 响应重放保护 • 用 MiniMax 账号 OAuth 端点（不再是裸 API Key）

老金判断：这版本质是 "AI 框架 OS 化"——技能工坊 + 多 agent 编排 + 多通道 + 多模型 = OpenClaw 已经从"AI 框架"演化成"AI 中间件"。这才是 AI 框架真正的护城河：不是某个模型强，是把所有模型、通道、技能、Agent 串起来。

二、Codex CLI 0.137.0：Multi-agent v2 稳定，向"白领"扩张

先说一个数字：Codex 周活突破 500 万（OpenAI 6/2 内部报告），自 2 月桌面端上线后增长 6 倍。其中 20% 是非程序员的"知识工作者"，增速是开发者的 3 倍。

这个背景下看 0.137.0 的更新：

🆕 New Features • TUI 控件升级：F13-F24 键位、搜索菜单粘贴、reasoning-only 状态项 • 企业管理：月信用额度、云管理配置、EDU 工作区 • 远程控制：app-server v2 RPC 配对 + 控制器授权列表/撤销 • 插件工作流：JSON 输出列表、远程目录缓存 • Multi-agent v2 稳定：每个线程独立选运行时、followup_task 标准化、metadata 默认值统一 • Web/Image 工具：更多 code-mode 流程、独立 web search 并行调用🐛 Bug Fixes（重点 5 个） • 取消已提交 prompt：恢复草稿/附件/协作模式 • macOS 启动 + Windows SQLite + 线程恢复 + 沙箱刷新 • 插件加载保留 app 清单顺序，去重本地/远程 • 权限请求携带环境身份、managed MITM 代理导出可读 CA bundle • 压缩 rollout 安全处理（重命名标题、无路径 side chat、栈深度启动重建）

老金判断：0.137.0 表面是"修修补补"，实际是 "Multi-agent v2 落地"。三件事很关键：(1) Multi-agent 从实验变默认；(2) 企业/EDU 管理上线（OpenAI 抢企业市场）；(3) 远程控制 RPC 标准化（Codex 不只是"个人工具"，变"团队工具"）。Codex 的野心不是 CLI，是 "Codex = OpenAI 的 Agent 操作系统"。把 ChatGPT 和 Codex 合并是第一步，把 Multi-agent、企业管理、远程控制都接上 CLI 是第二步。

三、Claude Code 2.1.166：稳如老狗，开始做防御工事

6/4 21:52 发了 2.1.166（"必装"版），6/6 01:33 又发了一版（标注"Bug fixes and reliability improvements"）。重点是 2.1.166，本版解决的问题：

🆕 关键新功能 • requiredMinimumVersion / requiredMaximumVersion：企业可强制版本范围（"不许装旧版"） • /plugin list 命令：--enabled/--disabled 过滤 • /btw 新增 "c to copy" 快捷键：复制原始 markdown，保留格式 • Hooks: Stop/SubagentStop 增强：可返回 additionalContext，给 Claude 反馈并继续（不被标 hook error） • Skills 语法：新增 `\$` 转义，在命令体里写 `$5` 不被误解析为变量 • stdio MCP servers：和 hooks/Bash 共享同一个 CLAUDE_CODE_SESSION_ID（-resume 时也保持）🐛 重点修复 • claude -p 后台命令不退出时不再永远挂起（5 秒后停） • Bedrock/Vertex/Foundry 上 CI=true 无 API key 的报错修复 • Windows bash 命令 EEXIST 错（OneDrive + 只读属性） • 管理设置只装一次全程生效（不再启动期配置丢失） • 后台会话更新不再冷启动 • Bash 条件 hook 不再误触发（$() 和 $VAR 在子 shell 里也算匹配） • home 目录的 deny 规则对 $HOME 引用生效（之前只对 ~ 生效，是安全漏洞）

老金判断：Claude Code 2.1.166 的发布风格是 "成熟产品"——没新模型、没新架构，全是 "生产环境痛点修复"。这说明 Claude Code 已经过了"炫技期"，进入"稳定期"。值得注意的是 requiredMinimumVersion：这是给企业 IT 用的，意思是"如果你公司要求 ≥2.1.166，Claude Code 拒绝启动"。这意味着 Anthropic 在打企业市场，而且敢让用户用版本范围管控。说句不好听的：Claude Code 没在卷新功能，而是在 卷"不让你出问题"。这跟 OpenAI 的"卷能力"是两种路线，没有对错，但对 复杂项目来说，稳可能比强更重要。

四、Hermes Agent v0.16.0：桌面版首发，1.9k+ commits

Hermes 这一版的发布说明（来自公开速览）数据很炸：

📊 规模数据（自 v0.15.2） • 874 commits · 542 merged PRs · 1,962 files changed • 205,216 行新增 · 46,217 行删除 • 399 issues closed（2 P0、62 P1、16 security） • 170 社区贡献者🔥 头条：Hermes Desktop 桌面应用正式发布 由 OutThisLife、jquesnelle 等 5 位贡献者，一周内 100 PRs + 159 commits 砸出来的 Electron 桌面应用： • macOS / Linux / Windows 三平台 • 一键安装，原生应用，不是 CLI 套壳 • 应用内自更新（不用重装包） • 聊天窗拖放文件、剪贴板图片粘贴、Cmd+K 命令面板 • 状态栏内联模型选择器 • 会话管理：归档、搜索、并发多 profile、跨 profile @session 链接 • 完整简体中文 UI（chat/sidebar/settings/command center/cron/messaging/profiles/skills/agents） • 远程连接：桌面客户端可指向远程 Hermes 网关，OAuth/用户名密码登录🛠️ 其他 9 大更新 ② Web Dashboard 进化为完整管理面板：Channels 页面、MCP 目录管理、凭据管理、webhook、内存配置、一键 Debug Share ③ Quick Setup via Nous Portal：首次安装秒级上手 ④ NVIDIA/skills 加入可信 Skills Hub（CUDA-X、AIQ、cuOpt 等 verified skills） ⑤ 精简默认技能集：删除冗余，新增强 relevance gate，策展人能裁剪内置技能 ⑥ 模糊模型选择器：输入 "v4fl" → 出现 deepseek-v4-flash；多端点合并到一行；每小时刷新（之前每天） ⑦ /undo [N] 命令：撤回最后 N 轮用户输入；CLI/TUI/消息平台全平台一致 ⑧ 可选 CLI 或 TUI 默认界面：配置决定 hermes chat 启动哪个 ⑨ 安全更新（16 项）：CVE-2026-48710、SSRF off-loop 加固、子进程凭据剥离等

老金判断：Hermes v0.16.0 是 "自我构建" 路线的延续。"桌面版首发"是表面，"自托管+多 profile+跨 profile @session 链接"是核心。对比 OpenClaw 升级（"全功能中间件"），Hermes 的打法是 "个人 AI 数字员工"——更轻、更本地、更可自托管。两个产品定位差异： • OpenClaw = AI 操作系统（要运行别人的 Agent，搭桥接） • Hermes = AI 数字员工（自己就是 Agent，自给自足）

五、4 款工具综合对比

📊 一图看懂本周 4 款工具1. OpenClaw 2026.6.1 • 本周亮点：Skill Workshop 完整版 + MiniMax M3 接入 + Workboard 多 agent • 战略方向：AI 框架 OS 化，技能/通道/模型全覆盖 • 用户基础：25万+ GitHub Stars（历史最高） • 老板建议：已经装了，必装最新版，必试 MiniMax M3 1M 上下文2. Codex CLI 0.137.0 • 本周亮点：Multi-agent v2 稳定 + 企业管理 + 远程控制 RPC • 战略方向：Codex = OpenAI 的 Agent 操作系统，从 CLI 扩张到桌面+企业 • 用户基础：500万+ WAU（非程序员 20%，增速是开发者 3 倍） • 老板建议：非程序员首选，企业用户必装3. Claude Code 2.1.166 • 本周亮点：20+ 修复 + fallback 模型 + 跨会话加固 + 企业版本管控 • 战略方向：稳就是强，不卷新功能卷不让你出问题 • 用户基础：主流 AI 编程工具（贵但稳） • 老板建议：复杂项目首选，愿意付月费4. Hermes Agent v0.16.0 • 本周亮点：桌面版首发 + 远程连接 + 170 贡献者 • 战略方向：个人 AI 数字员工，自托管 + 多 profile + 跨会话 • 用户基础：105k-139k GitHub Stars（2 月发布，3 个月冲到这个数） • 老板建议：极客/隐私党首选，想完全自托管必试

六、3 个值得记住的信号

信号 1：1M 上下文成"标配"，不是"特性" 本周：OpenClaw 内置 MiniMax M3（1M）、Copilot Claude 1M、Foundry 推理对齐。3 家不同厂商在同一周都上 1M——这不是巧合，是行业标准切换。信号 2：AI 工具从"框架"变"OS" OpenClaw 出 Workboard（多 agent 编排）= "AI 操作系统"；Codex 出企业管理 + 远程控制 = "Agent 操作系统"；Hermes 出桌面版 + 远程连接 = "本地 AI 操作系统"。三家都在用 OS 思路做 AI 工具，2026 下半年会越来越明显。信号 3："白领"成主要用户，"程序员"变少数派 Codex 500 万周活里，20% 是非程序员的"知识工作者"，增速是开发者的 3 倍。Hermes 也在加完整简体中文 UI。"AI 工具 = 程序员玩具"的时代结束了。

这一周的 4 款工具升级，不只是版本号在涨——是 AI 编程工具的"使用边界"在扩张。

从"程序员专用"到"白领标配"，从"CLI 工具"到"AI 操作系统"，从"模型比拼"到"系统之争"——格局已经变了。

老板要不要明天写一篇《AI 编程工具选型指南》？或者《MiniMax M3 1M 上下文实战测评》？

📌 数据来源（4 个 release notes 原文） 1. OpenClaw 2026.6.1-beta.1 — GitHub Releases 原文（v2026.6.1-beta.1 标签页） 2. Codex CLI 0.137.0 — GitHub Releases 原文（rust-v0.137.0 标签页） 3. Claude Code 2.1.166 — GitHub Releases（anthropics/claude-code 6/4-6/6 多次发布） 4. Hermes Agent v0.16.0 — Nous Research 官方速览（6/5 微信转载） 5. Codex 周活数据 — OpenAI 6/2 内部报告（Axios 报道）

💬 这4款工具你在用哪款？最关心哪个更新？评论区聊聊 👇

👉 关注公众号【老金说增长】AI科技深度解读 · 不追热点追信号