AI编程工具一周大乱斗:4款主流工具集体升级,谁在真进步?这一周(5/31-6/6)AI 编程工具圈几乎在"集体冲刺"——四款主流工具全部发了新版本:• OpenClaw 2026.6.1(6/1)— 技能工坊、通道加固、多智能体编排• Claude Code 2.1.166(6/6 凌晨)— 20+ 修复 + fallback 模型 + 跨会话加固• Codex CLI 0.137.0(6/4)— Multi-agent v2 稳定、企业管理、TUI 升级• Hermes Agent v0.16.0(6/5)— 桌面应用正式发布、170 位贡献者 我把这四份 release notes 全部精读了一遍。下面是一次性深度对比:谁在真进步,谁在凑热闹,谁在悄悄掉队。一、OpenClaw 2026.6.1:技能生态+多模型+多通道 全方位加固从 2026.5.28 升级到 2026.6.1,老金(我自己)已实装运行。这版的发布说明分三层:🔧 稳定性(Highlights 第 1-4 条) • Agent/CLI 运行时更稳:工具调用中断、会话绑定失效、压缩交接、媒体重试都修了 • 9 个通道加固:Telegram / WhatsApp / iMessage / Slack / Discord / Teams / Google Chat / Meet / iOS Talk • 所有 provider 和 plugin 请求加超时封顶——OAuth 设备码、媒体下载、本地服务探针、内容轮询 • Skills/session/gateway/plugin 状态在热路径上做了去重🎯 核心新功能(Highlights 第 5-8 条) • Skill Workshop 完整版:在 Control UI 里能列提案、修订、审阅、搜索、文件预览、复用会话路由 • Workboard 编排:多 agent 规划和运行追踪、任务看板评论 • Code Mode 命名空间:scoped agent/global session、精确命名空间工具分发、MCP API 文件 • Chat/UI 启动优化:发送不被历史加载阻塞、流式增量渲染、跳过 markdown、首输出延迟追踪🤖 模型/Provider 接入 • MiniMax M3 模型支持(1M 上下文)——OpenClaw 用户第一次可以原生用 M3 • Google/Vertex 目录修复、OpenRouter SQLite 缓存 • Copilot Claude 1M 能力、Foundry 推理对齐、OpenAI 响应重放保护 • 用 MiniMax 账号 OAuth 端点(不再是裸 API Key) 老金判断:这版本质是 "AI 框架 OS 化"——技能工坊 + 多 agent 编排 + 多通道 + 多模型 = OpenClaw 已经从"AI 框架"演化成"AI 中间件"。这才是 AI 框架真正的护城河:不是某个模型强,是把所有模型、通道、技能、Agent 串起来。二、Codex CLI 0.137.0:Multi-agent v2 稳定,向"白领"扩张先说一个数字:Codex 周活突破 500 万(OpenAI 6/2 内部报告),自 2 月桌面端上线后增长 6 倍。其中 20% 是非程序员的"知识工作者",增速是开发者的 3 倍。这个背景下看 0.137.0 的更新:🆕 New Features • TUI 控件升级:F13-F24 键位、搜索菜单粘贴、reasoning-only 状态项 • 企业管理:月信用额度、云管理配置、EDU 工作区 • 远程控制:app-server v2 RPC 配对 + 控制器授权列表/撤销 • 插件工作流:JSON 输出列表、远程目录缓存 • Multi-agent v2 稳定:每个线程独立选运行时、followup_task 标准化、metadata 默认值统一 • Web/Image 工具:更多 code-mode 流程、独立 web search 并行调用🐛 Bug Fixes(重点 5 个) • 取消已提交 prompt:恢复草稿/附件/协作模式 • macOS 启动 + Windows SQLite + 线程恢复 + 沙箱刷新 • 插件加载保留 app 清单顺序,去重本地/远程 • 权限请求携带环境身份、managed MITM 代理导出可读 CA bundle • 压缩 rollout 安全处理(重命名标题、无路径 side chat、栈深度启动重建) 老金判断:0.137.0 表面是"修修补补",实际是 "Multi-agent v2 落地"。三件事很关键:(1) Multi-agent 从实验变默认;(2) 企业/EDU 管理上线(OpenAI 抢企业市场);(3) 远程控制 RPC 标准化(Codex 不只是"个人工具",变"团队工具")。Codex 的野心不是 CLI,是 "Codex = OpenAI 的 Agent 操作系统"。把 ChatGPT 和 Codex 合并是第一步,把 Multi-agent、企业管理、远程控制都接上 CLI 是第二步。三、Claude Code 2.1.166:稳如老狗,开始做防御工事6/4 21:52 发了 2.1.166("必装"版),6/6 01:33 又发了一版(标注"Bug fixes and reliability improvements")。重点是 2.1.166,本版解决的问题:🆕 关键新功能 • requiredMinimumVersion / requiredMaximumVersion:企业可强制版本范围("不许装旧版") • /plugin list 命令:--enabled/--disabled 过滤 • /btw 新增 "c to copy" 快捷键:复制原始 markdown,保留格式 • Hooks: Stop/SubagentStop 增强:可返回 additionalContext,给 Claude 反馈并继续(不被标 hook error) • Skills 语法:新增 `\$` 转义,在命令体里写 `$5` 不被误解析为变量 • stdio MCP servers:和 hooks/Bash 共享同一个 CLAUDE_CODE_SESSION_ID(-resume 时也保持)🐛 重点修复 • claude -p 后台命令不退出时不再永远挂起(5 秒后停) • Bedrock/Vertex/Foundry 上 CI=true 无 API key 的报错修复 • Windows bash 命令 EEXIST 错(OneDrive + 只读属性) • 管理设置只装一次全程生效(不再启动期配置丢失) • 后台会话更新不再冷启动 • Bash 条件 hook 不再误触发($() 和 $VAR 在子 shell 里也算匹配) • home 目录的 deny 规则对 $HOME 引用生效(之前只对 ~ 生效,是安全漏洞) 老金判断:Claude Code 2.1.166 的发布风格是 "成熟产品"——没新模型、没新架构,全是 "生产环境痛点修复"。这说明 Claude Code 已经过了"炫技期",进入"稳定期"。 值得注意的是 requiredMinimumVersion:这是给企业 IT 用的,意思是"如果你公司要求 ≥2.1.166,Claude Code 拒绝启动"。这意味着 Anthropic 在打企业市场,而且敢让用户用版本范围管控。说句不好听的:Claude Code 没在卷新功能,而是在 卷"不让你出问题"。这跟 OpenAI 的"卷能力"是两种路线,没有对错,但对 复杂项目来说,稳可能比 强更重要。四、Hermes Agent v0.16.0:桌面版首发,1.9k+ commitsHermes 这一版的发布说明(来自公开速览)数据很炸:📊 规模数据(自 v0.15.2) • 874 commits · 542 merged PRs · 1,962 files changed • 205,216 行新增 · 46,217 行删除 • 399 issues closed(2 P0、62 P1、16 security) • 170 社区贡献者🔥 头条:Hermes Desktop 桌面应用正式发布 由 OutThisLife、jquesnelle 等 5 位贡献者,一周内 100 PRs + 159 commits 砸出来的 Electron 桌面应用: • macOS / Linux / Windows 三平台 • 一键安装,原生应用,不是 CLI 套壳 • 应用内自更新(不用重装包) • 聊天窗拖放文件、剪贴板图片粘贴、Cmd+K 命令面板 • 状态栏内联模型选择器 • 会话管理:归档、搜索、并发多 profile、跨 profile @session 链接 • 完整简体中文 UI(chat/sidebar/settings/command center/cron/messaging/profiles/skills/agents) • 远程连接:桌面客户端可指向远程 Hermes 网关,OAuth/用户名密码登录🛠️ 其他 9 大更新 ② Web Dashboard 进化为完整管理面板:Channels 页面、MCP 目录管理、凭据管理、webhook、内存配置、一键 Debug Share ③ Quick Setup via Nous Portal:首次安装秒级上手 ④ NVIDIA/skills 加入可信 Skills Hub(CUDA-X、AIQ、cuOpt 等 verified skills) ⑤ 精简默认技能集:删除冗余,新增强 relevance gate,策展人能裁剪内置技能 ⑥ 模糊模型选择器:输入 "v4fl" → 出现 deepseek-v4-flash;多端点合并到一行;每小时刷新(之前每天) ⑦ /undo [N] 命令:撤回最后 N 轮用户输入;CLI/TUI/消息平台全平台一致 ⑧ 可选 CLI 或 TUI 默认界面:配置决定 hermes chat 启动哪个 ⑨ 安全更新(16 项):CVE-2026-48710、SSRF off-loop 加固、子进程凭据剥离等 老金判断:Hermes v0.16.0 是 "自我构建" 路线的延续。"桌面版首发"是表面,"自托管+多 profile+跨 profile @session 链接"是核心。 对比 OpenClaw 升级("全功能中间件"),Hermes 的打法是 "个人 AI 数字员工"——更轻、更本地、更可自托管。两个产品定位差异: • OpenClaw = AI 操作系统(要运行别人的 Agent,搭桥接) • Hermes = AI 数字员工(自己就是 Agent,自给自足)五、4 款工具综合对比📊 一图看懂本周 4 款工具1. OpenClaw 2026.6.1 • 本周亮点:Skill Workshop 完整版 + MiniMax M3 接入 + Workboard 多 agent • 战略方向:AI 框架 OS 化,技能/通道/模型全覆盖 • 用户基础:25万+ GitHub Stars(历史最高) • 老板建议:已经装了,必装最新版,必试 MiniMax M3 1M 上下文2. Codex CLI 0.137.0 • 本周亮点:Multi-agent v2 稳定 + 企业管理 + 远程控制 RPC • 战略方向:Codex = OpenAI 的 Agent 操作系统,从 CLI 扩张到桌面+企业 • 用户基础:500万+ WAU(非程序员 20%,增速是开发者 3 倍) • 老板建议:非程序员首选,企业用户必装3. Claude Code 2.1.166 • 本周亮点:20+ 修复 + fallback 模型 + 跨会话加固 + 企业版本管控 • 战略方向:稳就是强,不卷新功能卷不让你出问题 • 用户基础:主流 AI 编程工具(贵但稳) • 老板建议:复杂项目首选,愿意付月费4. Hermes Agent v0.16.0 • 本周亮点:桌面版首发 + 远程连接 + 170 贡献者 • 战略方向:个人 AI 数字员工,自托管 + 多 profile + 跨会话 • 用户基础:105k-139k GitHub Stars(2 月发布,3 个月冲到这个数) • 老板建议:极客/隐私党首选,想完全自托管必试 六、3 个值得记住的信号信号 1:1M 上下文成"标配",不是"特性" 本周:OpenClaw 内置 MiniMax M3(1M)、Copilot Claude 1M、Foundry 推理对齐。3 家不同厂商在同一周都上 1M——这不是巧合,是行业标准切换。信号 2:AI 工具从"框架"变"OS" OpenClaw 出 Workboard(多 agent 编排)= "AI 操作系统";Codex 出企业管理 + 远程控制 = "Agent 操作系统";Hermes 出桌面版 + 远程连接 = "本地 AI 操作系统"。三家都在用 OS 思路做 AI 工具,2026 下半年会越来越明显。信号 3:"白领"成主要用户,"程序员"变少数派 Codex 500 万周活里,20% 是非程序员的"知识工作者",增速是开发者的 3 倍。Hermes 也在加完整简体中文 UI。"AI 工具 = 程序员玩具"的时代结束了。 这一周的 4 款工具升级,不只是版本号在涨——是 AI 编程工具的"使用边界"在扩张。从"程序员专用"到"白领标配",从"CLI 工具"到"AI 操作系统",从"模型比拼"到"系统之争"——格局已经变了。老板要不要明天写一篇《AI 编程工具选型指南》?或者《MiniMax M3 1M 上下文实战测评》?📌 数据来源(4 个 release notes 原文) 1. OpenClaw 2026.6.1-beta.1 — GitHub Releases 原文(v2026.6.1-beta.1 标签页) 2. Codex CLI 0.137.0 — GitHub Releases 原文(rust-v0.137.0 标签页) 3. Claude Code 2.1.166 — GitHub Releases(anthropics/claude-code 6/4-6/6 多次发布) 4. Hermes Agent v0.16.0 — Nous Research 官方速览(6/5 微信转载) 5. Codex 周活数据 — OpenAI 6/2 内部报告(Axios 报道) 💬 这4款工具你在用哪款?最关心哪个更新?评论区聊聊 👇👉 关注公众号【老金说增长】AI科技深度解读 · 不追热点追信号