乐于分享
好东西不私藏

OpenClaw 与 Hermes 的 4 月更新全景对比

OpenClaw 与 Hermes 的 4 月更新全景对比

前情说明:目前我的主力系统是 OpenClaw,Hermes 更多用于尝试与借鉴,主要想把它技能沉淀和自我成长的理念,迁到 OpenClaw 的使用和改造中。

概述说明

OpenClaw 4 月的主线是:从功能很多,走向长期稳定运行的系统。
它重点在修底层:插件加载、Session 堆积、渠道稳定、可观测性、TTS、会议/语音场景、Provider 生态。
Hermes Agent 4 月的主线是:从一个会成长的 Agent,快速补齐界面、平台、插件和自我演化能力。
它重点在长能力:三层记忆、自动技能创建、TUI 重构、Dashboard、QQBot、Hook、Webhook、插件扩展。
一句话对比:OpenClaw 更像一个越来越成熟的 AI 操作系统。Hermes 更像一个快速长大的个人智能体生命体。

一、官方发版节奏

1. OpenClaw:4 月高频发版

OpenClaw 4 月从 2026.4.1 一路更新到 2026.4.27,中间有大量 beta 与正式版。核心正式版覆盖:
2026.4.12026.4.22026.4.52026.4.72026.4.82026.4.102026.4.112026.4.122026.4.142026.4.152026.4.202026.4.212026.4.222026.4.232026.4.242026.4.252026.4.262026.4.272026.4.29

个人视角解读:

OpenClaw 4 月不是偶尔修补,而是高频迭代。它像一个城市在密集修路:有些路段你看不见,但它们决定以后堵不堵、稳不稳、能不能继续扩建。

2. Hermes Agent:4 月几个大版本跃迁

Hermes Agent 4 月官方 release 主要包括:
v2026.4.3 / v0.7.0v2026.4.8 / v0.8.0v2026.4.13 / v0.9.0v2026.4.16 / v0.10.0v2026.4.23 / v0.11.0v2026.4.30 / v0.12.0
其中 v0.11.0 官方写明:自 v0.9.0 以来,包含 1,556 commits、761 merged PRs、1,314 files changed、224,174 insertions、29 community contributors。
个人视角解读:
Hermes 4 月不是小修小补,而是爆发式长大。它像一个创业公司突然拿到大资源,产品界面、平台接入、插件体系、能力边界都在快速扩张。但快速增长也意味着不够稳的地方会更多。

二、OpenClaw 4 月更新全景

1. 基础设施:让系统更适合长期运行

关键信息

  • OpenClaw 4 月在底层稳定性上做了很多事:
  • Session 维护增强:默认加入 entry cap、age prune,防止历史 Session 堆积到把 Gateway 顶爆。
  • Cron 运行态拆分:jobs.json 和 jobs-state.json 分开,让任务定义和运行状态分离。
  • Plugin 启动优化:从动态扫描转向 cold persisted registry,减少 Gateway 启动时大量扫描插件。
  • Manifest-first model catalog:模型和插件信息更多放到 manifest 里,减少运行时临时判断。
  • 安装/更新加固:Windows、macOS、Linux、Docker、Node service restart、LaunchAgent token rotation 等都有修复。
个人视角解读:
这部分不是新鲜玩意儿,但非常重要。
以前像是每次开公司,都要重新查员工档案、翻钥匙、找办公室;现在很多东西提前登记好,系统启动时直接照表执行。简单来说就是:
  • Gateway 更不容易卡死
  • 后台任务不容易越积越多
  • 升级和重启更稳
  • 长期运行更像基础设施,而不是临时脚本

2. 模型与 Provider:能接入的 AI 服务更多

关键信息

OpenClaw 4 月新增或强化了多个 Provider / 模型能力:
  • xAI:图像生成、TTS、STT。
  • OpenAI Responses:支持原生 web_search。
  • OpenAI Codex OAuth:gpt-image-2 可通过 Codex OAuth 使用,不一定需要单独 OpenAI API Key。
  • DeepSeek V4 Flash / V4 Pro:进入 bundled catalog,V4 Flash 成为 onboarding 默认。
  • Cerebras:新增 bundled provider。
  • DeepInfra:新增 bundled provider,支持 model discovery、media generation/editing、TTS、embeddings。
  • Ollama memory:为 nomic-embed-text、qwen3-embedding、mxbai-embed-large 增加检索 query prefix。
  • /models add :支持动态添加模型,不一定要重启 Gateway。
个人视角解读:
OpenClaw 像一个插线板,4 月新增了很多插孔,可以接更多 AI 服务商。简单说就是系统拥有了更多调度选择:
  • 某个模型贵了,可以换
  • 某个模型挂了,可以切
  • 某个任务适合图像/语音/搜索,可以选专门服务
  • 不再被单一 AI 公司锁死
简单说:OpenClaw 的供应商选择权变强了

3. 渠道接入:消息入口继续扩展

关键信息

OpenClaw v2026.4.27:
  • Tencent Yuanbao channel plugin 进入官方 channel catalog 和文档体系。
  • QQBot 补齐群聊、流式消息、媒体上传等能力。

4. 语音与 TTS:OpenClaw 4 月最明显的功能升级之一

关键信息

OpenClaw v2026.4.25 做了完整 TTS 升级:
  • /tts latest
  • chat-scoped auto-TTS controls
  • personas
  • per-agent / per-account overrides
  • Azure Speech
  • Xiaomi
  • Local CLI
  • Inworld
  • Volcengine
  • ElevenLabs v3
  • Feishu / QQBot 账户级 TTS 覆盖
此外,Voice Call 也增强:
  • Deepgram 转录
  • ElevenLabs 转录
  • Mistral 转录
  • 实时语音循环可调用完整 OpenClaw Agent
个人视角解读:
TTS 就是让 AI 开口说话。以前 AI 主要是文字助理。现在 OpenClaw 在往语音助理靠近:
  • 可以换声音
  • 可以按不同账号/不同 Agent 设置声音
  • 可以自动把回复读出来
  • 电话/会议里可以实时听、实时答
这会让 OpenClaw 从聊天框里的 AI,慢慢变成能出现在语音场景里的 AI。

5. 会议与实时音频:Google Meet 正式进入 OpenClaw

关键信息

OpenClaw v2026.4.24:
  • Google Meet 成为 bundled participant plugin。
  • 支持个人 Google auth。
  • 支持 Chrome / Twilio realtime sessions。
  • 支持 paired-node Chrome。
  • 支持 artifact 和 attendance workflows。
  • 支持 conference records、recordings、transcripts、smart notes、participant summaries。
  • 支持 googlemeet doctor –oauth 等诊断/恢复流程。
同时:
  • Talk、Voice Call、Google Meet 可以使用 realtime voice loops。
  • Realtime voice loops 可以 consult full OpenClaw agent,也就是会议/通话中可以调用完整 Agent,而不是一个简单语音机器人。
个人视角解读:
⚠️ 重要:以前 AI 能总结会议,通常是会后拿录音,或文字总结。OpenClaw 现在更接近进会议室旁听,并能实时参与。看起来是个非常有潜力的方向:
  • 引进 Google Meet
  • 听会议
  • 生成记录
  • 导出参会信息
  • 必要时调用完整 Agent 回答问题
这意味着 OpenClaw 正在从异步助理走向实时协作助理。

6. 可观测性:出了问题更容易追踪

关键信息

OpenClaw v2026.4.25 扩展 OpenTelemetry 覆盖范围:
model calls
token usage
tool loops
harness runs
exec processes
outbound delivery
context assembly
memory pressure
Control UI 也增强:
  • PWA / Web Push
  • raw config pending-changes diff panel
  • JSON5 解析
  • 敏感值脱敏
  • dashboard grid polish
  • quick settings
Browser automation 增强:
  • coordinate clicks
  • longer action budgets
  • safer tab URLs
  • iframe-aware role snapshots
  • CDP readiness tuning
  • headless one-shot launch
个人视角解读:
可观测性就是系统有没有行车记录仪。以前出问题可能只知道坏了。现在更容易知道:
  • 是模型慢?
  • 是工具卡?
  • 是发消息失败?
  • 是浏览器没点到?
  • 是内存压力大?
  • 是配置改了没生效?
这对长期使用非常关键。AI 系统不怕复杂,怕的是坏了以后不知道坏在哪。

7. 安全与网络

关键信息

OpenClaw v2026.4.27:
新增 operator-managed outbound proxy routing。
配置项包括 proxy.enabled、proxy.proxyUrl / OPENCLAW_PROXY_URL。
严格校验 http:// forward proxy。
loopback-only Gateway bypass。
退出时清理 proxy env / dispatcher state。
移动端节点:
  • iOS / Android 新增 node.presence.alive。
  • node.list 增加 last-seen 字段。
  • 断开后仍能记录最近活跃,不误判为在线连接。
个人视角解读:
Proxy routing 像是给 AI 配一个公司指定出口。所有网络请求从这个出口走,方便企业控制和审计。移动端 presence 则像微信里的最近在线。不是在线/离线这么粗暴,而是知道这个设备最近还活着,只是暂时不连接。
这说明 OpenClaw 正在补企业级和移动端长期运行需要的基础能力。

三、Hermes Agent 4 月更新全景

1. v0.7.0:记忆与安全底座增强

关键信息

Hermes v2026.4.3:
  • Pluggable Memory Provider Interface。
  • Same-Provider Credential Pools。
  • Camofox Anti-Detection Browser Backend。
  • Inline Diff Previews。
  • API Server Session Continuity & Tool Streaming。
  • ACP:Client-Provided MCP Servers。
  • Gateway Hardening。
  • Secret Exfiltration Blocking。
个人视角解读:
Hermes 这版在补Agent 怎么记住东西、怎么用多个 Key、怎么浏览网页、怎么防止泄密。特别是 Secret Exfiltration Blocking,说明它很早就在处理安全边界问题。
Hermes 的方向是:让 Agent 更像一个长期驻留、有记忆、有工具、有防护的个人助理。

2. v0.8.0:模型切换、后台任务、插件扩展

关键信息

Hermes v2026.4.8:
  • Background Process Auto-Notifications。
  • Live Model Switching:/model command。
  • Self-Optimized GPT/Codex Tool-Use Guidance。
  • Google AI Studio / Gemini Native Provider。
  • Inactivity-Based Agent Timeouts。
  • Approval Buttons on Slack & Telegram。
  • MCP OAuth 2.1 PKCE + OSV Malware Scanning。
  • Centralized Logging & Config Validation。
  • Plugin System Expansion。
  • Matrix Tier 1。
  • Security Hardening Pass。
个人视角解读:
Hermes 在这版开始明显像能自己跑任务的助理:
  • 后台任务完成会自动通知
  • 可以中途换模型
  • 危险操作有按钮审批
  • 插件系统继续扩展
  • 有更完整日志
这和我对 OpenClaw 的要求很像:不是一次聊天,而是一个能长期干活的系统。

3. v0.9.0:Dashboard + 自我成长能力

关键信息

Hermes v2026.4.13:
  • Local Web Dashboard。
  • Fast Mode:/fast。
  • iMessage via BlueBubbles。
  • WeChat / WeCom Callback Mode。
  • Termux / Android Support。
  • Background Process Monitoring:watch_patterns。
  • Native xAI & Xiaomi MiMo Providers。
  • Pluggable Context Engine。
  • Unified Proxy Support。
  • Comprehensive Security Hardening。
  • hermes backup & hermes import。
  • 16 supported platforms。
  • /debug & hermes debug share。
更关键的是 Hermes 项目定位里强调:
  • 持久记忆
  • 自动技能创建
  • 多平台通信
  • 越用越聪明
个人视角解读:
这是 Hermes 最有辨识度的一版。OpenClaw 更偏你配置它,让它稳定运行。Hermes 更偏它从自己的经验里长出技能”。
举个通俗例子:
OpenClaw 像一个能力很强、流程清晰的专业助理,你给它制度、流程、权限,它按规则稳定干活。
Hermes 像一个会写工作笔记的实习生,它做完任务后会总结经验,下次自己复用。
Hermes 的魅力就在这里,但风险也在这里:自己长能力很酷,但如果没有足够可观测性和安全边界,也容易长歪。

4. v0.10.0:Nous Tool Gateway

关键信息

Hermes v2026.4.16:
  • Nous Portal 付费订阅用户自动获得 web search。
  • 这是一个工具网关更新,Bug 修复为主。
个人视角解读:
Tool Gateway 就像给 Agent 接一个官方工具市场。不是每个人自己拼工具,而是通过 Nous 官方入口拿到一些标准能力,比如 web search。
这会降低使用门槛,但也让 Hermes 更依赖 Nous 自己的生态。

5. v0.11.0:界面、插件、传输层大重构

关键信息

Hermes v2026.4.23:
  • New Ink-based TUI:hermes –tui 全面重写。
  • Transport ABC:把格式转换和 HTTP 传输抽象出来。
  • Native AWS Bedrock。
  • 5 个新 inference paths:NVIDIA NIM、Arcee AI、AWS Bedrock、Cloudflare Workers AI、Groq。
  • GPT-5.5 over Codex OAuth。
  • QQBot:第 17 个支持平台。
  • Plugin surface expanded。
  • /steer:运行中途注入提示。
  • Shell hooks。
  • Webhook direct-delivery mode。
  • Smarter delegation:subagents 有 orchestrator role。
  • Auxiliary models 配置 UI。
  • Dashboard plugin system。
  • Dashboard i18n:英文 + 中文。
  • mobile-responsive。
个人视角解读:
这是 Hermes 4 月最大的工程升级。它主要做三件事:
界面更像正经产品:TUI 和 Dashboard 都升级。
后端更容易接更多模型:Transport ABC 把底层传输抽象出来。
Agent 更容易被人中途干预和扩展:/steer、Shell hooks、Webhook、Plugin surface。
⚠️ 最值得注意的是 /steer:这相当于 Agent 跑到一半,你可以在旁边拍它一下,说“等等,注意一下这个方向”。这对长任务很有价值。

四、OpenClaw vs Hermes:结构性对比

1. 产品哲学对比

个人视角解读:
OpenClaw 像公司制度化助理:你建制度、建流程、建文档,它长期执行。
Hermes 像成长型个人助理:它一边做事一边学,把经验变成自己的技能。
这两个方向没有谁绝对更好,关键看你要什么:
要稳、要可控、要可长期运行:OpenClaw 更合适。
要看 Agent 自己长能力、自动学习:Hermes 更有想象力。

2. 技术路线对比

个人视角解读:
OpenClaw 的技术路线更像把复杂系统拆成模块。
Hermes 的技术路线更像让一个 Agent 自己积累经验。
所以:
OpenClaw 的复杂度在系统设计里。
Hermes 的复杂度在 Agent 自己成长里。
作为用户,真正要关心的是:你想要的是稳定可控,还是自动进化?

3. 二者的共同趋势

3.1 共同点 1:都在接更多模型

OpenClaw 接入或增强:
  • xAI
  • DeepSeek V4
  • Cerebras
  • DeepInfra
  • OpenAI Codex OAuth
  • Ollama embedding
Hermes 接入或增强:
  • xAI
  • Xiaomi MiMo
  • Google AI Studio
  • AWS Bedrock
  • NVIDIA NIM
  • Arcee AI
  • Cloudflare Workers AI
  • Groq
  • GPT-5.5 via Codex OAuth
个人视角解读:
两个项目都在避免只依赖一个模型。未来的 AI Agent 不是绑定某个模型,而是像调度中心,不同任务派给不同模型。

3.2 共同点 2:都在扩消息平台

OpenClaw:
  • 元宝
  • QQBot
  • Google Meet
  • Voice Call
  • Telegram / Slack 修复
Hermes:
  • WeChat
  • WeCom
  • iMessage
  • QQBot
  • Matrix
  • 16 → 17 platforms
个人视角解读:
Agent 要真正进入生活,不可能只在网页里。它必须进 IM、会议、电话、移动端。
这说明两个项目都意识到:未来 AI 助理的主战场不是聊天网页,而是你每天已经在用的沟通渠道。

3.3 共同点 3:都在处理安全与审批

OpenClaw:
  • operator-managed outbound proxy
  • owner identity 修复
  • Control UI 安全相关问题
  • plugin runtime 检查
  • MCP fail-closed checks
Hermes:
  • Secret Exfiltration Blocking
  • MCP OAuth 2.1 PKCE
  • OSV Malware Scanning
  • Approval Buttons
  • Security Hardening Pass
个人视角解读:
Agent 越强,越不能随便放飞。它能读文件、上网、发消息、执行命令,就必须有审批、安全边界和审计。
简单说:AI 助理越像真人助理,越需要公司制度。

五、总结

OpenClaw 4 月关键词

  • 稳定性
  • Plugin 重构
  • TTS 系统化
  • Google Meet
  • DeepInfra / DeepSeek / Cerebras
  • QQBot / Yuanbao
  • OpenTelemetry
  • 安全 proxy
  • 长期运行治理

Hermes 4 月关键词

  • 三层记忆
  • 自动技能创建
  • Dashboard
  • TUI 重构
  • /steer
  • Shell hooks
  • QQBot
  • WeChat / WeCom / iMessage
  • Transport ABC
  • 自我进化
个人视角解读:
OpenClaw 和 Hermes 的 4 月更新,底层其实是在回答两个不同的问题:
  • 一个 AI 助理,如何长期稳定地存在?这是 OpenClaw 在回答的问题。
  • 一个 AI 助理,如何从经验中成长?这是 Hermes 在回答的问题。
就目前情况来看:
  • OpenClaw 是更成熟的长期运行底座,像地基稳的房子。
  • Hermes 是更激进的自我成长 Agent,像一匹年轻快马,冲劲很大。
  • 经验沉淀很关键,下一代 Agent 的竞争,不只是谁回答得更好,而是谁能从一次次任务中积累经验,并把经验稳定、可控、可审计地沉淀下来。这是 Hermes 最值得关注的点。
另外,还可以从更新的趋势中发现:
  • AI Agent 正在从聊天机器人,变成长期运行系统。一个真正有用的 AI 助理,不只是会回答问题。它还要有记忆、任务、权限、日志、错误回溯、配置治理和长期运行能力。
  • AI Agent 正在进入真实工作流,它不再只存在于网页聊天框里。它会进入飞书、QQ、微信、会议、电话、浏览器和移动设备。这意味着 Agent 的主战场不是聊天界面,而是人的真实工作环境。
推测下一代 Agent,大概率不会是二选一,而是走向融合。
即,让 AI 助理从对话工具,演变为一个持续学习、持续执行、且可控的长期系统。