OpenClaw 与 Hermes 对AI代理定义达成一致,但是对控制代理的机制存在分歧

导读:OpenClaw与Hermes两大开源框架双双在进化发展。但由于各自的架构不同,在某个机制亦存在着分歧。
在本月的微软Build大会主题演讲中,微软CEO萨蒂亚·纳德拉阐述了其平台转型的思路——即从操作系统和应用程序转向无需用户启动的智能体人工智能。
随后他展示了实现这一转型的关键技术:OpenClaw。这是一个开源框架和独立项目,几个月前刚刚发布,可在微软全新的执行容器中原生运行于Windows系统。而微软的常驻企业级智能体Scout正是基于OpenClaw构建的。
Scout诞生至今仅一年,却以受控基础设施的形式亮相。
英伟达(Nvidia)创始人黄仁勋在本年度三月份的GTC大会上直白地阐述了这一点,他称OpenClaw为“个人的人工智能的操作系统”。这个比喻甚是贴切:框架之于语言模型,正如操作系统之于处理器。模型可以独立回答问题,而框架则使其能够持续运行、记住学习到的内容,并调用工具来执行操作。
2026年,有两个开源项目从不同的出发点构建了这一层。
首先是OpenClaw,它的核心是网关,也就是将代理连接到用户已使用的渠道的部分。
而另一个开源项目是Nous Research 的Hermes Agent,它的核心是记忆,也就是让代理学习开发者工作并不断改进的部分。它们之间的竞争在于控制层,而不是它们各自使用的模型。
代理组件的简称
从本质上讲,代理框架是一种将模型转化为能够自主运行系统的软件。它整合了运行时环境(用于在任务间隙保持代理的运行状态)、网关(用于消息的收发)以及跨会话持久化的内存。
此外,它还包含代理执行操作所需的工具、运行身份、可扩展的技能,以及决定其操作范围和记录内容的策略和可观测性控制。
像Claude Code或Codex这样的编码助手只能涵盖其中的一部分。它们在交互式会话中运行,会话结束后会丢失大部分工作上下文。而代理框架则能够维护运行时环境、内存和治理机制,从而使代理能够无人值守地运行。
框架负责维护运行时、内存和治理,以便代理可以无人值守运行。
Nous Research 和 OpenClaw 在系统架构上已经达成了共识,但对哪个部分作为主要控制点存在分歧。
OpenClaw 以网关为核心,因此一个代理可以从单一位置回复 WhatsApp、Discord、Slack 和其他渠道上的消息。而 Hermes 则以记忆为核心,因此一个代理可以跨周保存开发者的上下文信息并不断提升自身技能。
OpenClaw 的网关优先设计
OpenClaw 最初由 Peter Steinberger 创立并发起,是一个独立开源项目。
Peter Steinberger 是一位以早期 PDF 工具开发而闻名的开发者,他在 2025 年末发布了早期版本,并两次更名,最终于今年 1 月定名为 OpenClaw。
OpenClaw 的设计理念是功能全面,其核心是一个中央网关,可以将代理连接到数十个消息渠道。其公共技能市场ClawHub拥有数千个社区技能,可以扩展代理的功能。开源势头强劲,截至 6 月底,该项目在 GitHub 上的 star 数已接近 38 万,但 star 数衡量的是可见度而非实际生产使用情况。
更重要的进展在于谁采用了这个网关。斯坦伯格于二月份加入OpenAI,该项目也随之转移到一个独立的基金会,OpenAI不再是所有者,而是赞助商。
在 3 月份的 GTC 大会上,Nvidia 将 OpenClaw 封装在 NemoClaw 中,NemoClaw 是一个 OpenShell 运行时,它对每个代理进行沙箱化,并在代理无法触及的范围内强制执行策略。
在6月份的Build开发者大会上,微软将OpenClaw原生集成到Windows执行容器中,并发布了Scout——一个运行在OpenClaw网关上的代理程序,它拥有自己的Entra身份,并能连接到Teams、Outlook和SharePoint。在所有这些举措中,平台供应商都保留了OpenClaw的广度,并添加了原项目所缺乏的治理和身份管理功能。
现在,安全团队可以控制代理读取哪些文件夹以及哪些文件夹保持隐藏,而不是像早期 OpenClaw 部署那样授予广泛的访问权限,从而避免了风险。
对于企业而言,这改变了决策过程。安全团队现在可以控制代理程序读取哪些文件夹以及哪些文件夹保持隐藏,而无需像早期 OpenClaw 部署那样授予广泛的访问权限,从而避免风险。平台团队可以提供一个受控的单一代理程序,员工可以通过他们已有的工具访问该程序。OpenClaw 的广泛性使其得以普及,而平台供应商则提供了该普及所需的控制措施,使其能够进入生产环境。
Hermes 的记忆优先设计
Hermes Agent 则走了另外一条路。
Hermes、Nomos 和 Psyche 系列模型背后的实验室 Nous Research 于 2 月 25 日以 MIT 许可证发布了这款产品,它使用 Python 语言编写,旨在持久运行于团队拥有的基础设施上:VPS、家用服务器或笔记本电脑。
Hermes 的核心功能在于跨会话的持久记忆。它采用分层记忆机制,在完成高难度任务后开发新技能,并在使用过程中不断完善这些技能。此外,它还会构建所服务开发者的个人档案,因此每次会话开始时都会比上一次拥有更丰富的上下文信息。这些技能遵循agentskills.io标准,使其能够在不同代理之间移植,而非仅限于某个代理。
这种深度已转化为可衡量的使用量。Hermes 在 5 月中旬的 GitHub star 数突破 10 万,并在月底达到约 16 万。5 月 10 日,Hermes 在 OpenRouter 的每日代币排行榜上超越 OpenClaw,当日代币总量达到 2240 亿,高于 OpenClaw 的 1860 亿,Hermes 也因此位居代币总量榜首。
截至6月下旬,OpenRouter的应用排名也显示Hermes代币总量位居榜首,超过22万亿枚。GitHub星标数、代币交易量和平台认可度衡量的是不同类型的应用普及程度,而且这些指标很少同步变化。Nous还将可移植性作为其卖点之一,提供了一个hermes claw migrate命令,可以一步导入OpenClaw用户的设置、记忆、技能和密钥。
开发者可以保留一个代理,该代理可以承载数周的代码库、约定和先前的决策,而无需每天早上重新构建上下文。由于 Hermes 能够兼容数百种模型,团队只需一条命令即可在不同提供商之间迁移代理。但这种权衡体现在运营层面,因为运行 Hermes 的团队还需要负责其所依赖的基础设施的安全维护。
广度、深度以及各自适用范围
这种选择就像托管云主机服务和自建基础设施之间的常见权衡。托管服务便捷且由供应商管理,而自建基础设施则提供完全的控制权和运营责任。
许多企业会根据工作负载同时运行这两个平台。这两个项目的功能都不局限于单一领域。OpenClaw 包含内存和技能,而 Hermes 则支持二十多个渠道,因此二者的区别在于侧重点而非功能上的排他性。
下表列出了常见应用场景,但需要注意的是,这两个平台目前都属于新兴平台,而均非成熟产品。
| 设想 | 更适合 | 权衡利弊 |
|---|---|---|
| 需要审计和政策控制的受监管企业 | OpenClaw(NemoClaw 或 Microsoft Scout) | 英伟达或微软将治理和身份验证功能集成到代理程序中,尽管这两家公司都处于早期阶段,并且会将购买者与其技术栈绑定。 |
| 开发者需要一个能够学习其工作内容并保持可移植性的代理。 |
|
持久记忆和自我提升能力是设计的核心,但代价是需要运行自己的基础设施。 |
| 团队通过多个聊天平台与用户进行沟通 | OpenClaw | 该门户网站和大型技能市场覆盖范围之广,其他竞争对手无可匹敌,但技能质量参差不齐,供应链风险也确实存在。 |
| 组织采用单一供应商的云服务进行标准化 | 微软 365 内部侦察 | 该生态系统内部整合度最高,而其外部可移植性最低。 |
实际上部署不会采用单一标准。
Nvidia 的 NemoClaw 蓝图已经能够像运行 OpenClaw 一样轻松地在 OpenShell 下运行 Hermes 代理。治理层的设计目标是能够运行在多个代理项目之下,而不是只支持其中一个。
为什么安全带层很重要
企业在将任何一款代理程序投入生产系统之前,应该仔细考虑两个问题。
第一个问题是责任归属。如果代理程序(例如 Hermes)能够在会话之间重写自身的记忆和技能,那么团队需要知道谁可以解释行为的变化,以及这种变化记录在哪里。第二个问题是所有权。如果治理和身份管理来自平台供应商(例如 NemoClaw 和 Scout),那么策略引擎和身份管理就属于该供应商,而不是运行代理程序的团队。
英伟达和微软正在竞相为客户选择的任何代理提供治理、身份和可观测性。
对于平台供应商而言,关键在于运行时层,它比任何单一的基础架构模型都更具持久性。英伟达和微软正在竞相为客户选择的任何代理提供治理、身份验证和可观测性,这也是 NemoClaw 同时支持 Hermes 和 OpenClaw 的原因。
安全性也遵循同样的逻辑。对 OpenClaw技能市场的审计发现,在其扫描的技能中存在 341 个恶意条目,而安全公司今年早些时候报告了数万个暴露的实例——这正是运行机制旨在弥合的漏洞。
接下来会发生什么?
智能体市场正从模型选择阶段向运行时、治理和内存层面发展。
OpenClaw 表明,广泛的入口和庞大的技能生态系统能够吸引开发者,并促成 OpenAI、Nvidia 和微软等公司的参与。
Hermes 则证明,持久内存和自我提升的技能能够在没有相同平台支持的情况下,驱动高负载的日常使用。由于 NemoClaw 运行于同一套控制系统之下,而 Hermes 可以导入 OpenClaw 的配置,因此,广度和深度是否会继续保持各自独立的项目尚不明朗。
下一阶段的关键在于所有权。
企业需要了解代理程序所积累的内存由谁控制,AI代理程序可以调用哪些工具由谁管理,以及谁拥有维持其运行的运行时环境。
一个已经掌握了开发者一年使用习惯的代理程序,其切换成本远高于仅仅连接到多个应用程序的代理程序。内存(而非渠道覆盖范围)正逐渐成为更持久的锁定机制,因此,运行时环境、治理和内存层将成为平台供应商在各自项目底层展开竞争的焦点。
作者:场长
夜雨聆风