HERMES AGENT · AGENT 基础设施演进
重塑数字主权:从 OpenClaw 到 Hermes Agent的架构演进
OpenClaw 用几个月拿下 20 万 GitHub 星,创始人 Steinberger 被 OpenAI 收编,项目交给开源基金会。Nous Research 的 Hermes 随即接棒——它的赌注不是更多通道,而是一个会自己写新技能的代理。控制论遇上进化论,谁才是下一代本地 AI 的底座?
#OpenClaw#Hermes#NousResearch#AIAgent#MCP
2025 年末到 2026 年初的几个月里,AI 应用层完成了一次从"云端对话"到"本地持续性自主代理"的范式转移。核心诉求只有一个:夺回数字主权——让代理运行在你的私有设备上,直接操作文件、接入多协议通讯、跨月保留深度个性化记忆。
OpenClaw 是这一波的绝对领导者。从 Clawdbot(2025.11)到 Moltbot(2026.1)再到 OpenClaw,几个月拿下 20 万 GitHub 星,社区增速超过历史上的 Docker 和 React。创始人 Peter Steinberger 加入 OpenAI,项目交给开源基金会托管。它不是一个拥有自研底模的大脑,而是一个精密的本地编排层——给现有 LLM 装上了操作文件系统和网络接口的"手"和"眼"。
但随着重度开发者和企业级全天候自动化需求深化,基于静态规则的架构在"持续学习"和"自我进化"上开始吃紧。Nous Research 推出的 Hermes Agent 拿出的方案是根本性的架构转变——从"严格执行人类手册的助手"演进为"任务完成后自主编写新技能的自我进化引擎"。
一、OpenClaw:控制平面优先的自动化枢纽
OpenClaw 的核心是一个叫 Gateway 的中央消息路由中心。它像一个高效的"交通警察",把 Telegram、WhatsApp、Slack、Discord、iMessage、IRC、LINE 等 20 多种平台的消息汇集到单点处理。配置集中在 ~/.openclaw/openclaw.json,可以配置严格的审批流——任何 shell 脚本或网页抓取必须通过通讯软件获得人类明确授权。
代理不存在于数据库,完全依附于可见的纯文本文件。会话启动时实时读取一组 Markdown 文件组装身份——SOUL.md(灵魂:角色设定与硬性边界)、SKILL.md(人类总结的最佳实践)、MEMORY.md / USER.md(显式记忆与用户偏好)。像管理代码一样用 Git 管理 AI 助手。
静态智能的两个瓶颈openclaw doctor --config-diff 诊断命令,排查 compaction.mode 或未知键值引发的异常。 |
二、Hermes:基于机器反思的自主演化引擎
Nous Research 是一家有去中心化网络背景的 AI 研究机构,两轮融资约 7000 万美元,还在搞一个叫 Psyche 的分布式训练网络。这个背景让 Hermes 的焦点从"控制与编排"转向了"代理自身的执行与演化循环"。
持续学习循环(Do → Learn → Improve)。面对长文档总结或代码调试,Hermes 任务完成后不会立即跳转下一指令,而是主动停顿、回溯执行轨迹。如果找到更优路径,它会自主编写新的技能文件永久保存到本地技能库。下次遇到类似挑战,优先检索自创技能直接套用——通过复用和覆盖重写自己的"大脑",执行速度与准确率实现指数级提升。
| " 程序性记忆回答的不是"这件事是什么",而是"我该如何逐步完成这类任务"。这是 Hermes 与传统 RAG 的根本分水岭——它学的是程序,不是事实。 |
分层记忆栈。背景模型总结的事实型声明性记忆支持跨月全文检索、不拖累推理;跨会话的用户建模在 USER.md 里持续记录偏好、决策史、工作模式,自动维护"错误日志"避免重复失误,"习惯日记"强化有效的交互模式。
DSPy + GEPA 演化算法。官方维护的 hermes-agent-self-evolution 子项目利用 DSPy 框架结合 GEPA(遗传-帕累托提示词演化算法),对技能、工具描述和系统提示词进行自动化演化寻优。算法读取执行轨迹、定位失败根因、生成改进变体,通过约束网关挑选帕累托最优解,甚至直接向主代码库提交 PR。
$2 – $10 单次演化运行成本无需 GPU 微调 | 3,000 Level 0 目录级披露技能元数据 Token 消耗 | 64K 硬性上下文窗口要求本地模型必须锁定 |
渐进式信息披露。配合 Anthropic 提示词缓存技术分三级加载:Level 0 只拉技能名称+简述元数据(3K tokens);Level 1 需要时提取完整指令文本;Level 2 仅在涉及脚本调用或模板时加载外部参考。OpenClaw 在庞大工作区下容易上下文溢出,Hermes 这套按需加载机制是关键解法。
技能语法严谨性。每个 SKILL.md 必须包含 YAML frontmatter,明确声明兼容 OS 和必需环境变量(如 Docker 技能要写 POSTGRES_PASSWORD)。接近包管理器级别的前提条件校验,大幅降低执行崩溃率。
三、架构对比:控制论与进化论的碰撞
| 核心哲学 | 自主演化 | |
| 技能获取 | ||
| 记忆机制 | ||
| 身份控制 | /personality 覆盖 | |
| 最佳场景 |
四、生产部署:从桌面到 Serverless
资源基线。最低 1 vCPU / 2GB RAM / 10GB 存储;生产网关推荐 2+ vCPU / 4GB+ / 20GB+ SSD。操作系统推荐 Ubuntu 22.04 或 Debian 12,生产环境 Ubuntu 24.04。
Windows 不原生支持——必须通过 WSL2 宿主。官方极简脚本自动处理 Python 3.11 venv、Node.js v22(浏览器自动化)、ripgrep、ffmpeg 的拉取与链接。
Android 通过 Termux。官方构建了 .[termux] 专用安装包,需用 pkg 安装 rust/clang/openssl,手动 export ANDROID_API_LEVEL 让 maturin 编译通过。注意:ctranslate2 和 faster-whisper 暂无 Android 预编译包,移动端被强制移除本地语音模块。
NixOS 声明式部署。通过 Nix Flake 编写 configuration.nix,用 sops-nix 安全注入 API 密钥;启用 container.enable = true 把 Agent 封装在 Docker/Podman 驱动的持久化 Ubuntu 容器里——既能自由 apt/npm 安装依赖,又保证宿主机隔离。开源代理领域极其罕见的工程化路径。
| Serverless 成本控制模式 |
五、迁移路径:OpenClaw → Hermes 的无损过渡
社区的主流实践不是零和替换,而是"Hermes 负责深层逻辑与长期学习,保留网关对接前端"。官方内置了 hermes claw migrate 迁移引擎。首次执行 hermes setup 向导时自动扫描 ~/.openclaw,一键拦截并提供迁移选项。
核心资产映射四件套~/.hermes/skills/openclaw-imports/▸ 信任继承:Telegram/OpenRouter/ElevenLabs 密钥 + 命令白名单直接跨系统继承 |
迁移后用 hermes doctor 做全链路体检。原 OpenClaw 网关用户可无缝过渡到 Hermes 的 CLI/Messaging 混合命令——/personality [name] 快速切换会话人格,/compress 强制收敛历史上下文。
六、边界突破:MCP、多实例与 IDE 共生
多实例隔离(Multi-Agent Profiles)。早期个人 AI 被设计成"全知全能的单体引擎",跨域任务(个人杂务 + 企业高保密代码重构)容易数据污染、权限越界。Hermes 在同一台物理机或 VPS 上可同时启动多个完全独立的代理实例,每个实例独立的内存、技能集、模型后端——实例 A 挂廉价局部模型做邮件过滤,实例 B 挂旗舰模型做夜间代码库审计,低成本构建微服务化 AI 中台。
MCP + ACP 协议深度集成。Hermes 可基于标准化 stdio 本地进程通信或带 OAuth 2.1 鉴权的远程 HTTP,对接外部工具链。更具革命性的是 ACP(Agent Context Protocol)——让 Hermes 作为底层上下文服务直接暴露给 Cursor、Zed、JetBrains、Claude Desktop。
| 开发者敲代码时,能无缝调取 Hermes 在后台跑了几个月的代码审查标准、系统架构理解和程序性经验。"驻留代理"与"人类交互工具"之间的系统孤岛,被彻底打破。 |
◆
架构选型建议 留在 OpenClaw:场景核心诉求是"极稳、规则严密、不容越轨的确定性审批流"——敏感资金流向指令转发、多平台标准化客服分发。零摩擦信道连接性 + 透明执行边界,OpenClaw 依然不可替代。 迁往 Hermes:任务具备持续迭代、模糊处理或长周期工程属性——长期探索性编程、周期性海量数据处理、云端 Serverless 无限扩展的数字劳动力集群。反思飞轮 + MCP 万物互联 + GEPA 演化,会创造难以量化的自动化复利。 投资视角:Nous Research 的 7000 万美元融资和 Psyche 分布式训练网络表明这不是一个工具玩家,而是在押注"去中心化 AI 基础设施"的全栈愿景。如果未来 IPO 或被收购,其估值锚点将不是 Agent 工具本身,而是"数据策展层 + 自演化引擎"的基础设施地位——类似 2018 年看 Docker 和 Kubernetes。 范式含义:从静态脚本执行器向具备反思能力的认知实体的演进,标志着 AI 应用层进入新的成熟周期。选 OpenClaw 还是 Hermes,本质上是"系统确定性"与"认知演化能力"之间的战略权衡——掌握具备持续自我演化能力的基础设施,是重塑数字主权的最优路径。 |
本文基于 OpenClaw / Hermes Agent 官方文档与社区实施指南整理分析
转载请注明:《宇宙纪事 · AI投资研究》,技术选型请结合自身场景测试,本文不构成部署建议。
夜雨聆风