90 天登顶 OpenRouter:Hermes Agent 凭什么掀翻 OpenClaw?
// TL;DR — 关键结论
|
01 定位「深度学习派」对手盘。2026-02-25 发布,以 do→learn→improve 闭环对抗以连接广度取胜的 OpenClaw;2026-05-10 首次在 OpenRouter 单日推理量登顶(224B vs 186B),但累计 token 仍落后(6.35T vs 9.17T)。 |
|
02 核心差异化=自动生成技能 + 跨会话记忆。任务后自动反思并沉淀可复用 skill、SQLite FTS5 全量会话检索、用户/Agent 身份快照(含 Honcho 用户建模),使其「越用越优化」——区别于 OpenClaw 的人工技能市场。 |
|
03 商业模式=开源获客 + Nous Portal 订阅变现。Agent 本体完全免费(MIT、无付费墙);Nous Research 通过 Nous Portal(300+ 模型 + 工具网关,Plus $20 / Super $100 / Ultra $200)与模型 API 加价取得收入。 |
|
04 真正的战略意图是「数据飞轮」。官方架构文档证实:框架内置从会话生成 ShareGPT 格式轨迹(trajectory)+ 批量轨迹生成,为 Nous 训练下一代工具调用模型供给数据——Agent 既是分发渠道,也是其去中心化训练业务(DisTrO / Psyche / Solana)的语料引擎。 |
|
05 风险集中在生态深度与安全成熟度。内置技能数量仍小于对手的社区技能市场;作为新生项目已现 CVE(v0.8.0 webhooks 缺认证);尚未公开 DAU/营收,代币经济学仍未披露。 |
|
01 — PRODUCT 产品路线 |
// 定位 · 能力边界 · 演进时间线 · 路线图信号
## 产品定位与目标用户
官方将其定义为「Nous Research 打造的自我进化 AI Agent……唯一内置学习闭环的 Agent」,口号 The agent that grows with you。本质是一个 终端原生(TUI-first)、可自托管 的通用个人/开发者 Agent 框架,可跑在 低成本的 VPS、GPU 集群或近零闲置成本的无服务器环境,并能从 Telegram、Discord、Slack 等渠道远程驱动。[1]
目标用户分三层 :① 开发者/极客——CLI 重度用户、自托管偏好者、OpenClaw 迁移存量;② AI 研究者——利用其批量轨迹生成做训练数据;③ 泛知识工作者——6 月桌面应用降门槛后的增量人群。[3][5]
## 能做什么 / 明确不做什么
核心能力(能做)
▸ 自我进化闭环:复杂任务后自动反思、自动创建并在使用中持续打磨 skill;后台 Curator 自动评分、剪枝、合并技能库。[1][3]
▸ 跨会话记忆:SQLite FTS5 会话全文检索 + 用户/Agent 身份快照 + 程序化技能,集成 Honcho 辩证用户建模。[1][2]
▸ 多渠道在地化:截至 v0.13.0 支持 20 个消息平台(Google Chat、QQBot、WeChat、iMessage 等),语音转写、跨平台会话连续。[1][3]
▸ 编排与并行:多 Agent(各有人格/技能/历史)、子 Agent 隔离并行、Kanban 任务板(心跳/僵尸检测/幻觉恢复)、cron 定时自动化。[3]
▸ 模型/运行无锁定:OpenRouter(200+ 模型)、NVIDIA NIM、AWS Bedrock、Ollama、本地端点;6 种终端后端。[1][2]
边界(明确不做 / 非目标)
✕ 不绑死自有基础模型:刻意保持「带上你自己的模型、零代码切换、无锁定」。[1]
✕ 不做中心化网关 + 大型人工技能市场:消息网关是「可选模式」,技能以自动生成 + agentskills.io 开放标准为主。[3][7]
✕ 本体不设付费功能墙:全部能力在免费自托管版可用,不做按席位/按功能 SaaS 收费。[7]
|
产品演进时间线(2026-02 →2026-06) 2026-02-25 · LAUNCH Hermes Agent 首次发布 在「个人 Agent=安全噩梦」的舆论环境中入场,押注「越用越聪明」的差异化架构。 2026-04-13 · v0.9.0 “Everywhere” 无处不在 Android/Termux、iMessage(BlueBubbles)、WeChat/WeCom、本地 Web 仪表盘;扩至 16 平台 + 深度安全加固。487 commits · 269 PRs 2026-04-16 · v0.10.0 “Tool Gateway” 工具网关 Portal 订阅者免配密钥即获搜索(Firecrawl)、图像(FAL)、TTS(OpenAI)、浏览器(Browser Use)。 2026-04-27 · NOUS PORTAL 订阅产品上线 将 300+ 模型与工具网关收拢到单一 OAuth 订阅,正式开启商业化变现入口。 2026-04-23 · v0.11.0 “Interface” 界面重写 React/Ink TUI 重写;AWS Bedrock、NVIDIA NIM 等 5 条推理路径;Codex OAuth 接 GPT-5.5;第 17 平台 QQBot。1,556 commits · 761 PRs 2026-04-30 · v0.12.0 “Curator” 策展人 后台 Curator 自动治理技能库;真多 Agent + 实时仪表盘 + Kanban;TUI 冷启动降约 57%。 2026-05-07 · v0.13.0 “Tenacity” 韧性 Kanban 持久化任务板(心跳/僵尸检测/幻觉恢复);/goal 锁定目标;Checkpoints v2;8 项 P0 安全修复;第 20 平台 Google Chat。864 commits · 295 contributors 2026-05-10 · MILESTONE 登顶 OpenRouter 全球日活推理榜 #1 单日 224B token 超 OpenClaw 186B,为后者发布以来首次易主(累计 token 仍由 OpenClaw 领先)。 2026-05-15 · PARTNERSHIP xAI Grok 集成 X Premium+ 用户经 OAuth 在 Hermes 内直接用 Grok 4.3 / Grok TTS / Grok Imagine。 2026-06-02 · v0.15.2 DESKTOP Hermes Desktop 桌面应用(公测) 原生 macOS 构建、流式工具输出;自动识别已有 CLI 配置——「走向大众」关键一步。 2026-06-06 · v0.16.0 “The Surface Release” 当前最新版本 仓库标注的最新发布(共 17 个 release、11,000+ commits)。 |
## 未来路线图信号
▸ 从 CLI 走向桌面/大众:6 月桌面应用 + “Surface” 代号,重心由极客 CLI 向更广界面延伸。[5]
▸ 官方托管在路上:第三方披露 Nous 原生 Hermes 托管处于私测、开放候补名单。[8]
▸ 持续扩模型/工具合作:Grok 集成模式或被复制到更多模型方,强化 Portal「一站式」价值。[10]
▸ 生态外溢:社区已构建 Memory OS(6 层记忆栈)、computer-use-linux 等,平台化趋势显现。[1]
|
02 — TECHNOLOGY 技术原理 |
// 架构内核 · Prompt/上下文 · 记忆 · 工具 · 闭环 · 网关 · 数据飞轮 · 工程质量
本节基于 Nous 官方架构文档与仓库源码结构整理,并保留与营销口径的少量差异(如工具数量)。
## 2.1 整体架构:单一 AIAgent 内核 + 多入口
Hermes 是「平台无关内核」设计:同一个 AIAgent 类(run_agent.py) 同时服务于 CLI、消息网关、ACP(IDE)、批处理、API Server、Python 库 6 类入口;平台差异只存在于入口层,不污染内核。AIAgent 是一个同步编排引擎,统管 provider 选择、prompt 构造、工具执行、重试/回退、回调、上下文压缩与持久化,并支持 3 种 API 模式(chat_completions / codex_responses / anthropic_messages)以适配不同后端。[2]
|
入口层 / ENTRY POINTS
↓
↓
可插拔(单选插件):模型 Provider · 记忆 Provider · Context Engine |
## 2.2 数据流:一次 CLI 会话发生了什么
|
用户输入 → HermesCLI.process_input() → AIAgent.run_conversation() → prompt_builder.build_system_prompt() → runtime_provider.resolve_runtime_provider() → API 调用(3 选 1 模式) → 有 tool_calls? → handle_function_call() → 循环 → 最终回复 → 展示 → 写入 SessionDB (SQLite+FTS5) |
网关消息流与 cron 任务流复用同一内核:网关额外做「用户鉴权 → 会话键解析 → 带历史创建 AIAgent」;cron 则「创建无历史的全新 AIAgent → 注入挂载的技能 → 跑任务 → 投递到目标平台」。[2]
## 2.3 Prompt 组装与上下文工程
系统提示按 stable → context → volatile 三层有序拼装:稳定层(身份/工具指引/技能)→ 上下文层(context files)→ 易变层(记忆/用户画像/时间戳)。一条关键设计原则是「Prompt 稳定性」——会话中途不改系统提示、不做破坏缓存的变更,从而启用 Anthropic 的前缀缓存(prompt_caching.py)降本。当上下文超阈值时,context_compressor.py 对中段对话做有损摘要;ContextEngine 为可插拔抽象类,配合 v0.13 的 Checkpoints v2 做真正的状态剪枝。[2][3]
## 2.4 记忆系统:三层 + 血缘
记忆由三类机制承载,共同实现「越用越懂你」:
|
|
|
|
|
|
|
|
|
来源:①②③ 机制见官方架构文档[2];「三层」归纳综合自 MarkTechPost[3] 与官方 README[1]。
## 2.5 工具系统与执行
▸ 中央注册表(registry.py):70+ 工具 / ~28 工具集,每个工具文件导入即自注册,注册发生在任何 Agent 实例创建之前,无需手工维护导入清单。[2]
▸ 工具族:终端编排(6 后端)、浏览器自动化(10 个工具)、web_search/web_extract、文件读写/patch/搜索、code_execution 沙箱、delegate 子 Agent、mcp_tool 动态接入任意 MCP 服务器。[2]
▸ 安全与可观测:approval.py 危险命令检测;「每个工具调用对用户可见(回调)」「可中途打断」为内核设计原则。[2]
▸ RPC 折叠:可写 Python 经 RPC 调工具,把多步流水线压成「零上下文成本」单轮——降低 token 与延迟。[1]
## 2.6 运行后端、隔离与网关
▸ 6 种终端后端:local / Docker / SSH / Modal / Daytona / Singularity(HPC)。Modal、Daytona 提供无服务器持久化:环境闲置休眠、按需唤醒,间歇期近零成本。[2][1]
▸ Profile 隔离:每个 profile 拥有独立的 HERMES_HOME、配置、记忆、会话与网关 PID,可并发多开。[2]
▸ 网关(GatewayRunner):单一长驻进程挂 20 个平台适配器(含 feishu/wecom/weixin/dingtalk/yuanbao 等国内通道),白名单 + DM 配对鉴权、hooks、跨会话镜像、cron tick。[2]
## 2.7 数据飞轮:从「使用」到「训练语料」
官方架构文档明确列出 Trajectories 子系统:从 Agent 会话生成 ShareGPT 格式轨迹 用于训练数据;配合 batch_runner.py 批量轨迹生成、trajectory_compressor 轨迹压缩、datagen-config-examples 配置样例。换言之,每一次真实使用都可被沉淀为「下一代工具调用模型」的训练资产。这把开源 Agent 的分发与变现,和 Nous 的去中心化训练母业(DisTrO / Psyche / Solana)连成一个正循环——这是它与纯工具型 Agent 的根本不同。[1][2]
## 2.8 核心机制速查表
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## 2.9 差异化壁垒 与 已知局限
|
差异化 / 壁垒 ▸ 自动技能生成 vs 人工技能市场:从自身运行历史生成技能,区别于 OpenClaw/Claude Code 依赖人工撰写的 skill。[3][5] ▸ 复利护城河:记忆与技能随使用沉淀,迁移成本随时间上升。 ▸ 研究就绪:轨迹生成 + 压缩把使用行为转成训练资产。[2] |
|
已知局限 / 失败模式 ✕ 生态深度不足:内置技能数量远少于对手数千至数万条社区技能,冷启动「能力面」偏窄。[5] ✕ 网关上下文开销大:经 Telegram/Discord 每请求注入约 15k–20k token 工具定义(CLI 约 6k–8k)。[11] ✕ 长程稳定性挑战:需引入心跳监控、僵尸检测、「幻觉恢复」,反向印证多 Agent 长跑的脆弱性。[3] ✕ 安全尚未成熟:v0.8.0 曾存在 webhooks 缺认证(CVE-2026-7113,CVSS 3.x 5.6 中危,仅影响该版本);项目年轻、记录短。[3] |
|
03 — BUSINESS MODEL 商业模式 |
// 价值主张 · 客户分层 · 收入与定价 · 单位经济性 · 财务信号
## 商业模式画布
|
关键合作 Paradigm 等投资方;模型方 xAI/OpenAI/Anthropic/Google/DeepSeek/Qwen;工具方 Firecrawl·FAL·Browser Use;平台 Modal·Daytona·AWS·NVIDIA;Honcho |
价值主张 「越用越懂你」的自我进化 Agent:闭环学习 + 跨会话记忆 + 无模型锁定 + 任意环境运行。对 Nous:把使用转化为 训练数据飞轮。 |
客户分层 ① 开发者/极客② AI 研究者③ 泛知识工作者 |
|
关键资源 / 渠道 开源仓库 + 188k★ 社区;Hermes/Nomos 模型;GPU/去中心化算力;$70M 融资。渠道:GitHub·OpenRouter 榜·Portal·桌面应用·KOL |
收入来源 Nous Portal 订阅(Plus/Super/Ultra);模型 API 按量加价;(第三方)托管分润;未来代币经济(未披露) |
成本结构 研发人力;模型训练/推理算力;工具网关上游采购;社区与基础设施 |
## 收入模式与定价 — Nous Portal
2026-04-27 上线,用单一 OAuth(hermes setup –portal)替代对 OpenRouter/Anthropic/OpenAI/Firecrawl/FAL/Browser Use 等的多账号管理。付费档含 300+ 模型 + 工具网关额度;部分模型对订阅者免费(轮换名单,含 Hermes 系列与 MiMo v2 Pro)。[10][12][13]
|
FREE $0 $0.10 额度仅评估 |
PLUS ★ $20 约 $22 额度·结转+$2 奖励 |
SUPER $100 更高额度+$10 奖励 |
ULTRA $200 约 $220 额度·最高限额+$20 奖励 |
来源:Portal 订阅页与联合创始人 Teknium 公开发布[12][13][14]。第三方托管(社区 FlyHermes / OpenClaw Launch,约 $29.5–$59/月)非官方产品,仅作旁证。
## 成本结构与单位经济性(用户侧)
基于已有信息推断:本体免费,用户实际支出=VPS 主机(约 $4–25/月,Hetzner CX22 $4.35 常见)+ LLM API(约 $2–60/月,取决于模型)。预算型组合总成本可低至约 $7/月;用 Claude Opus 4.8 等高端模型则贵约 30 倍。对照 ChatGPT Plus $20 / Claude Pro $17——预算型不到一半,高端型数倍但无使用上限。[11][5]
## 公开财务信号(母公司 Nous Research)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
背景:Nous Research 由 Jeffrey Quesnelle(CEO)、Karan Malhotra、”Teknium”、Shivani Mitra 等于 2022–2023 年创立,定位「去中心化、社区驱动」开源 AI 实验室,核心技术含 DisTrO、Psyche 训练协调(基于 Solana)、Hermes/DeepHermes 模型系列。[16][17]
|
04 — OPERATIONS & GTM 运营方式 |
// 获客渠道 · 社区/生态 · 合作集成 · 增长指标
## 获客与销售模式
典型 PLG(产品驱动增长)+ 开源飞轮:免费 MIT 软件做漏斗顶端获客 → OpenRouter 榜单与 GitHub Star 形成社会证明 → Nous Portal 订阅与模型 API 加价做变现尾端。无传统销售团队信号;增长由「一键迁移 OpenClaw」「桌面应用降门槛」「与模型方合作」三杠杆驱动。[5][7][10]
## 社区、生态与关键集成
▸ 社区中枢:Discord、GitHub Issues、Skills Hub(agentskills.io);单版本约 295 名贡献者、累计近千。[1][3]
▸ 多语本地化:提供中文(zh-CN)、乌尔都语等 README 与 7 套 i18n locale,且原生支持飞书/企业微信/微信/钉钉/元宝通道,明显面向中文圈扩张。[1][2]
▸ 模型/工具集成:xAI Grok(OAuth 复用 X Premium+)、Codex OAuth 接 GPT-5.5、Anthropic/Google/DeepSeek/Qwen/MiMo/GLM/Kimi/MiniMax;Firecrawl·FAL·Browser Use·OpenAI TTS·Honcho。[1][10]
▸ 互操作:经 ACP 可与 OpenClaw 并行(后者编排、Hermes 跑可复用任务环)。[3]
关键信息对比 — Hermes Agent vs OpenClaw
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## 可观察的增长 / 活跃度
▸ Star 增速:10 周达 11 万星,称「2026 年增长最快的 Agent 框架」;至 6 月约 188k★、32.4k forks。[1][3][4]
▸ 推理活跃:2026-05-10 登顶 OpenRouter 单日推理(224B token),约 90 天夺日活第一。[3]
▸ 迭代节奏:4 个月 17 个 release、11,000+ commits,单版可达 800–1,500+ commits。[1][3]
▸ 留存/付费转化:暂无官方留存、付费转化、DAU/MAU 数据。
|
★ — SUMMARY SWOT 与风险 / 机会 |
|
S 优势 · 自我进化闭环 + 跨会话记忆=复利护城河· 模型/环境彻底无锁定,部署灵活· 高频迭代 + 强社区,约 90 天夺日活第一· 背靠 Paradigm、$1B 估值母体与自有模型/算力 |
W 劣势 · 内置技能/生态深度远逊对手· 项目年轻、安全记录短,已现 CVE· 变现依赖上游模型/工具,毛利受挤压· 营收/留存/代币经济学均未披露 |
|
|
O 机会 · 承接 OpenClaw 安全危机 + 领导层变动的迁移红利· 桌面应用 + 多语本地化打开大众市场· 「使用即训练数据」飞轮反哺 Nous 模型· 复制 Grok 模式拓展更多模型方合作 |
T 威胁 · OpenClaw 累计规模仍领先 + OpenAI 赞助背书· 巨头自带 Agent(Claude Code、Codex 等)挤压· 个人 Agent 被视为「攻击面」,安全舆论压力· 加密属性 + 代币未发,商业/合规不确定 |
|
# — REFERENCES 参考来源 |
|
|
一手·GitHub 官方仓库
|
|
|
一手·官方架构文档
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
夜雨聆风