乐于分享
好东西不私藏

AI Agent 三国杀:Claude Code vs OpenClaw vs Hermes Agent 深度横评

AI Agent 三国杀:Claude Code vs OpenClaw vs Hermes Agent 深度横评

2026 年,AI Agent 赛道进入「三国杀」阶段。

一边是 Anthropic 官方的编码利器 Claude Code,一边是 Peter Steinberger 搞出的多平台消息网关 OpenClaw(310K+ GitHub Stars),还有 Nous Research 推出的自学习闭环 Agent——Hermes Agent。

它们定位完全不同,但都在争夺同一个问题:AI 到底该怎么跟人协作?

本文从产品定位、记忆系统、Skill 生态、Token 消耗、执行循环五个维度,逐层拆解三者的设计哲学与技术差异。

AI Agent 三国杀封面

一、产品定位:三把不同的刀

先看一张总览表:

维度
Claude Code
OpenClaw
Hermes Agent
开发者
Anthropic(官方)
Peter Steinberger(社区)
Nous Research
本质
终端/IDE 编码 Agent
多平台消息网关 + Agent
多平台网关 + 自学习 Agent
技术栈
TypeScript CLI
Node.js + Rust (Pi)
Python CLI + Gateway
开源
闭源
MIT 开源
MIT 开源
模型绑定
仅 Anthropic Claude
任意(Claude/GPT/DeepSeek/GLM/Ollama)
任意(200+ via OpenRouter)
交互方式
终端 / IDE / Web
20+ 聊天平台
6+ 平台 + CLI
设计哲学
「最强编码刀」
「最广连接网」
「唯一会自己长大的 Agent」
GitHub Stars
N/A(闭源)
310K+
~30K(2 个月)

一句话:Claude Code 写代码最强,OpenClaw 连接平台最多,Hermes Agent 是唯一能「越用越懂你」的。


二、记忆系统:从笔记卡到向量金字塔到自学习闭环

三者记忆架构差异巨大,构成一条清晰的进化线。

Claude Code — 结构化笔记卡

~/.claude/projects/<project>/memory/
├── MEMORY.md      ← 索引(≤200行,始终加载)
├── user_role.md   ← 单条记忆
├── feedback_xxx.md ← 单条记忆
└── project_xxx.md  ← 单条记忆

工作流很简单:对话开始 → MEMORY.md[1] 加载到上下文 → 需要时 Read 单个文件 → 主动判断写入时机。

优点: 简单透明,200 行硬上限防止失控。

缺点: 无语义搜索,全靠标题浏览,Agent 自己决定什么时候记。

OpenClaw — 四层金字塔

~/.openclaw/workspace/
├── SOUL.md        L1 ← 人格/语气(始终注入)
├── USER.md        L2 ← 用户偏好(始终注入)
├── MEMORY.md      L3 ← 长期记忆(持续膨胀!)
├── HEARTBEAT.md   ← 心跳检查清单
└── AGENTS.md      ← 工作区指令
~/.openclaw/memory/
└── .sqlite        ← 向量索引

四层全部注入 system prompt,加上向量搜索召回历史记忆,还有心跳机制定期自检。

优点: 向量搜索能力强,心跳自检确保记忆不腐化。

缺点:MEMORY.md[2] 无自动压缩,持续膨胀带来安全和成本风险。

Hermes — 闭环自学习

~/.hermes/
├── MEMORY.md   ← 继承 OpenClaw 格式
├── USER.md     ← 用户偏好
├── SOUL.md     ← 人格定义
└── sessions.db ← FTS5 全文索引

核心是「闭环学习」:任务完成 → 自动提炼 → 写入记忆 → FTS5 全文检索 → Honcho 用户建模 → 理解「你是谁」 → Periodic Nudge 自我提醒。

优点: 唯一有用户建模的,自动学习越用越懂你。

缺点: 黑盒度高,你不太清楚它到底学了什么、记了什么。

记忆系统核心对比

维度
Claude Code
OpenClaw
Hermes Agent
架构模式
文件型笔记卡
四层金字塔 + 向量索引
闭环学习 + FTS5 + 用户建模
检索方式
索引浏览(无搜索)
向量搜索
全文搜索 + LLM 摘要
用户建模
Honcho 辩论建模
自动持久化
否(Agent 主动判断)
是(+ 心跳)
是(+ Nudge 自检)
透明度
增长控制
200 行硬上限
无自动压缩
LLM 摘要自动压缩
记忆系统六维雷达图

三、Skill 系统:从提示词库到插件市场到自生长记忆

Claude Code — 专家提示词库

Skill = 结构化提示词(SKILL.md[3]),/skill-name 展开为完整 prompt。手动创建,无官方市场,调用时才注入,不用不花 token。

OpenClaw — 插件市场生态

三层优先级:Built-in > ClawHub > User。ClawHub 市场有 13,000+ 技能。但已安装技能始终注入 system prompt,也就是说装多了每次请求都要付固定 token 税。另外约 20% 已标记为恶意——生态大但安全风险也大。

Hermes — 自生长程序性记忆

这是三者中最独特的:解决问题后自动生成 Skill,Skill 在使用中自改进,兼容 agentskills.io[4] 开放标准,按需加载不预注入。

Skill 核心对比

维度
Claude Code
OpenClaw
Hermes Agent
创建方式
手动
手动
自动 + 手动
自改进
注入策略
按需加载
始终注入
按需加载
市场生态
无官方市场
ClawHub (13K+)
Skills Hub
安全审核
白名单 + 审核工具
内置沙箱
核心差异
提示词注入
插件市场
自生长程序性记忆
Skill 系统三大阵营对比

四、Token 消耗:谁最烧钱?

记忆和 Skill 对 token 消耗的影响是三者成本差异的根本原因。

每次 API 调用的 Token 构成

总 Token = System Prompt + 记忆注入 + Skill 注入 + 当前对话 + Tool 结果 + LLM 输出

三者的固定开销差异巨大:

Token 来源
Claude Code
OpenClaw
Hermes Agent
System Prompt(内置)
3-5K
5-10K
6K
人格/指令文件
1-3K
1-5K
1-5K
记忆索引/内容
2-4K
2-20K
2-5K
心跳/自检
1-5K
0.5-2K
Skill 描述(已安装)
0(按需)
3-10K+
0(按需)
始终注入合计 ~11K (30%) ~29K (40%) ~11K (22%)

核心结论:

  • Claude Code 是「按需取用」——不用就不花 token,还有 Prompt Caching 90% 折扣

  • OpenClaw 是「全量预加载」——装了多少 Skill、记了多少事,每次请求都要付固定税,24/7 运行下成本极易失控

  • Hermes Agent 介于两者之间——按需加载 Skill + LLM 摘要压缩记忆,但自学习闭环会产生额外的「隐形 API 调用」

成本控制策略

策略
Claude Code
OpenClaw
Hermes Agent
预算上限
无内置
maxCostPerDay

 / maxTokensPerDay
未明确
模型降级
不可选
Fallback 链
/model

 随时切换
Prompt Caching
原生 90% 折扣
取决于提供商
取决于提供商
记忆瘦身
手动删除
memory index

 重建
LLM 自动摘要
成本失控风险
Token 固定开销对比
成本控制能力对比

五、Agent 执行循环

Claude Code:单线程编码利器

用户输入 → System Prompt → LLM 推理 → Tool 调用(Read/Write/Edit/Bash/Grep/Glob)→ 结果返回 → 继续推理 → 输出。

特点:单线程、单会话、无后台。自动压缩上下文 + Prompt Caching。

OpenClaw:多平台消息枢纽

消息平台(Telegram/Discord/微信…)→ Gateway 路由 → 四层记忆注入 → LLM 推理 → Skill/Tool 执行 → 响应回平台 → 记忆更新。

特点:多平台、多会话、心跳、子代理、DM 配对、群组沙箱、工具白名单。

Hermes:学习闭环引擎

消息平台/CLI → Gateway → FTS5 搜索 + Honcho 用户建模 → LLM 推理 → Skill/Tool 执行 → 经验提炼 → 自动写 Skill + 持久化 → Nudge 自检 → 响应。

特点:学习闭环、并行子代理、Atropos RL 训练、轨迹导出微调。

Agent 执行循环对比

六、选型指南

你的需求
推荐
理由
纯编码(写代码、调试、重构)
Claude Code
编码质量最高,模型最懂代码
全能生活助理(消息、邮件、日程)
OpenClaw
平台接入最广,生态最大
让 AI 越来越懂你
Hermes Agent
唯一有学习闭环的
多平台 + 编码组合
OpenClaw + Claude Code
社区有桥接 Skill
ML 研究 / 训练数据生成
Hermes Agent
Atropos RL + 轨迹导出
成本敏感
Claude Code
Prompt Caching 90% 折扣 + 按需加载
24/7 无人值守
OpenClaw
心跳 + Cron + 多平台推送
选型指南热力图

总结

Claude Code 是最强编码刀,OpenClaw 是最广连接网,Hermes Agent 是唯一会自己长大的 Agent

三者的记忆和 Skill 系统从简单到复杂恰好构成一条进化线:静态笔记 → 向量搜索 → 自学习闭环。

选哪个?取决于你最在意什么——编码质量、平台覆盖、还是 AI 能不能真正「记住你」。


本文基于 hyphentech.top/agent-comparison[5] 原始对比数据撰写。

参考资料

[1]MEMORY.md: http://memory.md/

[2]MEMORY.md: http://memory.md/

[3]SKILL.md: http://skill.md/

[4]agentskills.io: http://agentskills.io/

[5]hyphentech.top/agent-comparison: http://hyphentech.top/agent-comparison

黑粉科技

用大白话讲透 AI 硬核知识

━━━━

📱 公众号:黑粉科技

📺 B站:黑粉科技

🎬 快手 / 视频号:黑粉科技

🌐 官网:www.hyphentech.top

— 感谢阅读,欢迎关注 —