乐于分享
好东西不私藏

OpenClaw到底能比直接用Claude Code强在哪些地方

OpenClaw到底能比直接用Claude Code强在哪些地方

一个很自然的问题

前两篇我们搞明白了两件事: OpenClaw 不是 Claude Code 的套壳(它是独立系统),而且它比 Claude Code 多做了很多事情(多通道、多模型、多媒体、语音、插件)。

但多做了事情 ≠ 做得更好。一个很自然的问题是:在两者都在做的事情上,谁做得更精细

特别是”上下文压缩”和”Token 效率”这两个影响日常使用体验的关键维度——对话长了之后 AI 还记不记得前面聊了什么?用着用着 Token 账单会不会爆炸?

我翻了 OpenClaw 社区的几个核心 Issue ,找到了一些很有说服力的数据。

上下文压缩:四层管道 vs 一层压缩

当对话超出模型的 context window 时,系统需要压缩历史记录。这个过程叫 compaction 。

Claude Code 的方案是一个精心设计的四层管道

第一步,零成本预清理。不调 LLM ,直接把旧的工具输出替换成一行占位符。光这一步就能在不花钱的情况下砍掉大量 Token 。

第二步,持久化关键记忆。压缩之前先把重要信息写到磁盘文件里,这样即使压缩后丢了一些上下文,关键记忆还能从磁盘恢复。

第三步,LLM 摘要。支持三种模式——全量压缩、只压缩最近的消息、只压缩前面的消息保留后面的原文。而且用了一个巧妙的技巧:让模型先输出 <analysis> 深度分析,再输出 <summary> 摘要,然后丢掉分析只保留摘要。这样摘要质量更高,但不占长期空间。

第四步,压缩后恢复。重新读取最近访问过的 5 个代码文件(最多 50K Token ),重新注入活跃的计划和技能内容,并且告诉模型完整转录文件的路径——万一还是想不起来,可以去翻原始记录。

OpenClaw 的方案简单得多

直接要求 LLM 生成一份结构化摘要(没有预清理步骤),然后做一轮质量验证——检查摘要是否包含所有必要章节,验证关键标识符( URL 、文件路径等)是否存活,确认最新的用户请求有没有被遗漏。如果质量不合格,最多重试 3 次。

逐项对比:

技术点
Claude Code
OpenClaw
零成本预清理
分层压缩模式
3 种
只有全量
压缩后文件恢复
重读最近 5 个文件
持久化关键记忆
写磁盘存盘
质量校验重试
最多 3 次
标识符存活验证

Claude Code 偏重”减少损失”——通过预清理、分层、文件恢复,最大限度保留有用信息。

OpenClaw 偏重”验证质量”——压缩方式粗糙,但压缩后的检查更严格,不合格就重来。

对于编程场景, Claude Code 的方式明显更优——代码文件恢复至关重要,压缩后如果丢了正在编辑的文件内容,几乎等于要从头开始。对于日常对话场景, OpenClaw 的质量守卫能避免低质量摘要溜过去。

Token 效率:一个无法复制的结构性优势

OpenClaw 社区的 Issue #35203[1] 揭示了一个核心问题:

多 Agent 任务消耗的 Token 是单 Agent 执行的 4-6 倍(理想应该是 1.5-2 倍)

4-6 倍是个什么概念?如果一个任务单 Agent 花 1 块钱,多 Agent 要花 4-6 块钱。而理想情况下最多应该 1.5-2 块。

浪费从哪来?

重复 system prompt:每个子 Agent 启动都要注入完整的系统提示
上下文膨胀:每次传递任务描述时信息会膨胀
结果汇总:子 Agent 的结果回传给父 Agent 也消耗 Token

这个问题上 Claude Code 有一个结构性优势: Anthropic 的 prompt caching 。

Claude Code 子 Agent 调用:  system prompt (100K tokens) ← 缓存命中,只收 1/10 价格  + 任务上下文 (2K tokens)   ← 正常收费OpenClaw 子 Agent 调用(用非 Anthropic Provider):  system prompt (100K tokens) ← 全价  + 任务上下文 (2K tokens)   ← 全价

相同的 system prompt 在 Anthropic API 上只需付一次全价,后续调用只收约 1/10 的 cache read 价格。 OpenClaw 作为 multi-provider 系统,用其他 Provider 时享受不到这个优化。

这就是”结构性优势”——不是 OpenClaw 工程做得不好,而是 Claude Code 背后有 Anthropic 的平台能力加持。 OpenClaw 选择了支持 20+ 个 Provider 的灵活度,代价是在 Token 效率上无法享受任何单一 Provider 的深度优化。

OpenClaw 也没闲着

公平地说, OpenClaw 在 Token 效率上也在努力。

Issue #80175[2] 显示他们建了一套 Token 效率对比框架:

type TokenEfficiencyReport = {  rows: TokenEfficiencyRow[];  aggregate: {    pi:    { totalTokens, p50PerTurn, p90PerTurn };    codex: { totalTokens, p50PerTurn, p90PerTurn };    deltaPercent: number;  // 超过 15% 就告警  };};

这个框架对比的是 OpenClaw 内部不同后端的效率,不是 OpenClaw vs Claude Code 的对比。目前没有公开的跨系统 benchmark——所以如果有人跟你说”OpenClaw 比 Claude Code 省 Token”,大概率是编的。

那 OpenClaw 在哪些方面确实更强?

虽然在编程精度和 Token 效率上 Claude Code 领先,但 OpenClaw 有两个技术方向确实走在前面:

1. 向量记忆系统

Claude Code 的记忆是基于 markdown 文件的——CLAUDE.md 加上 auto-memory ,本质上就是在磁盘上读写文本文件。

OpenClaw 有一个基于 LanceDB 的向量记忆系统,支持语义搜索、重要性评分、记忆晋升机制。你昨天聊的内容可以通过语义相似度在今天被召回,不需要精确匹配关键词。

2. 多 Agent 编排

Claude Code 的 subagent 主要是线性委派——主 Agent 把子任务交给 subagent ,等结果回来继续。

OpenClaw 有一套更复杂的多 Agent 通信机制:sessions-spawn(启动新 Agent )、sessions-send(跨 Session 通信)、sessions-yield(让出控制权)。多个 Agent 可以异步协作,而不只是简单的上下级关系。

这两个方向值得专门写文章来深入探讨,先在这里挖个坑。

总结一下

维度
谁更强
为什么
上下文压缩
Claude Code
四层管道 + 文件恢复
Token 效率
Claude Code
Prompt caching 结构性优势
压缩质量保障
OpenClaw
结构化校验 + 重试
跨 Provider 灵活度
OpenClaw
20+ Provider 支持
记忆系统
OpenClaw
向量语义召回 vs 文本文件
多 Agent 协作
OpenClaw
异步编排 vs 线性委派

核心洞察: Claude Code 在 Token 效率上的优势,不仅来自工程实现,更来自 Anthropic API 的 prompt caching 这个平台能力。这是 OpenClaw 作为 multi-provider 系统无法简单复制的结构性优势

但反过来, OpenClaw 在记忆系统和多 Agent 编排上的深度创新,也是 Claude Code 短期内不太可能去做的——因为 Claude Code 的产品定位就不需要这些。

两个系统各有所长。选哪个,取决于你要解决什么问题。


参考链接

[1] #35203: https://github.com/openclaw/openclaw/issues/35203

[2] #80175: https://github.com/openclaw/openclaw/issues/80175