先说结论:OpenClaw 本身不费钱,费钱的是默认配置和错误用法。用对方法,成本可以砍掉 90%~97%。
"2小时消耗100美元""月账单3600美元"这不是夸张——这是大量 OpenClaw 用户真实踩过的坑。
先搞清楚一个问题:OpenClaw 每次调用模型,真正烧钱的不是它"回答了什么",而是你"喂给它什么"。
一次典型请求的 Token 构成长这样:
| 组成部分 | Token量 | 占比 | 能否优化 |
|---|---|---|---|
| 上下文历史(旧对话重发) | 40%~50% ❌ | 可压缩 95% ✅ | |
| 工具输出(Shell/网页/文件) | 20%~30% ❌ | 可精简 ✅ | |
| System Prompt + Skill定义 | 可缓存(便宜10倍)✅ | ||
| Workspace 文件 | 可控制 ≤2000 ✅ | ||
| 心跳/保活 ping | 5%~10% ❌ | 可隔离到廉价模型 ✅ | |
| 模型实际回复 |
看到了吗?你花钱买的"智能回答",其实只占不到 15% 的费用。剩下 85% 以上都在为"上下文""系统提示""工具输出"这些隐形成本买单。
更恐怖的是:随着对话轮数增加,历史消息会每轮重复发送。聊了 50 轮之后,单次请求轻松突破 10 万 Token。有用户实测会话累积到 185K tokens——相当于每次提问都把整本《哈利波特》重新发给模型读一遍。
根据你的使用强度和时间投入,我整理了三级优化路线:
/model haiku-4.5或者在 openclaw.json 里改默认模型即可。max_output_tokens: 2048,输出成本直接减半。/new 清空对话上下文(任务切换后必做)/compact 压缩记忆文件(体积缩减 60%)/status 查看当前上下文占用比例(超过 50% 就该 /new 了)这三个命令不花一分钱 Token,纯靠操作习惯省钱。isolatedSession: true这一项改动就能省 95%~98% 的心跳开销。# 第一步:安装 bun 和 QMDnpm i -g bun bun install -g github:tobi/qmd# 第二步:修改 openclaw.json{ "memory": { "backend": "qmd", "qmd": { "limits": { "timeoutMs": 8000 } } } }# 第三步:重启服务openclaw gateway restart# 日志中看到 "Using QMD memory backend" 就成功了"cacheRetention": "long" 即可生效。配合 Heartbeat 每 55 分钟 keep-alive 一次保持缓存活跃。效果:系统提示词相关费用降低 84%($36/月 → $5.67/月)。openclaw skill list --active 检查已启用的技能,停用那些"装了但很少用"的技能。每个多装的 Skill 都会增加 Tool Schema 的 token 开销。$几千 降至 $几百以下省 Token 不是"只用最便宜的模型",而是给每个任务匹配最合适的模型。以下是主流模型的性价比实测对比:
| 模型 | 输入价格 | 输出价格 | 工具调用 | 推理能力 | 推荐场景 |
|---|---|---|---|---|---|
| Gemini 2.5 Flash-Lite | 一般 ⚠️ | ||||
| GPT-4o-mini | |||||
| MiniMax M2.5/M2.7 | 中文场景推荐 ✅ | ||||
| Claude Haiku 4.5 | 很好 ✅ | ||||
| Claude Sonnet 4.6 | 很好 ✅ | 很强 ✅ | |||
| Claude Opus 4.6 | 很好 ✅ | 最强 ✅ | |||
| Ollama 本地 (Llama 3.2) | 免费(仅电费)✅ |
理论说得再多不如数据说话。以下是社区用户公开的优化前后对比:
有一个数据特别值得玩味:轻度用户省的比例反而比重度用户更高(88% vs 87%)。这说明什么?说明 OpenClaw 的 Token 消耗中有很大一部分是固定开销(System Prompt、Skill Schema、心跳),不管你用得多还是少都得交。优化掉这部分固定开销之后,所有人都能获得近乎线性的成本下降。
按优先级排序,做完前 3 项就能看到明显效果:
切默认模型 + 设输出上限(2分钟)
/model haiku-4.5+ 配置max_output_tokens: 2048养成 /new 和 /compact 习惯(0分钟)
每次任务切换后发
/new,每周发一次/compact安装 QMD 记忆后端(5分钟)
bun install -g github:tobi/qmd→ 改 openclaw.json → 重启配置 Fallback 模型链(10分钟)
Sonnet 主力 → Haiku 兜底 → Flash-Lite 心跳隔离
开启 Prompt Caching(2分钟)
加一行
"cacheRetention": "long"(Anthropic 用户必做)审计 Workspace 文件 + 技能清单(10分钟)
精简 AGENTS.md/SOUL.md/MEMORY.md,停用多余 Skill
OpenClaw 给了你一把瑞士军刀,但大多数人只用了其中一把刀,而且用的那把是最贵的那把。学会根据任务换刀,才是从"烧钱"到"省钱"的关键。
工具的上限,决定了你能做事情的边界。但用对工具的方式,决定了你要为此付出多少代价。
/status 看看当前上下文占了多少比例。如果超过 50%,立刻 /new 开新会话——这是免费的第一步。
夜雨聆风