别让OpenClaw偷偷掏空你的钱包,Token 优化避坑指南

昨天晚上，我让 OpenClaw 帮我处理一个公众号排期，顺手又在同一个会话里聊了几句闲天，问了个技术问题。睡前我还看了一眼额度，心里挺踏实：还剩 50%，够用。

结果第二天一早再打开控制台，只剩 30%。

一晚上，20% 的额度没了。

关键是，我甚至没让它干什么重活。

后来我才反应过来：这不是 OpenClaw 出故障了，而是我根本没搞懂它到底是怎么“烧钱”的。

踩完这一轮坑之后，我花了一周，把那些最容易吞 Token 的动作一条条捋清楚。今天这篇，不聊代码，也不聊复杂配置，就讲一件事：怎么让 OpenClaw 真正替你干活，而不是悄悄把你的钱包掏空。

你好，我是「一毛半」。名字向三毛借了半分自由，专注在AI领域帮你「避深坑、可复用」的野路子捕手。这篇指南将帮你理清：
OpenClaw（你的AI助手）烧钱的三大核心陷阱——从“会话越长越贵”到“工具日志吞掉预算”，一次讲透。
避开3个最常见烧钱点：长会话续聊、高价模型跑所有任务、整篇文档反复喂，让你的Token不再“一夜蒸发20%”。
1分钟自测清单 + 野路子组合拳——快速检查你的使用习惯是否健康，稳扎稳打省下50%成本。
适合谁读：经常用AI干活却总发现额度不够的AI重度用户 / 想用OpenClaw做自动化却担心成本失控的小团队负责人 / 被“一觉醒来掉额度”搞蒙了的深度爱好者。
预计收获时间：约3分钟。

为什么 OpenClaw 会这么“能吃”

先说一个最关键的误区。

很多人会下意识把 OpenClaw 当成“一个更强的大模型聊天框”。但它其实不是。

你在普通大模型产品里聊天，也会吃上下文；可你在 OpenClaw 里每回复一次，除了聊天历史，背后往往会一起打包带上这些东西：

整个会话历史，包括你几小时前随口聊过的内容
系统提示词、规则文件
工具调用的输入和输出
命令执行日志、网页抓取结果、附件摘要，甚至图片相关信息

也就是说，它不是只为“单一对话上下文”收费，而是在为整段上下文买单。

所以会话越长、工具越多、输出越长，Token 消耗就越夸张。

我那次一觉醒来掉了 20%，本质上不是它偷偷乱跑，而是那个会话已经背上了一堆历史包袱。之后每一次继续调用，它都在重复为这些历史内容付费。

说白了，OpenClaw 贵，不一定贵在你这一句问了什么，而是贵在你前面已经攒了多少东西。

真正有用的“省钱三件套”

我后来去翻社区经验，又结合自己实测，发现真正能明显省钱的，总结一下“省钱三件套”。

1）QMD：把“记忆检索”从重活变轻活

OpenClaw 的一大优势是能接住上下文、记忆和文件。但问题也出在这儿：它一旦要查记忆，就很容易把大段相关内容重新塞回上下文。

这件事，贵得很直接。

很多时候，一次记忆检索就能轻轻松松吃掉上万 Token。

QMD 的思路，简单理解就是：先在本地把记忆做成语义索引，需要时只捞最相关的那几段，而不是整片整片往模型里塞。

这样一来，原本很重的“找记忆”动作，就被压成了一个更轻的检索动作。

根据社区实测，启用 QMD 之后，常见收益大概是：

相关任务的 Token 消耗压低约 60%–97%
响应速度提升：5–50 倍
精准度也比纯全文语义搜索更稳定

如果你经常让 OpenClaw 去翻旧对话、旧任务、旧文档，这个思路值得去试一下。

简单来说，不是不让它记，而是别让它每次都把整本账本重新翻一遍。

QMD 项目地址：GitHub 搜索 tobi/qmd。官方 README 给出的快速安装方式是： npm install-g@tobilu/qmd或直接运行： npx@tobilu/qmd...

2）日志动态剪枝：别让几千行日志一起进上下文

第二个重灾区，是工具调用。

举个最典型的例子：你让 OpenClaw 执行一次 npm install。命令本身可能没什么问题，但返回的安装日志动不动就是几百上千行。

如果这些内容原封不动塞回上下文，后面你再追问一句“报错了吗？”——等于又把整坨日志重新算了一轮钱。

这就是很多人明明只想问一句结果，却莫名其妙把额度烧掉的原因。

日志动态剪枝的核心思路是：只保留关键状态和关键报错。

比如：

真正的 error
失败原因
核心警告
关键节点状态

至于那些进度条、重复安装信息、无意义的过程日志，能裁就裁，能不带就别带。

工具类任务如果把日志处理好，Token 消耗能直接降 40%–60%。这不是小修小补，是能明显改变使用成本的级别。

3）模型分层路由：别拿大炮去打蚊子

第三个，也是最容易立刻见效的：不要让同一个贵模型包打天下。

很多人一开始用得顺手，就会默认把“最好”的模型挂在所有环节上：

选题 brainstorming 用高价模型
标题优化用高价模型
润色用高价模型
摘要、改写、解释也全都上高价模型

看起来省心，实际上最烧钱。

因为很多轻任务，根本不需要最高规格的模型。

真正更聪明的做法是：按任务难度分层。

比如：

重推理、复杂规划、长链路执行：再上贵模型
普通改写、摘要、标题、轻润色：交给便宜模型
纯文本小活：干脆放到网页版模型里做

这件事的收益非常直接。有人做过测试，任务合理分层后，整体成本能降 60%–80%，但最终成稿质量未必会差多少。

贵模型要留给“必须它来”的场景，而不是你手边所有活都顺手丢给它。

最容易踩坑的 15 个烧 Token 行为

光靠工具优化还不够，真正的大头，往往还是日常使用习惯。

下面这 15 条，我基本都踩过，你可以直接对照自己看看，中了几条。

1. 在同一个长会话里一直续聊

建议： 新话题直接开新会话；一篇稿子一个阶段一清空。中招指数： ⭐⭐⭐⭐⭐

2. 在后台 main 会话里又聊系统、又写文章、又排错

建议： 后台只做配置、排错、看状态；正文创作别混进去。中招指数： ⭐⭐⭐⭐

3. 会话放了很久，隔一大段时间又继续接着聊

建议： 只要隔了一段时间，就别迷信“接着聊”，直接开新会话更省。中招指数： ⭐⭐⭐

4. 工具返回一大坨日志、网页、命令输出，还让它继续分析

建议： 先截断，只保留前 50–100 行或关键报错。中招指数： ⭐⭐⭐⭐⭐

5. 让它反复进入“工具 → 分析 → 再工具 → 再分析”循环

建议： 一次性把目标说清楚，尽量少跑来回。*中招指数： * ⭐⭐⭐⭐

6. 开了 web search 就一路全网乱抓

建议： 先缩范围，再抓取；别一上来就全网撒网。*中招指数： * ⭐⭐⭐⭐

7. 把整篇公众号文章反复贴进聊天里来回改

建议： 分段改，一次只动一个部分。*中招指数： * ⭐⭐⭐⭐⭐

8. 让 agent 先读超长文档，再顺手总结

建议： 先人工裁出关键段落，再让它处理。*中招指数： * ⭐⭐⭐⭐

9. 频繁发图片、语音、PDF、截图让它看

建议： 能转成简短文字就先转；只给它必须看的那几页。中招指数： ⭐⭐⭐

10. 每次都让它重读一堆规则文件或长 MEMORY

建议： 长期规则写短，减少无效上下文和重复加载。*中招指数： * ⭐⭐⭐⭐

11. 用高价模型跑所有事情

建议： 重任务才上贵模型，轻任务换便宜模型。*中招指数： * ⭐⭐⭐⭐⭐

12. 同一个问题让多个 agent 轮流回答

建议： 一个任务尽量只指定一个 agent，别让多人重复消耗。中招指数： ⭐⭐⭐

13. 不看 `/status` 和 `/usage`，一路盲聊

建议： 定期检查用量，尽早发现谁最烧。中招指数： ⭐⭐⭐⭐

14. 用 OpenClaw 做“标题、摘要、润色、解释”这类纯文本小活

建议： 这类事优先丢给网页版千问、DeepSeek、Kimi。中招指数： ⭐⭐⭐⭐⭐

15. 把飞书私聊长期当成总工作台使用

建议： 私聊只发任务和短追问；长素材、长正文尽量放文档。中招指数： ⭐⭐⭐

如果你把上面这 15 条避开一半，Token 压力就会明显小很多。

建议：每次问虾之前先问自己两句

以后你每次准备打开 OpenClaw 前，先别急着用，先问自己两句话。

第一句：这件事是不是纯文本？

如果只是：

写标题
出摘要
润色
解释一个概念
拉个大纲
做一版改写

那大概率没必要用 OpenClaw。

这类活，网页版千问、DeepSeek、Kimi 往往更划算，甚至很多时候就是免费的。

第二句：这件事是不是需要多步执行，或者必须调用工具？

如果你要做的是：

查文件
跑命令
调接口
跨渠道处理消息
自动抓资料
串起一整段流程

那这时候再请 OpenClaw 出场，就值。

因为它真正强的地方，从来不是“比普通大模型更会写”，而是它能把事做下去。

这个判断法看起来简单，但真的能帮你省掉很多无意义消耗。

普通用户最省 Token 的通用工作流

如果你暂时不想折腾更复杂的 Agent 配置，直接照着这个版本来，就已经够用了。

1）正文工作，优先放到网页版模型里

选题、大纲、初稿、标题、摘要、润色，这些都可以优先在网页版千问、DeepSeek 或 Kimi 里完成。

这些动作本质上都是“纯文本处理”，没必要让 OpenClaw 带着整段上下文陪你一起烧钱。

2）OpenClaw 只负责“需要动手”的环节

比如：

读取某个文件夹
执行命令
处理飞书消息
串联网页资料
跑一个明确流程

这种事情交给 OpenClaw，才是用对地方了。

3）任何长任务都拆段处理

不要整篇文章、整本资料、整坨日志一次性往里喂。

就算模型支持长上下文，也不代表你应该这么用。模型能吃下，不等于你吃得起。

4）定期看 `/status` 或打开 `/usage tokens`

别等到额度突然见底，才开始怀疑人生。

你只要养成定期看用量的习惯，很快就会知道：到底是长会话最烧，还是日志最烧，还是你那个“顺手多问一句”的习惯最烧。

最后

OpenClaw 当然是个好工具，但它不是大模型的平替

也不是一个拿来随便聊天、顺便写点小活的“豪华聊天框”。它更像一个能替你跑流程、接工具、干执行活的助理。

所以最省钱的用法，不是少用它，而是用在对的地方。

网页版千问、DeepSeek、Kimi，适合随便聊、随手写、快速改。

OpenClaw，适合那些真的需要它“动手”的场景。

把这个边界想清楚，你就会发现：它依然很好用，而且没那么烧。

这样你既能让它替你干活，也不用担心一觉醒来，额度突然只剩下 30%。

这份清单，确实是我用真金白银换来的。

如果你最近也在折腾 OpenClaw，建议先把这篇收藏起来。以后每次觉得额度掉得不对劲，就回来对照一遍，基本都能找到原因。

要是你身边正好有个朋友，最近老在吐槽“怎么又没额度了”，也可以顺手转给他。他大概率会谢你一句。

加入社群，一起“避坑”

我们有两个群，根据情况进：

🐣 小白避坑群——【龙虾池】
新手入门、基础教程、常见问题解答，帮你少走弯路。

🚀 进阶交流群
多Agent调优、模型路由、日志剪枝，深度玩家都在这里。

⚠️ 扫码加入，满员可加微信：lm519296828（备注“OpenClaw”）

往期文章：

凌晨4点后，OpenClaw为什么像“失忆了”？

养虾不死第一天：先搭好“虾缸”，OpenClaw 才会稳定

有了OpenClaw，还需要Coze么？别争了：你缺的是“员工”还是“系统”