结果第二天一早再打开控制台,只剩 30%。
一晚上,20% 的额度没了。
关键是,我甚至没让它干什么重活。
后来我才反应过来:这不是 OpenClaw 出故障了,而是我根本没搞懂它到底是怎么“烧钱”的。
踩完这一轮坑之后,我花了一周,把那些最容易吞 Token 的动作一条条捋清楚。今天这篇,不聊代码,也不聊复杂配置,就讲一件事:怎么让 OpenClaw 真正替你干活,而不是悄悄把你的钱包掏空。
你好,我是「一毛半」。名字向三毛借了半分自由,专注在AI领域帮你 「避深坑、可复用」 的野路子捕手。这篇指南将帮你理清:
- OpenClaw(你的AI助手)烧钱的三大核心陷阱——从“会话越长越贵”到“工具日志吞掉预算”,一次讲透。
- 避开3个最常见烧钱点:长会话续聊、高价模型跑所有任务、整篇文档反复喂,让你的Token不再“一夜蒸发20%”。
- 1分钟自测清单 + 野路子组合拳——快速检查你的使用习惯是否健康,稳扎稳打省下50%成本。
适合谁读:经常用AI干活却总发现额度不够的AI重度用户 / 想用OpenClaw做自动化却担心成本失控的小团队负责人 / 被“一觉醒来掉额度”搞蒙了的深度爱好者。
预计收获时间:约3分钟。
为什么 OpenClaw 会这么“能吃”
先说一个最关键的误区。
很多人会下意识把 OpenClaw 当成“一个更强的大模型聊天框”。但它其实不是。
你在普通大模型产品里聊天,也会吃上下文;可你在 OpenClaw 里每回复一次,除了聊天历史,背后往往会一起打包带上这些东西:
- 整个会话历史,包括你几小时前随口聊过的内容
- 系统提示词、规则文件
- 工具调用的输入和输出
- 命令执行日志、网页抓取结果、附件摘要,甚至图片相关信息
也就是说,它不是只为“单一对话上下文”收费,而是在为整段上下文买单。
所以会话越长、工具越多、输出越长,Token 消耗就越夸张。
我那次一觉醒来掉了 20%,本质上不是它偷偷乱跑,而是那个会话已经背上了一堆历史包袱。之后每一次继续调用,它都在重复为这些历史内容付费。
说白了,OpenClaw 贵,不一定贵在你这一句问了什么,而是贵在你前面已经攒了多少东西。
真正有用的“省钱三件套”
我后来去翻社区经验,又结合自己实测,发现真正能明显省钱的,总结一下“省钱三件套”。
1)QMD:把“记忆检索”从重活变轻活
OpenClaw 的一大优势是能接住上下文、记忆和文件。但问题也出在这儿:它一旦要查记忆,就很容易把大段相关内容重新塞回上下文。
这件事,贵得很直接。
很多时候,一次记忆检索就能轻轻松松吃掉上万 Token。
QMD 的思路,简单理解就是:先在本地把记忆做成语义索引,需要时只捞最相关的那几段,而不是整片整片往模型里塞。
这样一来,原本很重的“找记忆”动作,就被压成了一个更轻的检索动作。
根据社区实测,启用 QMD 之后,常见收益大概是:
- 相关任务的 Token 消耗压低约 60%–97%
- 响应速度提升:5–50 倍
- 精准度也比纯全文语义搜索更稳定
如果你经常让 OpenClaw 去翻旧对话、旧任务、旧文档,这个思路值得去试一下。
简单来说,不是不让它记,而是别让它每次都把整本账本重新翻一遍。
QMD 项目地址:GitHub 搜索 tobi/qmd。 官方 README 给出的快速安装方式是: npm install-g@tobilu/qmd或直接运行: npx@tobilu/qmd...
2)日志动态剪枝:别让几千行日志一起进上下文
第二个重灾区,是工具调用。
举个最典型的例子:你让 OpenClaw 执行一次 npm install。命令本身可能没什么问题,但返回的安装日志动不动就是几百上千行。
如果这些内容原封不动塞回上下文,后面你再追问一句“报错了吗?”——等于又把整坨日志重新算了一轮钱。
这就是很多人明明只想问一句结果,却莫名其妙把额度烧掉的原因。
日志动态剪枝的核心思路是:只保留关键状态和关键报错。
比如:
- 真正的 error
- 失败原因
- 核心警告
- 关键节点状态
至于那些进度条、重复安装信息、无意义的过程日志,能裁就裁,能不带就别带。
工具类任务如果把日志处理好,Token 消耗能直接降 40%–60%。这不是小修小补,是能明显改变使用成本的级别。
3)模型分层路由:别拿大炮去打蚊子
第三个,也是最容易立刻见效的:不要让同一个贵模型包打天下。
很多人一开始用得顺手,就会默认把“最好”的模型挂在所有环节上:
- 选题 brainstorming 用高价模型
- 标题优化用高价模型
- 润色用高价模型
- 摘要、改写、解释也全都上高价模型
看起来省心,实际上最烧钱。
因为很多轻任务,根本不需要最高规格的模型。
真正更聪明的做法是:按任务难度分层。
比如:
- 重推理、复杂规划、长链路执行:再上贵模型
- 普通改写、摘要、标题、轻润色:交给便宜模型
- 纯文本小活:干脆放到网页版模型里做
这件事的收益非常直接。有人做过测试,任务合理分层后,整体成本能降 60%–80%,但最终成稿质量未必会差多少。
贵模型要留给“必须它来”的场景,而不是你手边所有活都顺手丢给它。
最容易踩坑的 15 个烧 Token 行为
光靠工具优化还不够,真正的大头,往往还是日常使用习惯。
下面这 15 条,我基本都踩过,你可以直接对照自己看看,中了几条。
1. 在同一个长会话里一直续聊
建议: 新话题直接开新会话;一篇稿子一个阶段一清空。中招指数: ⭐⭐⭐⭐⭐
2. 在后台 main 会话里又聊系统、又写文章、又排错
建议: 后台只做配置、排错、看状态;正文创作别混进去。中招指数: ⭐⭐⭐⭐
3. 会话放了很久,隔一大段时间又继续接着聊
建议: 只要隔了一段时间,就别迷信“接着聊”,直接开新会话更省。中招指数: ⭐⭐⭐
4. 工具返回一大坨日志、网页、命令输出,还让它继续分析
建议: 先截断,只保留前 50–100 行或关键报错。中招指数: ⭐⭐⭐⭐⭐
5. 让它反复进入“工具 → 分析 → 再工具 → 再分析”循环
建议: 一次性把目标说清楚,尽量少跑来回。*中招指数: * ⭐⭐⭐⭐
6. 开了 web search 就一路全网乱抓
建议: 先缩范围,再抓取;别一上来就全网撒网。*中招指数: * ⭐⭐⭐⭐
7. 把整篇公众号文章反复贴进聊天里来回改
建议: 分段改,一次只动一个部分。*中招指数: * ⭐⭐⭐⭐⭐
8. 让 agent 先读超长文档,再顺手总结
建议: 先人工裁出关键段落,再让它处理。*中招指数: * ⭐⭐⭐⭐
9. 频繁发图片、语音、PDF、截图让它看
建议: 能转成简短文字就先转;只给它必须看的那几页。中招指数: ⭐⭐⭐
10. 每次都让它重读一堆规则文件或长 MEMORY
建议: 长期规则写短,减少无效上下文和重复加载。*中招指数: * ⭐⭐⭐⭐
11. 用高价模型跑所有事情
建议: 重任务才上贵模型,轻任务换便宜模型。*中招指数: * ⭐⭐⭐⭐⭐
12. 同一个问题让多个 agent 轮流回答
建议: 一个任务尽量只指定一个 agent,别让多人重复消耗。中招指数: ⭐⭐⭐
13. 不看 /status 和 /usage,一路盲聊
建议: 定期检查用量,尽早发现谁最烧。中招指数: ⭐⭐⭐⭐
14. 用 OpenClaw 做“标题、摘要、润色、解释”这类纯文本小活
建议: 这类事优先丢给网页版千问、DeepSeek、Kimi。中招指数: ⭐⭐⭐⭐⭐
15. 把飞书私聊长期当成总工作台使用
建议: 私聊只发任务和短追问;长素材、长正文尽量放文档。中招指数: ⭐⭐⭐
如果你把上面这 15 条避开一半,Token 压力就会明显小很多。
建议:每次问虾之前先问自己两句
以后你每次准备打开 OpenClaw 前,先别急着用,先问自己两句话。
第一句:这件事是不是纯文本?
如果只是:
- 写标题
- 出摘要
- 润色
- 解释一个概念
- 拉个大纲
- 做一版改写
那大概率没必要用 OpenClaw。
这类活,网页版千问、DeepSeek、Kimi 往往更划算,甚至很多时候就是免费的。
第二句:这件事是不是需要多步执行,或者必须调用工具?
如果你要做的是:
- 查文件
- 跑命令
- 调接口
- 跨渠道处理消息
- 自动抓资料
- 串起一整段流程
那这时候再请 OpenClaw 出场,就值。
因为它真正强的地方,从来不是“比普通大模型更会写”,而是它能把事做下去。
这个判断法看起来简单,但真的能帮你省掉很多无意义消耗。
普通用户最省 Token 的通用工作流
如果你暂时不想折腾更复杂的 Agent 配置,直接照着这个版本来,就已经够用了。
1)正文工作,优先放到网页版模型里
选题、大纲、初稿、标题、摘要、润色,这些都可以优先在网页版千问、DeepSeek 或 Kimi 里完成。
这些动作本质上都是“纯文本处理”,没必要让 OpenClaw 带着整段上下文陪你一起烧钱。
2)OpenClaw 只负责“需要动手”的环节
比如:
- 读取某个文件夹
- 执行命令
- 处理飞书消息
- 串联网页资料
- 跑一个明确流程
这种事情交给 OpenClaw,才是用对地方了。
3)任何长任务都拆段处理
不要整篇文章、整本资料、整坨日志一次性往里喂。
就算模型支持长上下文,也不代表你应该这么用。模型能吃下,不等于你吃得起。
4)定期看 /status 或打开 /usage tokens
别等到额度突然见底,才开始怀疑人生。
你只要养成定期看用量的习惯,很快就会知道:到底是长会话最烧,还是日志最烧,还是你那个“顺手多问一句”的习惯最烧。
最后
OpenClaw 当然是个好工具,但它不是大模型的平替
也不是一个拿来随便聊天、顺便写点小活的“豪华聊天框”。它更像一个能替你跑流程、接工具、干执行活的助理。
所以最省钱的用法,不是少用它,而是用在对的地方。
网页版千问、DeepSeek、Kimi,适合随便聊、随手写、快速改。
OpenClaw,适合那些真的需要它“动手”的场景。
把这个边界想清楚,你就会发现:它依然很好用,而且没那么烧。
这样你既能让它替你干活,也不用担心一觉醒来,额度突然只剩下 30%。
这份清单,确实是我用真金白银换来的。
如果你最近也在折腾 OpenClaw,建议先把这篇收藏起来。以后每次觉得额度掉得不对劲,就回来对照一遍,基本都能找到原因。
要是你身边正好有个朋友,最近老在吐槽“怎么又没额度了”,也可以顺手转给他。 他大概率会谢你一句。
加入社群,一起“避坑”
我们有两个群,根据情况进:
🐣 小白避坑群——【龙虾池】
新手入门、基础教程、常见问题解答,帮你少走弯路。

🚀 进阶交流群
多Agent调优、模型路由、日志剪枝,深度玩家都在这里。

⚠️ 扫码加入,满员可加微信:lm519296828(备注“OpenClaw”)
往期文章:
夜雨聆风