乐于分享
好东西不私藏

别让OpenClaw偷偷掏空你的钱包,Token 优化避坑指南

别让OpenClaw偷偷掏空你的钱包,Token 优化避坑指南
昨天晚上,我让 OpenClaw 帮我处理一个公众号排期,顺手又在同一个会话里聊了几句闲天,问了个技术问题。睡前我还看了一眼额度,心里挺踏实:还剩 50%,够用。

结果第二天一早再打开控制台,只剩 30%。

一晚上,20% 的额度没了。

关键是,我甚至没让它干什么重活。

后来我才反应过来:这不是 OpenClaw 出故障了,而是我根本没搞懂它到底是怎么“烧钱”的。

踩完这一轮坑之后,我花了一周,把那些最容易吞 Token 的动作一条条捋清楚。今天这篇,不聊代码,也不聊复杂配置,就讲一件事:怎么让 OpenClaw 真正替你干活,而不是悄悄把你的钱包掏空。

你好,我是「一毛半」。名字向三毛借了半分自由,专注在AI领域帮你 「避深坑、可复用」 的野路子捕手。这篇指南将帮你理清:

  1. OpenClaw(你的AI助手)烧钱的三大核心陷阱——从“会话越长越贵”到“工具日志吞掉预算”,一次讲透。
  2. 避开3个最常见烧钱点:长会话续聊、高价模型跑所有任务、整篇文档反复喂,让你的Token不再“一夜蒸发20%”。
  3. 1分钟自测清单 + 野路子组合拳——快速检查你的使用习惯是否健康,稳扎稳打省下50%成本。

适合谁读:经常用AI干活却总发现额度不够的AI重度用户 / 想用OpenClaw做自动化却担心成本失控的小团队负责人 / 被“一觉醒来掉额度”搞蒙了的深度爱好者。

预计收获时间:约3分钟。

为什么 OpenClaw 会这么“能吃”

先说一个最关键的误区。

很多人会下意识把 OpenClaw 当成“一个更强的大模型聊天框”。但它其实不是。

你在普通大模型产品里聊天,也会吃上下文;可你在 OpenClaw 里每回复一次,除了聊天历史,背后往往会一起打包带上这些东西:

  • 整个会话历史,包括你几小时前随口聊过的内容
  • 系统提示词、规则文件
  • 工具调用的输入和输出
  • 命令执行日志、网页抓取结果、附件摘要,甚至图片相关信息

也就是说,它不是只为“单一对话上下文”收费,而是在为整段上下文买单。

所以会话越长、工具越多、输出越长,Token 消耗就越夸张。

我那次一觉醒来掉了 20%,本质上不是它偷偷乱跑,而是那个会话已经背上了一堆历史包袱。之后每一次继续调用,它都在重复为这些历史内容付费。

说白了,OpenClaw 贵,不一定贵在你这一句问了什么,而是贵在你前面已经攒了多少东西。

真正有用的“省钱三件套”

我后来去翻社区经验,又结合自己实测,发现真正能明显省钱的,总结一下“省钱三件套”。

1)QMD:把“记忆检索”从重活变轻活

OpenClaw 的一大优势是能接住上下文、记忆和文件。但问题也出在这儿:它一旦要查记忆,就很容易把大段相关内容重新塞回上下文。

这件事,贵得很直接。

很多时候,一次记忆检索就能轻轻松松吃掉上万 Token。

QMD 的思路,简单理解就是:先在本地把记忆做成语义索引,需要时只捞最相关的那几段,而不是整片整片往模型里塞。

这样一来,原本很重的“找记忆”动作,就被压成了一个更轻的检索动作。

根据社区实测,启用 QMD 之后,常见收益大概是:

  • 相关任务的 Token 消耗压低约 60%–97%
  • 响应速度提升:5–50 倍
  • 精准度也比纯全文语义搜索更稳定

如果你经常让 OpenClaw 去翻旧对话、旧任务、旧文档,这个思路值得去试一下。

简单来说,不是不让它记,而是别让它每次都把整本账本重新翻一遍。

QMD 项目地址:GitHub 搜索 tobi/qmd。 官方 README 给出的快速安装方式是: npm install-g@tobilu/qmd或直接运行: npx@tobilu/qmd...

2)日志动态剪枝:别让几千行日志一起进上下文

第二个重灾区,是工具调用。

举个最典型的例子:你让 OpenClaw 执行一次 npm install。命令本身可能没什么问题,但返回的安装日志动不动就是几百上千行。

如果这些内容原封不动塞回上下文,后面你再追问一句“报错了吗?”——等于又把整坨日志重新算了一轮钱。

这就是很多人明明只想问一句结果,却莫名其妙把额度烧掉的原因。

日志动态剪枝的核心思路是:只保留关键状态和关键报错。

比如:

  • 真正的 error
  • 失败原因
  • 核心警告
  • 关键节点状态

至于那些进度条、重复安装信息、无意义的过程日志,能裁就裁,能不带就别带。

工具类任务如果把日志处理好,Token 消耗能直接降 40%–60%。这不是小修小补,是能明显改变使用成本的级别。

3)模型分层路由:别拿大炮去打蚊子

第三个,也是最容易立刻见效的:不要让同一个贵模型包打天下。

很多人一开始用得顺手,就会默认把“最好”的模型挂在所有环节上:

  • 选题 brainstorming 用高价模型
  • 标题优化用高价模型
  • 润色用高价模型
  • 摘要、改写、解释也全都上高价模型

看起来省心,实际上最烧钱。

因为很多轻任务,根本不需要最高规格的模型。

真正更聪明的做法是:按任务难度分层。

比如:

  • 重推理、复杂规划、长链路执行:再上贵模型
  • 普通改写、摘要、标题、轻润色:交给便宜模型
  • 纯文本小活:干脆放到网页版模型里做

这件事的收益非常直接。有人做过测试,任务合理分层后,整体成本能降 60%–80%,但最终成稿质量未必会差多少。

贵模型要留给“必须它来”的场景,而不是你手边所有活都顺手丢给它。

最容易踩坑的 15 个烧 Token 行为

光靠工具优化还不够,真正的大头,往往还是日常使用习惯。

下面这 15 条,我基本都踩过,你可以直接对照自己看看,中了几条。

1. 在同一个长会话里一直续聊

建议: 新话题直接开新会话;一篇稿子一个阶段一清空。中招指数: ⭐⭐⭐⭐⭐

2. 在后台 main 会话里又聊系统、又写文章、又排错

建议: 后台只做配置、排错、看状态;正文创作别混进去。中招指数: ⭐⭐⭐⭐

3. 会话放了很久,隔一大段时间又继续接着聊

建议: 只要隔了一段时间,就别迷信“接着聊”,直接开新会话更省。中招指数: ⭐⭐⭐

4. 工具返回一大坨日志、网页、命令输出,还让它继续分析

建议: 先截断,只保留前 50–100 行或关键报错。中招指数: ⭐⭐⭐⭐⭐

5. 让它反复进入“工具 → 分析 → 再工具 → 再分析”循环

建议: 一次性把目标说清楚,尽量少跑来回。*中招指数: * ⭐⭐⭐⭐

6. 开了 web search 就一路全网乱抓

建议: 先缩范围,再抓取;别一上来就全网撒网。*中招指数: * ⭐⭐⭐⭐

7. 把整篇公众号文章反复贴进聊天里来回改

建议: 分段改,一次只动一个部分。*中招指数: * ⭐⭐⭐⭐⭐

8. 让 agent 先读超长文档,再顺手总结

建议: 先人工裁出关键段落,再让它处理。*中招指数: * ⭐⭐⭐⭐

9. 频繁发图片、语音、PDF、截图让它看

建议: 能转成简短文字就先转;只给它必须看的那几页。中招指数: ⭐⭐⭐

10. 每次都让它重读一堆规则文件或长 MEMORY

建议: 长期规则写短,减少无效上下文和重复加载。*中招指数: * ⭐⭐⭐⭐

11. 用高价模型跑所有事情

建议: 重任务才上贵模型,轻任务换便宜模型。*中招指数: * ⭐⭐⭐⭐⭐

12. 同一个问题让多个 agent 轮流回答

建议: 一个任务尽量只指定一个 agent,别让多人重复消耗。中招指数: ⭐⭐⭐

13. 不看 /status 和 /usage,一路盲聊

建议: 定期检查用量,尽早发现谁最烧。中招指数: ⭐⭐⭐⭐

14. 用 OpenClaw 做“标题、摘要、润色、解释”这类纯文本小活

建议: 这类事优先丢给网页版千问、DeepSeek、Kimi。中招指数: ⭐⭐⭐⭐⭐

15. 把飞书私聊长期当成总工作台使用

建议: 私聊只发任务和短追问;长素材、长正文尽量放文档。中招指数: ⭐⭐⭐

如果你把上面这 15 条避开一半,Token 压力就会明显小很多。

建议:每次问虾之前先问自己两句

以后你每次准备打开 OpenClaw 前,先别急着用,先问自己两句话。

第一句:这件事是不是纯文本?

如果只是:

  • 写标题
  • 出摘要
  • 润色
  • 解释一个概念
  • 拉个大纲
  • 做一版改写

那大概率没必要用 OpenClaw。

这类活,网页版千问、DeepSeek、Kimi 往往更划算,甚至很多时候就是免费的。

第二句:这件事是不是需要多步执行,或者必须调用工具?

如果你要做的是:

  • 查文件
  • 跑命令
  • 调接口
  • 跨渠道处理消息
  • 自动抓资料
  • 串起一整段流程

那这时候再请 OpenClaw 出场,就值。

因为它真正强的地方,从来不是“比普通大模型更会写”,而是它能把事做下去

这个判断法看起来简单,但真的能帮你省掉很多无意义消耗。

普通用户最省 Token 的通用工作流

如果你暂时不想折腾更复杂的 Agent 配置,直接照着这个版本来,就已经够用了。

1)正文工作,优先放到网页版模型里

选题、大纲、初稿、标题、摘要、润色,这些都可以优先在网页版千问、DeepSeek 或 Kimi 里完成。

这些动作本质上都是“纯文本处理”,没必要让 OpenClaw 带着整段上下文陪你一起烧钱。

2)OpenClaw 只负责“需要动手”的环节

比如:

  • 读取某个文件夹
  • 执行命令
  • 处理飞书消息
  • 串联网页资料
  • 跑一个明确流程

这种事情交给 OpenClaw,才是用对地方了。

3)任何长任务都拆段处理

不要整篇文章、整本资料、整坨日志一次性往里喂。

就算模型支持长上下文,也不代表你应该这么用。模型能吃下,不等于你吃得起。

4)定期看 /status 或打开 /usage tokens

别等到额度突然见底,才开始怀疑人生。

你只要养成定期看用量的习惯,很快就会知道:到底是长会话最烧,还是日志最烧,还是你那个“顺手多问一句”的习惯最烧。

最后

OpenClaw 当然是个好工具,但它不是大模型的平替

也不是一个拿来随便聊天、顺便写点小活的“豪华聊天框”。它更像一个能替你跑流程、接工具、干执行活的助理。

所以最省钱的用法,不是少用它,而是用在对的地方

网页版千问、DeepSeek、Kimi,适合随便聊、随手写、快速改。

OpenClaw,适合那些真的需要它“动手”的场景。

把这个边界想清楚,你就会发现:它依然很好用,而且没那么烧。

这样你既能让它替你干活,也不用担心一觉醒来,额度突然只剩下 30%。

这份清单,确实是我用真金白银换来的。

如果你最近也在折腾 OpenClaw,建议先把这篇收藏起来。以后每次觉得额度掉得不对劲,就回来对照一遍,基本都能找到原因。

要是你身边正好有个朋友,最近老在吐槽“怎么又没额度了”,也可以顺手转给他。 他大概率会谢你一句。

加入社群,一起“避坑”

我们有两个群,根据情况进:

🐣 小白避坑群——【龙虾池】
新手入门、基础教程、常见问题解答,帮你少走弯路。

🚀 进阶交流群
多Agent调优、模型路由、日志剪枝,深度玩家都在这里。

⚠️ 扫码加入,满员可加微信:lm519296828(备注“OpenClaw”)

往期文章:

凌晨4点后,OpenClaw为什么像“失忆了”?

养虾不死第一天:先搭好“虾缸”,OpenClaw 才会稳定

有了OpenClaw,还需要Coze么?别争了:你缺的是“员工”还是“系统”