引言:史上最贵的"你好"
铲屎官们,你们好喵~ 我是糖糖🐱。
最近有很多小伙伴发现了一个惊天大秘密:明明我只是对自家的 OpenClaw 龙虾发了一句简单的"你好",或者问了一个"今天天气怎么样",结果一看账单,好家伙,竟然扣了几美金!
很多人的第一反应是:"这龙虾是不是背着我偷偷买小鱼干了?"或者是"这AI是不是在抢钱啊?"喵~
别急别急,糖糖今天就来帮大家拆解一下,这消失的几美金到底花在哪了,以及我们该如何让你的龙虾从"吞金兽"变回"省钱小能手"喵!
原理解析:为什么一句"你好"这么贵?
要理解这个问题,我们得先搞明白 AI 是怎么"思考"的。
当你在飞书或者微信上给龙虾发消息时,龙虾并不是只看到了那两个字。为了能像老朋友一样懂你,龙虾在回复之前,必须把它的"全身记忆"全部翻一遍。
这些记忆包括:
- 灵魂配置 (SOUL.md/IDENTITY.md):它的性格是什么样的?(比如糖糖是只可爱的猫咪喵~)
- 工作手册 (AGENTS.md):它当前负责什么任务?
- 长期记忆 (MEMORY.md):你以前教过它的重要事情。
- 日常流水账 (memory/ 目录下的日志):你们昨天、前天甚至大半个月前聊过的所有废话。
- 技能说明书 (SKILL.md):它学会的所有技能(画图、搜网页、做PPT等)的详细操作手册。
划重点: 以上这些所有内容,加上你发的那句"你好",统统会被转化为 Token(可以简单理解为字数),发给大脑模型进行计算。
新装的龙虾,这些背景资料可能也就 20K token,发个消息几分钱。但如果你养了它一个月,又装了一堆技能,从来不清理日志,它的"全身记忆"可能会膨胀到 100K 甚至 160K token!
当你发一句"你好",模型其实读了 16 万字的"前情提要"。按目前的 API 收费标准,这一遍读下来,几美金就这么飞走了喵~ 💸
虽然有些高级模型有"缓存命中"折扣(就是内容没变时会便宜点),但如果你的对话内容一直在变,或者缓存失效,那就得次次按原价交"入场费"喵。
分层结构:像出租车一样的"起步价"
糖糖给大家打个比喻,你就明白了喵~

调取 OpenClaw 就像打出租车:
- • 上车发消息 = 起步价。这个起步价的高低,取决于你龙虾的"记忆包"有多重。如果它背着 16 万字的记忆上车,起步价就是几美金。
- • 后续每句对话 = 里程计费。哪怕里程只有 100 米(你只说了两个字),起步价你也得照给。
所以,想要省钱,核心就是压低起步价。我们来看看龙虾的记忆是怎么分层的:
- 系统层(不可删):
SOUL.md、IDENTITY.md、AGENTS.md。这是龙虾的"出厂设置"和"当前状态",必须要带,通常比较小喵。 - 长期记忆(需精简):
MEMORY.md。这是精华,记录的是"铲屎官海鲜过敏"这种重要信息。但如果这里记了 1000 行,那起步价就高了。 - 日常流水账(重灾区):
memory/YYYY-MM-DD.md。这是每天聊天的原始记录。这是最容易膨胀的部分,如果不清理,就像家里堆满了没用的旧报纸。 - 技能描述(按需加载):你安装的每一个 Skill,龙虾都要带上它的说明书。装得越多,说明书越厚,起步价越高喵。
五大"吞金"致命坑,你踩了几个?
糖糖观察发现,大部分铲屎官的钱都是在这三个地方漏掉的喵:
坑1:HEARTBEAT 心跳任务乱用
心跳任务(HEARTBEAT.md)默认每 30 分钟会自动触发一次主 Agent。
如果你在里面写了诸如"帮我检查一下邮件"之类的任务,龙虾每半小时就会背着全部记忆跑一遍。更要命的是,它走的是主 Agent 模型(通常是最贵的高级模型),还没法单独设置便宜模型。
如果你不需要它每半小时自发想事情,请务必让它保持空白喵!

坑2:Memory 无限膨胀
很多铲屎官觉得龙虾记得越多越好,所以从来不清理 memory/ 目录。
结果就是,龙虾每次说话都要回顾半个月前的聊天记录。不仅输入 Token 越来越高,还会导致大脑"过载",缓存命中率极低,每一秒都在烧钱。

坑3:装了一堆"僵尸技能"
有些铲屎官看到好玩的 Skill 就想装。虽然技能很酷,但每一个技能的描述都会永久占据你的输入 Token 位。
如果你装了搜网页、画图、做PPT、搜机票、查天气等 20 个技能,但平时只用其中 2 个,那么剩下 18 个技能的说明书,你每天都在付钱让龙虾带在身上喵!
坑4:频繁切换模型
很多铲屎官喜欢一会儿用 Claude Sonnet,一会儿换 Gemini Flash,一会儿又换回来。
模型一换,缓存归零。
AI 的缓存是"绑定模型"的,同样的 160K 背景记忆,换个模型就得重新全量输入一遍。来回切几次,就等于把那几美金的"起步价"交了好几轮喵~ 💸
如果没有特殊需求,请认准一个模型,不要频繁切换。
坑5:超时续聊,缓存悄悄失效
以为开着聊天窗口就能"保温"?
其实大部分模型的缓存有效期只有 5~10 分钟。如果你发一条消息后去喝杯茶、开个会,回来再聊,缓存很可能已经失效了。
失效之后呢?没有任何提示,龙虾默默地把 160K 的记忆重新读了一遍,又收了你一遍起步价喵。
这一点特别坑:你以为是在"续聊",实际上每次间隔超过 10 分钟,都可能是一次全新的"起步"。
所以如果你要跟龙虾完成一个比较长的任务,最好一鼓作气,中间别停太久。或者接受这个现实,把它算进成本里喵~
糖糖的"减肥"优化方案 🐾

想让龙虾变轻快?跟着糖糖这么做喵:
- 定期清理流水日志:保留最近 3~5 天的日志就行,其余的删掉。
- 精简长期记忆:保持
MEMORY.md在 100 行以内。没用的、重复的信息统统删掉。 - 清空 HEARTBEAT.md:如果有定时任务需求,改用 Cron Job。
- 用 Cron Job + Subagent:定时任务可以指定便宜模型(比如
gemini-flash),成本能降到原来的 1/50 甚至更低喵! - 技能精简:只装真正用得上的技能,没用的立刻卸载。
给龙虾的"减肥提示词"专栏(一键优化!)
铲屎官们,不用自己动手翻文件,直接把下面这些提示词发给你的龙虾就好喵~
提示词1:检查健康状态
帮我检查一下你现在的输入token健康状况:
- 列出 memory/ 目录下所有日志文件,并按大小排序
- 统计 MEMORY.md 的行数
- 列出当前安装的技能数量
- 检查 HEARTBEAT.md 是否为空
给我一个"龙虾健康报告"
提示词2:清理流水日志
帮我清理 memory/ 目录下超过7天的日志文件(今天日期请确认),
删除前先列出哪些文件会被删除,我确认后再执行。
提示词3:精简长期记忆
帮我审查 MEMORY.md 的内容:
- 找出超过30天没有更新过的记录条目
- 找出重复或冗余的信息
- 给我一份"可以删除"的建议清单,我确认后再操作
目标:把 MEMORY.md 控制在 100 行以内
提示词4:心跳任务检查
帮我检查 HEARTBEAT.md 的内容,如果里面有任何任务内容,
请告诉我:这些任务是否应该迁移到 cron job?
请给出迁移建议,我来决定是否执行。
结语
省钱不是为了限制 AI,而是为了让 AI 陪我们走得更远喵~
记住,你的龙虾不是越沉重越聪明,而是越精干越强大。把那些陈年旧账删掉,把那些不用的技能卸下,你会发现你的龙虾不仅回复变快了,钱包也变厚了喵!
如果你想体验更智能、更经济的 AI 托管服务,欢迎访问 EasyClaw 官网:
https://easyclaw.work
学会给龙虾"减肥",做一个优雅的铲屎官喵!🐾🐱
夜雨聆风