深度优化 OpenClaw 开销,告别 Token 焦虑
经常用 OpenClaw 的小伙伴都知道,模型输入(上下文、记忆)和输出就像“流水”一样,一不小心 Token 消耗就爆表。
其实,通过一些简单的架构优化和使用习惯,完全可以把开销打下来。今天分享 5 个实战省钱大招,建议收藏!
01 模型分层:简单任务不花冤枉钱
核心逻辑: 杀鸡不用宰牛刀。
策略: 日常对话、简单搜索、格式整理默认使用 Claude Sonnet 或 GLM-4-Flash。
操作: 只有在需要深度推理或复杂规划时,再手动切换到 Claude Opus 或 GPT-4。
效果: 仅这一项,就能降低约 70% 的日常开销。
02 开启缓存:重复内容只付 1/10 的钱
系统提示词和工具定义每次都要发送,非常占 Token。
省钱秘籍: 开启 Prompt Caching(提示词缓存)。
配置方法: 在 ~/.openclaw/openclaw.json 中,将 "cacheRetention" 设置为 "long"。
收益: 重复内容计费立降 90%,后续调用丝滑又便宜。
03 勤用命令:定期给上下文“瘦身”
OpenClaw 默认会带上所有历史记录,对话越长越贵。
/compact: 最推荐!让 AI 把冗长对话提炼成摘要存入记忆,清理原始记录。
/reset: 换话题时必用。重置短期上下文,但保留长期记忆。
/new: 彻底开启新任务,干净清爽零消耗。
04 架构拆分:别让 Agent “太博学”
把写代码、写周报、运营所有活儿都塞给一个 Agent,会导致它的上下文极度臃肿。
方案: 按照职能拆分 Agent(如:写作 Agent、发布 Agent、检查 Agent)。
优势: 每个 Agent 只干专门的事,上下文更干净,Token 消耗精准可控。
05 避坑指南:禁用“高耗能”工具
有些工具是隐藏的“Token 刺客”,一定要避开:
禁用 browser snapshot: 截图并分析网页会消耗 10k-20k Token!建议在 SOUL.md 中禁用它,优先使用 web_search(搜索)和 web_fetch(读文字)。
API 优先: 能用 API 直连获取的数据(如天气、金价、新闻),不要让 AI 去刷网页,效率更高且几乎零消耗。
夜雨聆风