深度优化 OpenClaw 开销,告别 Token 焦虑

深度优化 OpenClaw 开销，告别 Token 焦虑

经常用 OpenClaw 的小伙伴都知道，模型输入（上下文、记忆）和输出就像“流水”一样，一不小心 Token 消耗就爆表。
其实，通过一些简单的架构优化和使用习惯，完全可以把开销打下来。今天分享 5 个实战省钱大招，建议收藏！

01 模型分层：简单任务不花冤枉钱
核心逻辑：杀鸡不用宰牛刀。
策略：日常对话、简单搜索、格式整理默认使用 Claude Sonnet 或 GLM-4-Flash。
操作：只有在需要深度推理或复杂规划时，再手动切换到 Claude Opus 或 GPT-4。
效果：仅这一项，就能降低约 70% 的日常开销。

02 开启缓存：重复内容只付 1/10 的钱
系统提示词和工具定义每次都要发送，非常占 Token。
省钱秘籍：开启 Prompt Caching（提示词缓存）。
配置方法：在 ~/.openclaw/openclaw.json 中，将 "cacheRetention" 设置为 "long"。
收益：重复内容计费立降 90%，后续调用丝滑又便宜。

03 勤用命令：定期给上下文“瘦身”
OpenClaw 默认会带上所有历史记录，对话越长越贵。
/compact：最推荐！让 AI 把冗长对话提炼成摘要存入记忆，清理原始记录。
/reset：换话题时必用。重置短期上下文，但保留长期记忆。
/new：彻底开启新任务，干净清爽零消耗。

04 架构拆分：别让 Agent “太博学”
把写代码、写周报、运营所有活儿都塞给一个 Agent，会导致它的上下文极度臃肿。
方案：按照职能拆分 Agent（如：写作 Agent、发布 Agent、检查 Agent）。
优势：每个 Agent 只干专门的事，上下文更干净，Token 消耗精准可控。

05 避坑指南：禁用“高耗能”工具
有些工具是隐藏的“Token 刺客”，一定要避开：
禁用 browser snapshot：截图并分析网页会消耗 10k-20k Token！建议在 SOUL.md 中禁用它，优先使用 web_search（搜索）和 web_fetch（读文字）。
API 优先：能用 API 直连获取的数据（如天气、金价、新闻），不要让 AI 去刷网页，效率更高且几乎零消耗。

名称已清空

微信扫一扫赞赏作者

喜欢作者其它金额

赞赏后展示我的头像

作品

暂无作品

喜欢作者

其它金额

最低赞赏 ¥0

其它金额

赞赏金额

最低赞赏 ¥0

广东,2小时前,