给每个还在用 OpenClaw 的用户的忠告-夜雨聆风

给每个还在用 OpenClaw 的用户的忠告

OpenClaw 推出到现在已经快五个月了，那一波热潮也终于过去了。现在我不知道还有多少人留下来还在用，你们拿 OpenClaw 是用来做什么的？

我身边的朋友，有做投资金融的，有做项目管理的，还有做自媒体的。无一例外，都是看中了 OpenClaw 的多 Agent 优势。

虽然我现在主要用的是 Claude Code 和 Codex。

但 OpenClaw 的多 Agent 功能应该是目前为止市面上比较好的，所以我选择把一部分工作留了下来。

这几个月用下来，我摸清了它的边界，也找到了到底什么工作才适合放在 OpenClaw。

今天把这些实操经验整理出来，给还在用的朋友一个参考。

▶一个暴论，OpenClaw 压根就不适合中大型编程任务

有些人可能会说：不不不，我可以在 OpenClaw 里通过 ACP 或者 tmux 调用 Claude Code、Codex 去执行编程任务啊？

但既然你可以直接找他们，为什么要多一层中转？直接在对应的 Agent 工具里进行流转、进行会话的不是更好吗？

现在 Codex App 的功能性，可视化的程度也远远要高于 OpenClaw了。

而且每一层转发都在烧 Token。 Agent 间的沟通也不一定能完整传达你的意思。你跟龙虾的 agent 说”重构登录模块”

到 Codex 那可能变成了”改一下登录页面的样式”。就算单一 Agent 执行任务，OpenClaw 自身的动作执行也经常跑偏，花在纠偏上的时间，可能比你自己动手还多。

有人说“我就是想在手机上看到编程任务的进度”——那你装一个远程桌面 app，不比这方便多了。

就算你用最好的模型，Opus 4.7 或者 GPT 5.5，在 OpenClaw 里用的体验，都比不上直接在 Claude Code 或 Codex 里用。

那 OpenClaw 到底适合什么？

▶多 Agent 协作，是它最擅长的事

我日常手上同时推进四五个项目。

在没有多 Agent 之前，我的状态是这样的：每天早上打开飞书，看到一堆待办，先愣三分钟——不知道该先干哪个。

好不容易选了一个项目 A 推进，干到一半又想起来另一个项目还有个截止日期。下午在项目 A 和项目 B 之间反复横跳，晚上复盘发现每个项目都没推进多少。

我现在在 Openclaw 里拆成了三个 Agent，虽然执行者还是我，但是我把每天最头疼、最内耗的“脑力劳动”转移了一部分给 Agent。

第一个：任务管理 Agent

它只负责一件事：进度记录。不负责任何执行。

我和它以飞书 CLI 的任务管理功能为沟通中台，每天早中晚三个时间点：早上记录任务，中午同步进度，晚上复盘。

每周和每月还会做周期复盘，包括项目推进进度和细节执行情况。

它就像一个秘书，告诉我每天应该先做哪些事情，并且及时提醒我哪些事情推进到哪里了。

写周报或者月报的时候，也可以通过跟他对话来了解自己到底干了什么，而不用一直翻聊天记录或者会话记录。

第二个：Idea Coach

这是整个架构里最关键的环节。

任务管理 Agent 完成记录之后，通过 Session Send 把今天的内容发给 Idea Coach。然后逐个分析每个项目今天该干什么。

目的就是把”搭建某某中台”这种抽象概念，拆到你能直接上手的每一步——具体做什么、先做什么、拿到就能干。

第三个：写稿 Agent

负责帮我写文章和管理知识库，偏向文案类工作。如果是文字类的工作，Idea Coach 就会先发给他，让他帮我进行工作。

当然，他还负责热点搜索、知识库编译。

如果当天的项目里有编程任务，Idea Coach 会直接给我一个接力提示词，我自己去找 Claude Code 或者 Codex 执行。回到传统的 CLI 或 Codex App 里接续代码工作。

我现在完全用飞书文档 + 多维表格做中台，飞书 CLI 把整个流程串起来。

任务管理 Agent 记录的东西全落到飞书，Idea Coach 从飞书里读，写稿 Agent 又从 Idea Coach 的输出里继续工作。

省心，丝滑。

▶选对模型才能多快好省

如果说当下只讨论 token 最低成本的话，那么 M2.7 当之无愧的 Top1 了。

但在 OpenClaw 里用过的朋友应该都有体会。你需要给它非常强的约束，它才能”正常”执行任务——注意是”正常”，不是”完美”。

它只适合那些只想玩一下 OpenClaw，但又不想折腾 API 或者各种模型的用户。但如果是长期使用的话，MiniMax 的当，上一次就够了。

要论质量，GPT 5.5是目前最适配 OpenClaw 的 SOTA 模型。但如果你对上下文 Token 管理做得不好，一个 Plus 套餐可能也撑不到周限额。好处是它性价比已经很高了，土区仅需 80 大洋。

我自己现在用 DeepSeek V4，感觉是越用越好用了。想要快速快速低成本选 Flash ，想要深度推理更精确选 Pro。

思考模式开个High，效果还是很好的。

工具和 skill 调用上也很积极，实测下来工具调用能力在国模里仅次于 GLM。

而且OpenClaw 4.24 版本已经针对 DeepSeek V4 做了上下文缓存优化。我每天的缓存命中率做到 93%，甚至 97%。

DeepSeek V4 刚出没几天我就接到龙虾了，其中有一天花了一亿两千万 token，一天下来3个会话在同时用 V4 Flash，实际花费5.75元

唯一缺点：没有多模态能力。如果你很需要，直接上 Kimi，能抢到 GLM 也行

▶降 Token 的四个重要技巧

选对模型只是第一步，真正把成本压下来，靠的是四个配置调整。

1. 上下文窗口填 1M，不要用默认的 200K

OpenClaw 默认上下文窗口是 200K，但 DeepSeek V4 支持 1M。填模型配置的时候一定要改。这是后面所有优化的大前提。

2. 把”凌晨4点重置”改成”闲置72小时后重置”

OpenClaw 默认有一个凌晨 4 点重置会话的机制，目的是减少上下文污染，初衷是好的。

但这个设计的背景是大部分模型只有 200K 的上下文窗口，一天下来基本满了。

但 1M 窗口下，我一天的上下文占用大概 200K 到 300K。1M 完全可以撑好几天。

所以我把重置策略改成了“闲置 72 小时后自动重置”——只要我在 72 小时内跟它有过任何一次对话，会话就不会重置。

3. 缓存命中率是省钱的核心

只要不重置会话，缓存就都还在。1M 上下文窗口下，你可以持续跟它对话，源源不断地命中缓存。

DeepSeek V4 Flash 的缓存命中价格说他白菜价都贵了。。

大家可以对比下其他模型 API 的缓存命中价格，应该是很明显的（这里点名 Mimo的 Token Plan）

命中缓存省下的成本，远远高于偶尔建新会话时的缓存建立费用。

4. 700K-800K 时手动 compact

1M 的窗口不是无限的。我测试到 700K 到 800K 左右时，会出现一些漂移现象

Agent 可能开始跑偏、理解出错。这个时候就需要手动执行 compact 或者 reset。

当然你不手动执行也行。当会话自动达到 1M 的时候，系统也会自动执行 compact。

虽然建新会话会产生稍高一点的缓存建立费用，但你在正常聊天过程中命中缓存所节省的成本，远高于这部分支出。

▶记忆：别整那么多花里胡哨的了，用日记 + 语义搜索

OpenClaw 的记忆一直是痛点。

我之前用 Hermes Agent 的时候，发现它恨不得把所有聊天内容都进化成 skill。好处是不怎么忘事了，缺点就是人味缺了一点，它更偏向单 Agent 自进化的设定，简称工具人。

OpenClaw 它不会主动把所有东西都做成 skill。但如果你想让它的记忆靠谱，不用加太多插件，更不要开启心跳，这东西真的很费 Token。

我现在稳定在用的方案就两步。

第一步：每天凌晨 3 点，定一个 cron 任务

让 Agent 总结从前一天 3:00 到当天 3:00 的内容，在 Tools 文档中写明写入规范，按照固定格式写入 Memory。

就像让 Agent 每天写一篇固定格式的日记。你先把 Memory 的格式标准化，之后 Agent 按格式去读的时候，整体会更清晰，知道你们发生过什么、它帮你做过什么。

第二步：本地 Ollama + 向量模型 + QMD 语义搜索

在本地用 Ollama 装一个向量模型接入 Openclaw，然后用 QMD 做语义搜索。这样 Agent 既能抓取 Memory，也能进行语义搜索。

两者结合，基本上 Agent 就不再会失忆了。

▶正确的人干正确的事

假如你下一次发现自己在 OpenClaw 里调试一个编程任务调了半小时还没调对，也许该想想：这个任务是不是该交给 Claude Code 了？

OpenClaw 的价值在于多 Agent 协作规划，在于让它当你的项目管理中台，帮助你更高效的处理项目进度，它不是一个全能选手。

现在各家 Token Plan 也早已不打价格战，甚至都限售了，趁现在还是多学一点省 token 的技巧吧。

这里是 Jetson，在人人追新 Agent 的时代，聊聊怎么把手里这个用好。