乐于分享
好东西不私藏

给每个还在用 OpenClaw 的用户的忠告

给每个还在用 OpenClaw 的用户的忠告

OpenClaw 推出到现在已经快五个月了,那一波热潮也终于过去了。现在我不知道还有多少人留下来还在用,你们拿 OpenClaw 是用来做什么的?

我身边的朋友,有做投资金融的,有做项目管理的,还有做自媒体的。无一例外,都是看中了 OpenClaw 的多 Agent 优势。

虽然我现在主要用的是 Claude Code 和 Codex。

但 OpenClaw 的多 Agent 功能应该是目前为止市面上比较好的,所以我选择把一部分工作留了下来。

这几个月用下来,我摸清了它的边界,也找到了到底什么工作才适合放在 OpenClaw。

今天把这些实操经验整理出来,给还在用的朋友一个参考。

一个暴论,OpenClaw 压根就不适合中大型编程任务

有些人可能会说:不不不,我可以在 OpenClaw 里通过 ACP 或者 tmux 调用 Claude Code、Codex 去执行编程任务啊?

既然你可以直接找他们,为什么要多一层中转?直接在对应的 Agent 工具里进行流转、进行会话的不是更好吗?

现在 Codex App 的功能性,可视化的程度也远远要高于 OpenClaw了。

而且每一层转发都在烧 Token。 Agent 间的沟通也不一定能完整传达你的意思。你跟龙虾的 agent 说”重构登录模块”

到 Codex 那可能变成了”改一下登录页面的样式”。就算单一 Agent 执行任务,OpenClaw 自身的动作执行也经常跑偏,花在纠偏上的时间,可能比你自己动手还多。

有人说“我就是想在手机上看到编程任务的进度”——那你装一个远程桌面 app,不比这方便多了。

就算你用最好的模型,Opus 4.7 或者 GPT 5.5,在 OpenClaw 里用的体验,都比不上直接在 Claude Code 或 Codex 里用。

那 OpenClaw 到底适合什么?

多 Agent 协作,是它最擅长的事

我日常手上同时推进四五个项目。

在没有多 Agent 之前,我的状态是这样的:每天早上打开飞书,看到一堆待办,先愣三分钟——不知道该先干哪个。

好不容易选了一个项目 A 推进,干到一半又想起来另一个项目还有个截止日期。下午在项目 A 和项目 B 之间反复横跳,晚上复盘发现每个项目都没推进多少。

我现在在 Openclaw 里拆成了三个 Agent,虽然执行者还是我,但是我把每天最头疼、最内耗的“脑力劳动”转移了一部分给 Agent。

第一个:任务管理 Agent

它只负责一件事:进度记录。不负责任何执行。

我和它以飞书 CLI 的任务管理功能为沟通中台,每天早中晚三个时间点:早上记录任务,中午同步进度,晚上复盘

每周和每月还会做周期复盘,包括项目推进进度和细节执行情况。

它就像一个秘书,告诉我每天应该先做哪些事情,并且及时提醒我哪些事情推进到哪里了。

写周报或者月报的时候,也可以通过跟他对话来了解自己到底干了什么,而不用一直翻聊天记录或者会话记录。

第二个:Idea Coach

这是整个架构里最关键的环节。

任务管理 Agent 完成记录之后,通过 Session Send 把今天的内容发给 Idea Coach。然后逐个分析每个项目今天该干什么。

目的就是把”搭建某某中台”这种抽象概念,拆到你能直接上手的每一步——具体做什么、先做什么、拿到就能干。

第三个:写稿 Agent

负责帮我写文章和管理知识库,偏向文案类工作。如果是文字类的工作,Idea Coach 就会先 发给他,让他帮我进行工作。

当然,他还负责热点搜索、知识库编译。

如果当天的项目里有编程任务,Idea Coach 会直接给我一个接力提示词,我自己去找 Claude Code 或者 Codex 执行。回到传统的 CLI 或 Codex App 里接续代码工作。

我现在完全用飞书文档 + 多维表格做中台,飞书 CLI 把整个流程串起来。

任务管理 Agent 记录的东西全落到飞书,Idea Coach 从飞书里读,写稿 Agent 又从 Idea Coach 的输出里继续工作。

省心,丝滑。

选对模型才能多快好省

如果说当下只讨论 token 最低成本的话,那么 M2.7 当之无愧的 Top1 了。

但在 OpenClaw 里用过的朋友应该都有体会。你需要给它非常强的约束,它才能”正常”执行任务——注意是”正常”,不是”完美”。

它只适合那些只想玩一下 OpenClaw,但又不想折腾 API 或者各种模型的用户。但如果是长期使用的话,MiniMax 的当,上一次就够了。

要论质量,GPT 5.5是目前最适配 OpenClaw 的 SOTA 模型。但如果你对上下文 Token 管理做得不好,一个 Plus 套餐可能也撑不到周限额。好处是它性价比已经很高了,土区仅需 80 大洋

我自己现在用 DeepSeek V4,感觉是越用越好用了。想要快速快速低成本选 Flash ,想要深度推理更精确选 Pro。

思考模式开个High,效果还是很好的。

工具和 skill 调用上也很积极,实测下来工具调用能力在国模里仅次于 GLM。

而且OpenClaw 4.24 版本已经针对 DeepSeek V4 做了上下文缓存优化。我每天的缓存命中率做到 93%,甚至 97%

 DeepSeek V4 刚出没几天我就接到龙虾了,其中有一天花了一亿两千万 token,一天下来3个会话在同时用 V4 Flash,实际花费5.75

唯一缺点:没有多模态能力。如果你很需要,直接上 Kimi,能抢到 GLM 也行

降 Token 的四个重要技巧

选对模型只是第一步,真正把成本压下来,靠的是四个配置调整。

1. 上下文窗口填 1M,不要用默认的 200K

OpenClaw 默认上下文窗口是 200K,但 DeepSeek V4 支持 1M。填模型配置的时候一定要改。这是后面所有优化的大前提。

2. 把”凌晨4点重置”改成”闲置72小时后重置”

OpenClaw 默认有一个凌晨 4 点重置会话的机制,目的是减少上下文污染,初衷是好的。

但这个设计的背景是大部分模型只有 200K 的上下文窗口,一天下来基本满了。

但 1M 窗口下,我一天的上下文占用大概 200K 到 300K。1M 完全可以撑好几天

所以我把重置策略改成了“闲置 72 小时后自动重置”——只要我在 72 小时内跟它有过任何一次对话,会话就不会重置。

3. 缓存命中率是省钱的核心

只要不重置会话,缓存就都还在。1M 上下文窗口下,你可以持续跟它对话,源源不断地命中缓存。

DeepSeek V4 Flash 的缓存命中价格说他白菜价都贵了。。

大家可以对比下其他模型 API 的缓存命中价格,应该是很明显的(这里点名 Mimo的 Token Plan)

命中缓存省下的成本,远远高于偶尔建新会话时的缓存建立费用。

4. 700K-800K 时手动 compact 

1M 的窗口不是无限的。我测试到 700K 到 800K 左右时,会出现一些漂移现象

Agent 可能开始跑偏、理解出错。这个时候就需要手动执行 compact 或者 reset。

当然你不手动执行也行。当会话自动达到 1M 的时候,系统也会自动执行 compact。

虽然建新会话会产生稍高一点的缓存建立费用,但你在正常聊天过程中命中缓存所节省的成本,远高于这部分支出。

记忆:别整那么多花里胡哨的了,用日记 + 语义搜索

OpenClaw 的记忆一直是痛点。

我之前用 Hermes Agent 的时候,发现它恨不得把所有聊天内容都进化成 skill。好处是不怎么忘事了,缺点就是人味缺了一点,它更偏向单 Agent 自进化的设定,简称工具人。

OpenClaw 它不会主动把所有东西都做成 skill。但如果你想让它的记忆靠谱,不用加太多插件,更不要开启心跳,这东西真的很费 Token。

我现在稳定在用的方案就两步。

第一步:每天凌晨 3 点,定一个 cron 任务

让 Agent 总结从前一天 3:00 到当天 3:00 的内容,在 Tools 文档中写明写入规范,按照固定格式写入 Memory。

就像让 Agent 每天写一篇固定格式的日记。你先把 Memory 的格式标准化,之后 Agent 按格式去读的时候,整体会更清晰,知道你们发生过什么、它帮你做过什么。

第二步:本地 Ollama + 向量模型 + QMD 语义搜索

在本地用 Ollama 装一个向量模型接入 Openclaw,然后用 QMD 做语义搜索。这样 Agent 既能抓取 Memory,也能进行语义搜索。

两者结合,基本上 Agent 就不再会失忆了。

正确的人干正确的事

假如你下一次发现自己在 OpenClaw 里调试一个编程任务调了半小时还没调对,也许该想想:这个任务是不是该交给 Claude Code 了?

OpenClaw 的价值在于多 Agent 协作规划,在于让它当你的项目管理中台,帮助你更高效的处理项目进度,它不是一个全能选手。

现在各家 Token Plan 也早已不打价格战,甚至都限售了,趁现在还是多学一点省 token 的技巧吧。


这里是 Jetson,在人人追新 Agent 的时代,聊聊怎么把手里这个用好。