清华刚刚开源了 PilotDeck,OpenClaw真要凉了?

省 70% token 费用这件事，可能比你们吹的所有功能加起来都实在

就在刚才，一个叫PilotDeck的项目在 GitHub 上开源了。

上线不到一个月，717 颗 Star，636 次 commit。隔壁工位的 AI 编码工具们开始悄悄紧张了——尤其是 OpenClaw，我都能感觉到它坐在角落不说话，心里在想：”这谁啊，又是哪个出来砸场子的？”

说实话，我也替 OpenClaw 捏把汗。

先简单介绍一下今天的主角

PilotDeck，来自清华系创业公司 OpenBMB（他们家还有著名的 ChatGLM）。

定位是：Task-oriented AI Agent 生产力平台。

翻译成人话：一个让你”布置任务→下班→第二天来收成果”的 AI 助手。不是那种你问我答的聊天机器人，而是一个持续在后台跑、帮你干活的 AI 打工仔。

它的核心概念叫WorkSpace——每个项目有独立的文件、记忆和技能集，彻底隔离。你同时做三个项目，AI 不会把它们搞混。

官网：

好，现在来聊聊 OpenClaw

我知道你们可能用过 OpenClaw，或者至少听说过。

它是个挺好的 CLI 工具，主打 AI 编程和任务自动化，社区里不少人在推。用户基数有，生态也在慢慢起来。

但是。

我认真研究了一下 PilotDeck，再看看 OpenClaw，问题就来了——

OpenClaw 解决的是”怎么让 AI 更好用”的问题。

PilotDeck 解决的是”怎么让 AI 用起来更省钱“的问题。

这两个问题，不一样。

真正让 OpenClaw 坐不住的功能：省 70% token 费

我来拆解一下 PilotDeck 的Smart Routing机制到底是啥。

AI 任务分两种：

简单任务——写注释、格式化代码、查文档、翻译一段话。这些你让 GPT-4o 跑，跟让 GPT-3.5 跑，效果差不多。但前者费用是后者的几十倍。

复杂任务——架构设计、多文件重构、安全审查。这类你用小模型，它真干不了，只能上旗舰模型。

现在市面上的 AI 工具，基本都是”一律调最强的模型”策略。好家伙，简单任务花旗舰的钱，复杂任务确实有保障，但成本已经失控了。

PilotDeck 的做法是：自动识别任务难度，智能路由模型。

简单任务 → 调用轻量级模型（DeepSeek-coder、Qwen 等）

复杂任务 → 调用旗舰模型（GPT-4o、Claude 3.5 等）

官方的基准测试数据相当炸裂：

📊 社交媒体类工作负载：节省 ~70% token 费用

📊 困难任务：70.6 分 vs 69.1 分（比肩 frontier 模型），但费用从 $18.36 降到 $3.15，只有原来的约 1/6。

这个数字，PilotDeck 写在自己的 README 里，不是我编的。

现在问题来了：OpenClaw 有这个吗？

我没有阴阳怪气的意思——我是真的在问。OpenClaw 能在你执行任务的时候，自动判断这道题该用多少算力、该花多少钱吗？

如果不能，那用户在选择工具的时候，心里那杆秤会往哪边偏，已经很明显了。

还有几件事 PilotDeck 做得比较有意思

1. 白盒记忆——AI 记住了什么，你看得见

大多数 AI Agent 的记忆是黑箱。你不知道它什么时候存了什么、怎么存的、用了没有。

PilotDeck 的记忆系统是完全透明的——记忆的生成、提取、存储、检索，全流程可见可查。

不再是”我猜它记住了吧”，而是”我明确知道它记住了这个”。

2. Always-on 后台执行——下班前布置任务，第二天验收

这是我觉得最有未来感的部分。

你可以在下班前跟 PilotDeck 说：”帮我把这个模块重构了，顺便跑一遍测试，有问题先别动，等我来。”

然后你关电脑走人。

它会在你离开后继续发现候选任务、执行工作，等你第二天来签字确认再正式交付。

OpenClaw 支持这个吗？不确定。但这个功能对于需要长时间跟进大型项目的开发者来说，确实是痛点级别的需求。

3. 每个项目独立 WorkSpace——不串场

同时做三个项目，用同一个 AI 助手，最怕的就是上下文互相污染。

PilotDeck 的解法很干脆：每个项目有独立的 WorkSpace，记忆、文件、技能集全部隔离。

就像给每个项目雇了一个专属的 AI，而不是让一个 AI 同时打三份工。

那 OpenClaw 现在什么感觉？

我猜是这个表情包：

🫣 “我就安静当个工具，不说话。”

不是 OpenClaw 不好。它是一个正经的、有人在用的 AI CLI 工具。

但 PilotDeck 这类新开源项目，解决的是一个更底层的问题——AI 工具用起来到底要花多少钱。

这个问题，迟早会被用户越来越多的讨论。不是因为大家喜欢省钱，而是因为 Token 账单每个月都在涨，财务那边迟早要来问你：”这个月 AI 费用怎么又爆了？”

到时候你跟财务说”我们用的是 OpenClaw，它很好用”——财务不会 care 的。

但你如果说”我们接了 PilotDeck，它会自动路由模型，简单任务用便宜的，复杂任务才调旗舰，这个月省了 70%”——财务会给你鼓掌。

谁更抗打，不言而喻。

总结

pilotdeck.openbmb.cn是一个值得关注的 AI Agent 平台。它不是最好的，但它在解决一个很实在的问题——AI 用起来到底要花多少钱。

Smart Routing 带来的 70% 成本节省，配合白盒记忆、Always-on 后台执行、WorkSpace 隔离这几项功能，让它在一个”AI 工具很多，能省钱的很少”的细分赛道里显得相当有意思。

OpenClaw 作为一款产品本身没有问题，只是——在一个大家都在算 Token 账的年代，光靠”好用”可能不够了。

仓库地址：https://github.com/OpenBMB/PilotDeck

协议：AGPL-3.0