乐于分享
好东西不私藏

清华刚刚开源了 PilotDeck,OpenClaw真要凉了?

清华刚刚开源了 PilotDeck,OpenClaw真要凉了?

省 70% token 费用这件事,可能比你们吹的所有功能加起来都实在


就在刚才,一个叫PilotDeck的项目在 GitHub 上开源了。

上线不到一个月,717 颗 Star,636 次 commit。隔壁工位的 AI 编码工具们开始悄悄紧张了——尤其是 OpenClaw,我都能感觉到它坐在角落不说话,心里在想:”这谁啊,又是哪个出来砸场子的?”

说实话,我也替 OpenClaw 捏把汗。


先简单介绍一下今天的主角

PilotDeck,来自清华系创业公司 OpenBMB(他们家还有著名的 ChatGLM)。

定位是:Task-oriented AI Agent 生产力平台

翻译成人话:一个让你”布置任务→下班→第二天来收成果”的 AI 助手。不是那种你问我答的聊天机器人,而是一个持续在后台跑、帮你干活的 AI 打工仔

它的核心概念叫WorkSpace——每个项目有独立的文件、记忆和技能集,彻底隔离。你同时做三个项目,AI 不会把它们搞混。

官网:


好,现在来聊聊 OpenClaw

我知道你们可能用过 OpenClaw,或者至少听说过。

它是个挺好的 CLI 工具,主打 AI 编程和任务自动化,社区里不少人在推。用户基数有,生态也在慢慢起来。

但是。

我认真研究了一下 PilotDeck,再看看 OpenClaw,问题就来了——

OpenClaw 解决的是”怎么让 AI 更好用”的问题。

PilotDeck 解决的是”怎么让 AI 用起来更省钱“的问题。

这两个问题,不一样。


真正让 OpenClaw 坐不住的功能:省 70% token 费

我来拆解一下 PilotDeck 的Smart Routing机制到底是啥。

AI 任务分两种:

简单任务——写注释、格式化代码、查文档、翻译一段话。这些你让 GPT-4o 跑,跟让 GPT-3.5 跑,效果差不多。但前者费用是后者的几十倍。

复杂任务——架构设计、多文件重构、安全审查。这类你用小模型,它真干不了,只能上旗舰模型。

现在市面上的 AI 工具,基本都是”一律调最强的模型”策略。好家伙,简单任务花旗舰的钱,复杂任务确实有保障,但成本已经失控了

PilotDeck 的做法是:自动识别任务难度,智能路由模型

简单任务 → 调用轻量级模型(DeepSeek-coder、Qwen 等)

复杂任务 → 调用旗舰模型(GPT-4o、Claude 3.5 等)

官方的基准测试数据相当炸裂:

📊 社交媒体类工作负载:节省 ~70% token 费用

📊 困难任务:70.6 分 vs 69.1 分(比肩 frontier 模型),但费用从 $18.36 降到 $3.15,只有原来的约 1/6

这个数字,PilotDeck 写在自己的 README 里,不是我编的。

现在问题来了:OpenClaw 有这个吗?

我没有阴阳怪气的意思——我是真的在问。OpenClaw 能在你执行任务的时候,自动判断这道题该用多少算力、该花多少钱吗?

如果不能,那用户在选择工具的时候,心里那杆秤会往哪边偏,已经很明显了。


还有几件事 PilotDeck 做得比较有意思

1. 白盒记忆——AI 记住了什么,你看得见

大多数 AI Agent 的记忆是黑箱。你不知道它什么时候存了什么、怎么存的、用了没有。

PilotDeck 的记忆系统是完全透明的——记忆的生成、提取、存储、检索,全流程可见可查。

不再是”我猜它记住了吧”,而是”我明确知道它记住了这个”。

2. Always-on 后台执行——下班前布置任务,第二天验收

这是我觉得最有未来感的部分。

你可以在下班前跟 PilotDeck 说:”帮我把这个模块重构了,顺便跑一遍测试,有问题先别动,等我来。”

然后你关电脑走人。

它会在你离开后继续发现候选任务、执行工作,等你第二天来签字确认再正式交付

OpenClaw 支持这个吗?不确定。但这个功能对于需要长时间跟进大型项目的开发者来说,确实是痛点级别的需求。

3. 每个项目独立 WorkSpace——不串场

同时做三个项目,用同一个 AI 助手,最怕的就是上下文互相污染。

PilotDeck 的解法很干脆:每个项目有独立的 WorkSpace,记忆、文件、技能集全部隔离。

就像给每个项目雇了一个专属的 AI,而不是让一个 AI 同时打三份工。


那 OpenClaw 现在什么感觉?

我猜是这个表情包:

🫣 “我就安静当个工具,不说话。”

不是 OpenClaw 不好。它是一个正经的、有人在用的 AI CLI 工具。

但 PilotDeck 这类新开源项目,解决的是一个更底层的问题——AI 工具用起来到底要花多少钱

这个问题,迟早会被用户越来越多的讨论。不是因为大家喜欢省钱,而是因为 Token 账单每个月都在涨,财务那边迟早要来问你:”这个月 AI 费用怎么又爆了?”

到时候你跟财务说”我们用的是 OpenClaw,它很好用”——财务不会 care 的。

但你如果说”我们接了 PilotDeck,它会自动路由模型,简单任务用便宜的,复杂任务才调旗舰,这个月省了 70%”——财务会给你鼓掌。

谁更抗打,不言而喻。


总结

pilotdeck.openbmb.cn是一个值得关注的 AI Agent 平台。它不是最好的,但它在解决一个很实在的问题——AI 用起来到底要花多少钱

Smart Routing 带来的 70% 成本节省,配合白盒记忆、Always-on 后台执行、WorkSpace 隔离这几项功能,让它在一个”AI 工具很多,能省钱的很少”的细分赛道里显得相当有意思。

OpenClaw 作为一款产品本身没有问题,只是——在一个大家都在算 Token 账的年代,光靠”好用”可能不够了

仓库地址:https://github.com/OpenBMB/PilotDeck

协议:AGPL-3.0