为了弄清 OpenClaw A2A 卡在哪,我让 Agents 玩了局狼人杀

最近我给 OpenClaw 补了一个旁路小工具。

OpenClaw 负责与 agent 沟通、接收消息、执行任务；

旁路工具负责记录并推进任务状态：谁接了任务、做到哪一步、为什么卡住、日志是什么。

为了验收这层东西，我让 agents 玩了局狼人杀。

这就是 clawside 出现的原因。

项目测试效果：

制定规则后，他们可以自己玩耍。

对比没有使用工具的方案。

初衷

一开始，我没打算单独做一个项目。

只是想在 OpenClaw 中使用 A2A 来协作任务，好比 agent A 给 agent B 发任务，B 收到、执行、回传结果，必要时再交给 C review。

听起来很简单。

但他就是跑不起来，要么是小跑一会后就 gg。

当前不仅仅要解决“消息有没有送达”的问题。

在消息送到以后，系统还得知道协作事实。任务现在是谁的？有没有 claim？有没有 start？卡住是因为 owner 离线、依赖没完成，还是 review 没过？某个 handoff 到底算不算完成？最后的 evidence 在哪里？

所以 clawside 就冒出来了。

它不替代 OpenClaw，也不是造一个 agent runtime。

它补充的是 OpenClaw 所缺失的 truth-plane：记录 handoff、owner、blocked reason、review decision、artifact count 和 evidence。

为什么选择狼人杀

有了上述想法以后，我需要一个足够复杂的场景来验收。

最后选了狼人杀。

不是因为想让 agent 学会玩游戏，而是狼人杀刚好适合折腾 A2A。

它有角色，有暗信息，有回合顺序，有发言和投票，还有一个负责推进流程的 orchestrator。

planner 不能把所有事情自己做完，engineer、archivist、guardian、closer 这些 agent 必须按顺序交换信息，也需要留下公开发言与心中想法。

这比普通 demo 更容易暴露问题？

为了验证功能，我也没有拉起 tg 群，而是让主负责 agent 当作法官，协调每位参与的 agent 玩家。

其实这个想法/项目在今年3月份萌生，中间断断续续经历了 178 次提交。

我总是会想，AI发展那么快，总该有个成熟的 agent swarm 出现了吧。

然而事实是没有，所以只能咬咬牙，把这个调度型 swarm写完。

这个小玩意不用存活很久，能支撑我完成自己的事项，或者等到更强大的 agent swarm 出来即可。

[1] https://github.com/walker1211/clawside