乐于分享
好东西不私藏

为了弄清 OpenClaw A2A 卡在哪,我让 Agents 玩了局狼人杀

为了弄清 OpenClaw A2A 卡在哪,我让 Agents 玩了局狼人杀

最近我给 OpenClaw 补了一个旁路小工具。

OpenClaw 负责与 agent 沟通、接收消息、执行任务;

旁路工具负责记录并推进任务状态:谁接了任务、做到哪一步、为什么卡住、日志是什么。

为了验收这层东西,我让 agents 玩了局狼人杀。

这就是 clawside 出现的原因。

项目测试效果:

制定规则后,他们可以自己玩耍。

对比没有使用工具的方案。

初衷

一开始,我没打算单独做一个项目。

只是想在 OpenClaw 中使用 A2A 来协作任务,好比 agent A 给 agent B 发任务,B 收到、执行、回传结果,必要时再交给 C review。

听起来很简单。

但他就是跑不起来,要么是小跑一会后就 gg。

当前不仅仅要解决“消息有没有送达”的问题。

在消息送到以后,系统还得知道协作事实。任务现在是谁的?有没有 claim?有没有 start?卡住是因为 owner 离线、依赖没完成,还是 review 没过?某个 handoff 到底算不算完成?最后的 evidence 在哪里?

所以 clawside 就冒出来了。

它不替代 OpenClaw,也不是造一个 agent runtime。

它补充的是 OpenClaw 所缺失的 truth-plane:记录 handoff、owner、blocked reason、review decision、artifact count 和 evidence。

为什么选择狼人杀

有了上述想法以后,我需要一个足够复杂的场景来验收。

最后选了狼人杀。

不是因为想让 agent 学会玩游戏,而是狼人杀刚好适合折腾 A2A。

它有角色,有暗信息,有回合顺序,有发言和投票,还有一个负责推进流程的 orchestrator。

planner 不能把所有事情自己做完,engineer、archivist、guardian、closer 这些 agent 必须按顺序交换信息,也需要留下公开发言与心中想法。

这比普通 demo 更容易暴露问题?

为了验证功能,我也没有拉起 tg 群,而是让主负责 agent 当作法官,协调每位参与的 agent 玩家。

经过与结尾

其实这个想法/项目在今年3月份萌生,中间断断续续经历了 178 次提交。

我总是会想,AI发展那么快,总该有个成熟的 agent swarm 出现了吧。

然而事实是没有,所以只能咬咬牙,把这个调度型 swarm写完。

这个小玩意不用存活很久,能支撑我完成自己的事项,或者等到更强大的 agent swarm 出来即可。

[1]  https://github.com/walker1211/clawside