基于 OpenClaw/WorkBuddy 的 KIMI Multi-Agent Swarm实践指南
本文由主要说的是Multi-Agent Swarm多智能体协作系统如何在类龙虾服务上的复现以及复现效果。
上期我写一篇文章,其实就是用KIMI agent 集群(Multi-Agent Swarm)的功能实现的。
但是这个功能实在是太好用了,以至于我199套餐还不到一个月就快被榨干了。

另外再考虑到他们家PPT的审美始终在线,各种任务美商都非常高,对于KIMI的好感度大幅飙升。
唯一值得抱怨的可能就是他们家的套餐实在太贵了。
于是我有了一个想法,有没有可能在Openclaw上面实现类似的功能。除了Openclaw还有Hermes和腾讯的Workbuddy。
结论是各种“狗尾续貂”,就是没有KIMI Agent 集群那个味道。文章最后也附上了提示词和实现方案,感兴趣的朋友下拉到最后一部分即可。
直接说结论吧,从实现效果来说Workbuddy>Openclaw>Hermes
Hermes效果最差,主要表现在会失忆,安排的任务做着做着就忘记了。个人感觉他的上下文好像从始至终都在,压缩的过程中会丢掉一些信息,另外就是会把安排的任务和之前的提示词混淆。
Openclaw本身就有调用agent的功能,实现效果中规中矩。倒是Workbuddy蛮让我惊艳的,就是如果你带过实习生,一会发现有两种:一种就是思路清晰干活很“干净”,还会主动问你怎么改进,另一种是也能干完但是你不知道怎么干的。Workbuddy就是前者,Openclaw可能还需要额外修改人设才能达到这种效果。
我大概说了他的效果不如KIMI,他会给出还算比较专业的反馈。事实上调整后的效果也的确大幅提升,但感觉还是少了点味道。


第一部分:为什么Agent集群能生成这么好的内容?
你给AI一个复杂任务,它不是一个人闷头干,而是像指挥官一样,瞬间召唤出几十个专业“小弟”,让他们并行工作、各司其职。虽然目前KIMI已经升级到了K2.6,但是agent集群的出色效果其实是始于Kimi K2.5。强大的Agent Swarm(智能体集群)能力。
单挑还是群殴?
传统的AI Agent就像一个独行侠,面对复杂任务只能一件件顺序处理:先搜资料、再分析、最后写报告。遇到信息量大的任务,还容易“脑子过载”——上下文窗口塞满了,重要细节反而遗漏。
K2.5的思路完全不同:一个“指挥官”智能体自动把任务拆分成多个子任务,同时调度多达100个专业子智能体并行工作。AI研究员负责查资料、代码专家负责实现、事实核查员负责验证——大家同时开工,最后汇总结果。
官方数据显示,这种模式下执行时间最多缩短4.5倍,复杂搜索任务的关键步骤减少3到4倍。
训练秘诀:先学并行,再求质量
让AI学会“指挥”而不是“单干”,是技术难点。Kimi提出了PARL(并行智能体强化学习)方法,核心是:子智能体能力固定,只训练指挥官的调度能力。
奖励函数设计了三重维度:任务完成质量、子任务完成率、以及真正的并行程度。前期重点考核是否在并行执行,后期才转向最终结果质量。这种“先学会分工、再追求效果”的策略,有效避免了“假并行”——即表面上生成很多子任务,实际上还是顺序执行。
信源链接
-
Kimi官方技术博客: https://www.kimi.com/blog/kimi-k2-5 -
arXiv技术报告: https://arxiv.org/abs/2602.02276 -
DataCamp技术解读: https://www.datacamp.com/tutorial/kimi-k2-agent-swarm-guide
第二部分:Agent集群能干什么?
我试着设想了下,例如审计底稿自动生成的复杂工作,那个画面真的太美了。
【传统审计底稿编制】
审计员:我要手动填这50张表…
(复制粘贴财务数据)
(计算比率)
(画趋势图)
(写分析说明)
(检查勾稽关系)
(发现错误,重新算…)
耗时:3-5天/个项目
【Agent Swarm方案】
效果:
时间从3-5天缩短到2小时
勾稽错误0容忍(Agent C专门负责检查)
可追溯(每个数字都有数据源和计算公式)
最让我兴奋的是我突然发现,相比于以往,我好像没有短板,所有的短板都被AI完美的补上了。
第三部分:在类龙虾服务上部署Agent集群(附提示词模板)
为什么选OpenClaw/Workbuddy这种类龙虾服务上?
类龙虾服务本身多Agent编排框架,该有的都有:
-
YAML配置即代码— 不需要写复杂代码
-
支持Swarm模式— Agent间可以动态传递任务
-
并行执行— 多个Agent同时工作
-
错误处理完善— 自动重试、调整策略
另外,我让KIMI自己写了下KIMI集群的原理
我没有技术背景,不知道这个算不算“蒸馏”。前段时间刷到一个视频,大概是一个没代码背景的人在分享vibe coding然后被程序员指点,其实他不是真正懂技术。这个的确是,不过我觉得在这个时代受益于AI技术的突飞猛进,像我这样平庸的人的能力是被大大增强了。但我说不清原理,也不装逼,多谈谈感受吧。
以下内容加上提示词复制给OpenClaw/Workbuddy就可以了,如果觉得不够可以让OpenClaw/Workbuddy自己找找网上好的方案补充实现下就可以了。
然后我给KIMI的提示词如下:
帮我详细说一下KIMI agent集群的原理,有没有可能在龙虾上复用。把相关提示词帮我生成,我想在龙虾上也实现KIMI AGENT集群的高质量效果。
他给我的回复如下:
(以下内容没有排版过,但是可以复用。如果没有特别感兴趣,看到这里就好了)
一、Kimi Agent集群的核心原理
|
层级 |
功能 |
关键机制 |
|
1. 总调度层(Orchestrator) |
任务分解与动态分派 |
通过RL训练,自主决定「何时并行、如何拆分」,而非预设流程图 |
|
2. 角色涌现层(Emergent Roles) |
现场生成专业分身 |
根据任务即时创建「财报研究员」「代码审计员」「事实核查员」等,不绑定固定岗位 |
|
3. 并行执行层(Sub-agents) |
多路并发处理 |
最多100个子Agent同时工作,各自拥有独立上下文,累计1500次工具调用 |
|
4. 动态中继层(3D编排) |
中途对齐与信息交换 |
关键节点暂停,子Agent交换发现、互相校准,再进入下一阶段(区别于Manus的「2D并发」——各干各的,最后堆结果) |
|
5. 交叉验证层(Verification) |
自动纠错与冗余消化 |
不试图消灭单Agent幻觉,而是用并行制造冗余,用验证层消化误差,全程透明可追溯 |
二、在龙虾上复用的可行性分析
|
Kimi原生能力 |
Obsidian复用方案 |
工具/方法 |
|
动态任务分解 |
预设「总调度提示词」作为入口 |
Templater模板 / Canvas白板 |
|
100个子Agent并行 |
单会话内角色轮转(快速切换上下文) |
分阶段粘贴提示词,或用API插件(如Obsidian OAI) |
|
3D编排(中途对齐) |
强制「中继站」笔记节点 |
Canvas卡片或Mermaid流程图 |
|
交叉验证 |
内置「反驳Agent」与「核查清单」 |
提示词中嵌入验证指令 |
|
1500次工具调用 |
人工介入搜索 + AI整理 |
Web Search + Note Refactor |
三、可直接使用的提示词系统(四件套)
套件A:总调度入口提示词(Orchestrator)
|
任务ID |
角色 |
任务描述 |
输入 |
输出格式 |
依赖 |
并行性 |
|
T1 |
… |
… |
… |
… |
无 |
✅可并行 |
|
T2 |
… |
… |
… |
… |
无 |
✅可并行 |
|
T3 |
… |
… |
… |
… |
T1,T2 |
❌需汇总后 |
套件B:子Agent专用提示词模板(5个核心角色)
B1. 深度研究员(Deep Researcher)
B2. 事实核查员(Fact Checker)
|
原文摘录 |
问题类型 |
严重程度 |
修正建议 |
核查依据 |
|
… |
数据失实 |
高 |
… |
… |
B3. 批判性质疑员(Devil’s Advocate)
B4. 报告撰写员(Report Writer)
B5. 交叉验证协调员(Cross-Validator)
|
冲突点 |
涉及Agent |
裁决结果 |
依据 |
最终采用版本 |
|
… |
A vs B |
采纳B |
信源更权威 |
… |
|
“` |
套件C:Obsidian专用执行工作流(模拟3D编排)
套件D:一键式「伪集群」复合提示词(轻量版)
四、关键差异与预期管理
|
维度 |
Kimi原生Agent集群 |
Obsidian提示词模拟方案 |
|
并行度 |
真并行(100路同时) |
伪并行(单会话内角色轮转) |
|
工具调用 |
自动1500次 |
需人工介入搜索/计算 |
|
交叉验证 |
自动执行,透明可追溯 |
需手动在每个CV节点触发 |
|
灵活性 |
模型自主决定拆分 |
依赖预设模板,需人工调整 |
|
成本 |
API算力 |
主要是时间成本 |
结语:Agent集群 — 不是未来,是现在
Kimi的Agent Swarm已经向我们展示了多智能体协作的巨大潜力:
100个Agent并行工作,生成100页学术报告,0跑偏。
而这,仅仅是开始。
想象一下:
-
审计师把SQL数据库扔给Agent集群,2小时后拿到全套底稿。
-
研究员把40篇PDF扔给Agent集群,1小时后拿到文献综述。
-
工程师把需求文档扔给Agent集群,30分钟后拿到可运行代码。
这不是科幻,这是正在发生的事情。
夜雨聆风