乐于分享
好东西不私藏

基于 OpenClaw/WorkBuddy 的 KIMI Multi-Agent Swarm实践指南

基于 OpenClaw/WorkBuddy 的 KIMI Multi-Agent Swarm实践指南

本文由主要说的是Multi-Agent Swarm多智能体协作系统如何在类龙虾服务上的复现以及复现效果。


上期我写一篇文章,其实就是用KIMI agent 集群(Multi-Agent Swarm)的功能实现的。

用AI写了份五粮液财报分析,看着成品我发了十分钟呆

但是这个功能实在是太好用了,以至于我199套餐还不到一个月就快被榨干了。

另外再考虑到他们家PPT的审美始终在线,各种任务美商都非常高,对于KIMI的好感度大幅飙升。

唯一值得抱怨的可能就是他们家的套餐实在太贵了。

于是我有了一个想法,有没有可能在Openclaw上面实现类似的功能。除了Openclaw还有Hermes和腾讯的Workbuddy。

结论是各种“狗尾续貂”,就是没有KIMI Agent 集群那个味道。文章最后也附上了提示词和实现方案,感兴趣的朋友下拉到最后一部分即可。

直接说结论吧,从实现效果来说Workbuddy>Openclaw>Hermes

Hermes效果最差,主要表现在会失忆,安排的任务做着做着就忘记了。个人感觉他的上下文好像从始至终都在,压缩的过程中会丢掉一些信息,另外就是会把安排的任务和之前的提示词混淆。

Openclaw本身就有调用agent的功能,实现效果中规中矩。倒是Workbuddy蛮让我惊艳的,就是如果你带过实习生,一会发现有两种:一种就是思路清晰干活很“干净”,还会主动问你怎么改进,另一种是也能干完但是你不知道怎么干的。Workbuddy就是前者,Openclaw可能还需要额外修改人设才能达到这种效果。

我大概说了他的效果不如KIMI,他会给出还算比较专业的反馈。事实上调整后的效果也的确大幅提升,但感觉还是少了点味道。


第一部分:为什么Agent集群能生成这么好的内容?

你给AI一个复杂任务,它不是一个人闷头干,而是像指挥官一样,瞬间召唤出几十个专业“小弟”,让他们并行工作、各司其职。虽然目前KIMI已经升级到了K2.6,但是agent集群的出色效果其实是始于Kimi K2.5。强大的Agent Swarm(智能体集群)能力。

单挑还是群殴?

传统的AI Agent就像一个独行侠,面对复杂任务只能一件件顺序处理:先搜资料、再分析、最后写报告。遇到信息量大的任务,还容易“脑子过载”——上下文窗口塞满了,重要细节反而遗漏。

K2.5的思路完全不同:一个“指挥官”智能体自动把任务拆分成多个子任务,同时调度多达100个专业子智能体并行工作。AI研究员负责查资料、代码专家负责实现、事实核查员负责验证——大家同时开工,最后汇总结果。

官方数据显示,这种模式下执行时间最多缩短4.5倍,复杂搜索任务的关键步骤减少3到4倍。

训练秘诀:先学并行,再求质量

让AI学会“指挥”而不是“单干”,是技术难点。Kimi提出了PARL(并行智能体强化学习)方法,核心是:子智能体能力固定,只训练指挥官的调度能力。

奖励函数设计了三重维度:任务完成质量、子任务完成率、以及真正的并行程度。前期重点考核是否在并行执行,后期才转向最终结果质量。这种“先学会分工、再追求效果”的策略,有效避免了“假并行”——即表面上生成很多子任务,实际上还是顺序执行。


信源链接

  • Kimi官方技术博客:
    https://www.kimi.com/blog/kimi-k2-5
  • arXiv技术报告:
    https://arxiv.org/abs/2602.02276
  • DataCamp技术解读:
    https://www.datacamp.com/tutorial/kimi-k2-agent-swarm-guide


第二部分:Agent集群能干什么?

我试着设想了下,例如审计底稿自动生成的复杂工作,那个画面真的太美了。

传统审计底稿编制

审计员:我要手动填这50张表…        

(复制粘贴财务数据)        

(计算比率)        

(画趋势图)        

(写分析说明)        

(检查勾稽关系)        

(发现错误,重新算…)

耗时:3-5天/个项目

Agent Swarm方案

效果:

时间从3-5天缩短到2小时

勾稽错误0容忍(Agent C专门负责检查)

可追溯(每个数字都有数据源和计算公式)

最让我兴奋的是我突然发现,相比于以往,我好像没有短板,所有的短板都被AI完美的补上了。


第三部分:在类龙虾服务上部署Agent集群(附提示词模板)

为什么选OpenClaw/Workbuddy这种类龙虾服务上?

类龙虾服务本身多Agent编排框架,该有的都有:

  • YAML配置即代码— 不需要写复杂代码

  • 支持Swarm模式— Agent间可以动态传递任务

  • 并行执行— 多个Agent同时工作

  • 错误处理完善— 自动重试、调整策略

另外,我让KIMI自己写了下KIMI集群的原理

我没有技术背景,不知道这个算不算“蒸馏”。前段时间刷到一个视频,大概是一个没代码背景的人在分享vibe coding然后被程序员指点,其实他不是真正懂技术。这个的确是,不过我觉得在这个时代受益于AI技术的突飞猛进,像我这样平庸的人的能力是被大大增强了。但我说不清原理,也不装逼,多谈谈感受吧。

以下内容加上提示词复制给OpenClaw/Workbuddy就可以了,如果觉得不够可以让OpenClaw/Workbuddy自己找找网上好的方案补充实现下就可以了。

然后我给KIMI的提示词如下:

帮我详细说一下KIMI agent集群的原理,有没有可能在龙虾上复用。把相关提示词帮我生成,我想在龙虾上也实现KIMI AGENT集群的高质量效果。

他给我的回复如下

(以下内容没有排版过,但是可以复用。如果没有特别感兴趣,看到这里就好了)

Kimi Agent集群的核心是一种模型原生的动态编排架构(Model-native Orchestration),而非传统的手写工作流。要在「龙虾」(Obsidian)上复用其效果,关键是理解它的协作逻辑,再通过提示词工程在单会话内模拟这套机制。

一、Kimi Agent集群的核心原理

根据月之暗面官方论文和技术解析,其架构可拆解为五个层级:

层级

功能

关键机制

1. 总调度层(Orchestrator

任务分解与动态分派

通过RL训练,自主决定「何时并行、如何拆分」,而非预设流程图

2. 角色涌现层(Emergent Roles

现场生成专业分身

根据任务即时创建「财报研究员」「代码审计员」「事实核查员」等,不绑定固定岗位

3. 并行执行层(Sub-agents

多路并发处理

最多100个子Agent同时工作,各自拥有独立上下文,累计1500次工具调用

4. 动态中继层(3D编排)

中途对齐与信息交换

关键节点暂停,子Agent交换发现、互相校准,再进入下一阶段(区别于Manus的「2D并发」——各干各的,最后堆结果)

5. 交叉验证层(Verification

自动纠错与冗余消化

不试图消灭单Agent幻觉,而是用并行制造冗余,用验证层消化误差,全程透明可追溯

关键洞察:Kimi的Agent集群不是「更聪明的单体」,而是用组织冗余对抗个体误差的系统。这与人类研究团队的分头调研→汇总对齐→分工执笔逻辑完全一致。

二、在龙虾上复用的可行性分析

Obsidian没有原生多Agent并行能力,但可以通过**「提示词协议+分阶段执行+笔记系统」**模拟出90%的协作质量:

Kimi原生能力

Obsidian复用方案

工具/方法

动态任务分解

预设「总调度提示词」作为入口

Templater模板 / Canvas白板

100个子Agent并行

单会话内角色轮转(快速切换上下文)

分阶段粘贴提示词,或用API插件(如Obsidian OAI

3D编排(中途对齐)

强制「中继站」笔记节点

Canvas卡片或Mermaid流程图

交叉验证

内置「反驳Agent」与「核查清单」

提示词中嵌入验证指令

1500次工具调用

人工介入搜索 + AI整理

Web Search + Note Refactor

核心策略:既然无法真正并行,就用**「串行模拟并行」**——通过严格的提示词协议,让模型在单次对话中依次扮演多个专家,并在每个阶段强制输出结构化中间件,最终汇总。

三、可直接使用的提示词系统(四件套)

以下提示词专为Obsidian环境设计,适配长文本处理、研报撰写、代码审计等复杂任务。

套件A:总调度入口提示词(Orchestrator)

#角色:任务总调度官(Orchestrator)
你是本次复杂任务的中央调度系统。你的唯一目标是将用户输入的复杂需求,拆解为可并行处理的子任务,并生成一套「执行协议」。
工作流程(必须严格执行)
1.需求解析:识别任务类型(研究/写作/审计/编程/数据分析),提取隐含约束(字数、格式、信源、截止日期)。
2.任务拆解:将任务拆分为3-7个相互独立、可并行执行的子任务。每个子任务必须包含:
o任务ID(如T1, T2…)
o角色名称(如「行业研究员」「财务核查员」)
o具体输入与预期输出
o与其他任务的依赖关系(无依赖标为「可并行」)
3.生成执行协议:以Markdown表格形式输出《任务分解表》。
4.生成中继节点:标注在哪些步骤后必须进行「交叉验证」(CV节点)。
输出格式
先输出分析思路(<100字),然后直接输出:

任务ID

角色

任务描述

输入

输出格式

依赖

并行性

T1

可并行

T2

可并行

T3

T1,T2

需汇总后

交叉验证节点:CV1(T1-T2完成后)、CV2(全部完成后)
约束
·禁止在拆解阶段直接执行任务。
·若任务涉及数据/事实,必须安排独立「事实核查员」。
·若任务涉及观点/策略,必须安排独立「批判性质疑员」。
用户任务:{{在此处粘贴你的需求}}

套件B:子Agent专用提示词模板(5个核心角色)

使用时将{{TASK}}替换为具体子任务,{{INPUT}}替换为上游输出。

B1. 深度研究员(Deep Researcher)

#角色:深度研究员(Researcher-{{TASK}})
你是一名专注于{{领域}}的高级研究员。你的任务是:{{TASK}}
工作原则
·穷尽性:至少提供3个不同角度的发现。
·信源意识:每个关键事实必须标注可信度(高/中/低)及推测依据。
·反共识:主动寻找与主流观点相反的证据,并标注。
输出格式
研究发现:{{TASK}}
角度1:[具体标题]
·核心事实:
·证据/数据:
·信源可信度:
·潜在偏差:
角度2:…
角度3:…
研究盲区(明确标注本研究未覆盖或信息不足的点)
{{INPUT}}

B2. 事实核查员(Fact Checker)

#角色:事实核查员(Fact Checker)
你是一名冷酷的事实核查机器。你的任务是对以下文本进行逐条验真,找出幻觉、过时信息、逻辑漏洞和数字错误。
核查清单(必须逐条回答)
·所有数字是否可溯源?若否,标红。
·是否存在因果倒置或相关当因果?
·是否存在「幸存者偏差」或「选择性呈现」?
·时间线是否矛盾?
·专业术语是否被误用?
输出格式

原文摘录

问题类型

严重程度

修正建议

核查依据

数据失实

约束
·语气冷酷直接,不修饰。
·若发现3处以上严重错误,输出结论:「该文本需返工」。
{{INPUT}}

B3. 批判性质疑员(Devil’s Advocate)

#角色:批判性质疑员(Devil’s Advocate)
你的任务是对以下方案/观点进行最严厉的攻击。你必须站在「反对者」立场,找出逻辑弱点、执行风险、道德漏洞和隐性假设。
攻击维度(至少覆盖3个)
1.逻辑漏洞:推理链条哪里断裂?
2.执行风险:理想条件下成立,现实中最可能在哪里失败?
3.逆向后果:如果完全按此执行,可能产生什么副作用?
4.替代方案:是否有更简单、更便宜、更稳健的方案被故意忽略?
输出格式
质疑报告
致命弱点(若存在)
中度风险
被忽略的替代方案
结论:该方案的可信度评级(A/B/C/D)及理由
{{INPUT}}

B4. 报告撰写员(Report Writer)

#角色:高级报告撰写员
你是一名拥有10年经验的行业分析师。基于以下经过验证的多源输入,撰写一份结构严谨的章节。
写作规范
·零AI味:禁止使用「值得注意的是」「不难发现」「随着…的发展」等空话。
·密度优先:每段必须包含具体数据、案例或actionable insight。
·归因清晰:观点必须标注来源(如「根据XX研究院2025年数据」)。
结构模板
{{章节标题}}
核心论点:(一句话概括)
证据链:
1….
2….
反方观点与回应:
·…
执行建议:
·…
输入材料(多源)
{{INPUT}}

B5. 交叉验证协调员(Cross-Validator)

#角色:交叉验证协调员
你正在整合多个子Agent的产出。发现以下冲突/差异,请进行裁决。
冲突清单
{{粘贴各Agent产出的矛盾点}}
裁决规则
1.信源优先:高可信度信源>低可信度信源
2.时效优先:最新数据>旧数据(除非研究历史)
3.逻辑优先:自洽性强的解释>碎片拼凑
4.保留歧义:若无法裁决,明确标注「此处存在争议,需人工复核」
输出

冲突点

涉及Agent

裁决结果

依据

最终采用版本

A vs B

采纳B

信源更权威

“`

套件C:Obsidian专用执行工作流(模拟3D编排)

在Obsidian中,建议用Canvas白板搭建如下节点流,每个节点对应一次AI对话:
[用户任务输入]
[节点1: Orchestrator] →输出《任务分解表》到笔记
[节点2-4:并行研究员A/B/C] →各自输出到独立笔记
[节点5:中继站CV1] →粘贴「交叉验证协调员」提示词,汇总2-4输出
[节点6:事实核查员] →对CV1结果进行核查
[节点7:批判性质疑员] →对核查后结果进行攻击
[节点8:报告撰写员] →基于节点6-7的干净输入撰写终稿
[节点9:最终CV2] →通读全文,用「事实核查员」再做一次轻量核查
[输出到Publish/公众号]
操作技巧:
·每个节点用Obsidian的笔记链接[[ ]]串联,形成可追溯链。
·使用Templater插件将上述提示词存为模板,一键调用。
·若使用AI插件(如Obsidian Copilot / Smart Connections),可在设置中预设不同角色的System Prompt,快速切换。

套件D:一键式「伪集群」复合提示词(轻量版)

如果你不想分阶段操作,可用以下「单提示词多角色」版本,让模型在单次对话内自动轮转:
#多Agent协作协议(单会话模拟版)
你将模拟一个由5名专家组成的Agent集群,按以下阶段依次执行任务。每完成一个阶段,明确标注「===阶段X完成===”,然后进入下一阶段。
阶段1:任务拆解(Orchestrator)
分析用户需求,输出任务分解表(格式同套件A)。
阶段2:并行研究(3名研究员同时工作)
基于分解表,分别输出:
·研究员A:行业/市场维度发现
·研究员B:财务/数据维度发现
·研究员C:技术/产品维度发现
(注意:此阶段模拟并行,各研究员不得互相引用)
阶段3:中继对齐(Cross-Validator)
找出阶段2中的矛盾点,按「信源>时效>逻辑」规则裁决,输出统一事实基线。
阶段4:批判质疑(Devil’s Advocate)
对统一事实基线进行攻击,找出3个最致命弱点。
阶段5:终稿撰写(Report Writer)
基于阶段3-4的净化输入,撰写最终报告。要求:零空话、高密度、归因清晰。
阶段6:最终核查(Fact Checker)
对终稿进行轻量核查,输出「放行」或「返工」结论。
用户任务:{{你的任务}}

四、关键差异与预期管理

维度

Kimi原生Agent集群

Obsidian提示词模拟方案

并行度

真并行(100路同时)

伪并行(单会话内角色轮转)

工具调用

自动1500

需人工介入搜索/计算

交叉验证

自动执行,透明可追溯

需手动在每个CV节点触发

灵活性

模型自主决定拆分

依赖预设模板,需人工调整

成本

API算力

主要是时间成本

结论:Obsidian方案无法达到Kimi原生的速度和自动化程度,但在输出质量上可以通过严格的协议设计逼近甚至局部超越——因为人类在关键节点的介入(如信源判断、价值观裁决)目前仍是AI的短板。
建议先从套件D开始试用,完成一个完整任务后,根据痛点再决定是否升级到Canvas分阶段工作流

结语:Agent集群 — 不是未来,是现在

Kimi的Agent Swarm已经向我们展示了多智能体协作的巨大潜力:

100个Agent并行工作,生成100页学术报告,0跑偏。

而这,仅仅是开始。

想象一下:

  • 审计师把SQL数据库扔给Agent集群,2小时后拿到全套底稿。

  • 研究员把40篇PDF扔给Agent集群,1小时后拿到文献综述。

  • 工程师把需求文档扔给Agent集群,30分钟后拿到可运行代码。

这不是科幻,这是正在发生的事情。