写在前面
上一篇,我讲了一个让我豁然开朗的认知:
AI工具用得越多却越低效,根源不是工具问题,是组织问题。
传统的三种AI分工方式——按模型能力、按任务类型、按工具权限——各有各的局限。
但"发现问题"只是第一步。
这一篇,我想讲得更具体:
我到底是怎么一步步搭起自己的Multi-Agent系统的?走了哪些弯路,用了什么管理框架解决协作问题,现在这套系统长什么样。
不涉及代码。但会很具体。
第一阶段:单兵作战的天花板
最开始,我的AI使用方式非常原始。
把一个问题丢给一个AI,等它回答,再把答案搬到下一个工具里。
这个阶段的生产力提升是真实的—— 文档撰写速度提升了,信息整理效率高了, 很多原本需要几小时的工作缩短到了几十分钟。
但随着工作复杂度提升,天花板很快出现了。
我管理的项目数量在增加, 每个项目都有自己的里程碑、健康状态、风险点、关键干系人。
单个AI工具无法同时持有这些上下文, 每次对话都需要我重新喂背景信息。
这本身就是一种巨大的隐性成本——不是AI在浪费时间,是我在反复喂背景的过程中浪费时间。
更深层的问题是:
AI工具帮我执行,但没有帮我管理。
它能帮我写一封措辞得当的邮件, 但不知道这封邮件背后的项目风险有多高。
它能帮我整理一份数据表格, 但不理解这些数据代表的业务含义。
上下文的割裂,让AI永远只能是工具,而不能成为真正的协作者。
这让我意识到一件事:
AI协作的价值,不在于单个工具的能力有多强,而在于上下文能否跨工具、跨时间持续积累。
这个认知,是我后来构建Multi-Agent系统的真正起点。
第二阶段:引入记忆与分工
意识到上下文断裂的问题之后,我做的第一件事是:
建立一个统一的知识库。
不是某个SaaS产品里的知识库, 而是一套结构化的本地文档体系,包含:
我负责的所有项目的状态摘要 关键干系人信息和沟通风格 历史决策记录 我个人的工作偏好和行事风格
这个知识库成为了所有AI Agent共享的"长期记忆"。
每次启动一个AI会话,首先加载相关的知识库内容作为上下文; 每次会话结束,产生的有价值信息更新回知识库。
效果是显著的。
AI开始能记住"上次这个项目遇到过什么风险"、 "这个干系人的沟通风格是什么"、 "我们团队处理类似问题的标准流程是什么"。
对话的质量从"一次性咨询"升级到了"持续协作"。
在这个基础上,我开始做分工:
Text
规划分析Agent:持有完整上下文,擅长推理
系统操作Agent:有权限访问内部系统,负责执行
技术实现Agent:与本地开发环境紧密集成
这个阶段的核心收益不是速度,而是认知负担的降低。
我不再需要在多个工具之间手动搬运信息, 也不再需要为每个工具反复解释背景。
AI开始真正理解我的工作,而不只是响应我的指令。
第三阶段:用管理框架重构架构
随着Agent数量增加,新的问题出现了:
职责模糊,边界不清。
某些任务,两个Agent都"觉得"自己应该处理, 于是产生重复输出或相互矛盾的结果。
某些任务,两个Agent都在等对方,形成死锁。
某些流程,信息在Agent之间流转时发生了损耗, 导致最终输出质量下降。
这些问题,让我想起了在项目管理中非常经典的一类团队困境:
角色模糊。
当一个团队里,大家都不清楚"这件事谁最终负责"的时候, 要么所有人都去抢,要么所有人都在等别人来做。
解决方案也是相似的——
用RACI矩阵,明确每个Agent在每类任务中的角色:
Text
R(Responsible):谁来执行
A(Accountable):谁来决策
C(Consulted):谁需要被咨询
I(Informed):谁需要被通知
用这个框架重新梳理Agent的职责之后,协作质量明显提升。
更重要的是,这套框架给了我一个可扩展的架构语言:
当我需要新增一个Agent的时候, 不是"找个模型来凑", 而是"识别出系统里缺少哪个RACI角色,然后填补它"。
这个阶段让我深刻意识到:
Multi-Agent的系统设计,和团队组织设计,在本质上遵循同一套逻辑。
第四阶段:引入层级结构
随着协作场景越来越复杂,平行分工的局限性开始显现。
某些任务需要动态调度多个Agent协同完成, 这要求有一个"懂全局"的角色来做任务分解和结果聚合。
于是我引入了层级结构:
Text
主调度Agent(管理层)
→ 接收指令
→ 理解意图
→ 分解任务
→ 分配给合适的执行Agent
→ 收集结果
→ 整合输出
执行层各Agent
→ 只负责自己那部分
→ 不需要关心全局
这个结构,和公司里的"中台"模式非常相似:
中台负责能力的复用和协调,前台(执行层)负责具体业务场景,总部(调度层)负责战略决策。
层级结构带来的最大收益,是复杂任务的成功率显著提升。
以前需要我手动拆解、逐步引导的复杂工作流, 开始可以通过一条指令触发, 由主调度Agent自动完成分解和协调。
这不只是效率的提升,更是认知外包的升级:
Text
从外包执行
→ 到外包规划
→ 到外包协调
每一层外包,都把我从更高度重复的认知劳动中解放出来, 让我能专注在真正需要人类判断的决策点上。
现在这套系统长什么样
四个阶段迭代下来, 我用一张组织架构图来描述现在这套系统的全貌。
它看起来真的很像一家公司:
Text
你(目标设定·决策·评估)
唯一不可被AI替代的角色
↓
总经理(主调度Agent)
意图理解·任务分解·结果聚合
↓
━━━━━━━━━━━━━━━━
第一梯队·核心架构部(地基)
━━━━━━━━━━━━━━━━
黑板架构部 事件总线部
(共享状态) (异步通信)
技能沉淀部 层级协作部
(经验提炼) (复杂任务分包)
━━━━━━━━━━━━━━━━
第二梯队·能力增强部(稳定性)
━━━━━━━━━━━━━━━━
工具标准化部 状态管理部 评估体系部
━━━━━━━━━━━━━━━━
第三梯队·高级特性部(自治进化)
━━━━━━━━━━━━━━━━
自进化部 自治管理部 长程规划部
━━━━━━━━━━━━━━━━
横向支撑:档案与记忆部(全局共享)
━━━━━━━━━━━━━━━━
三个梯队不是平行关系,而是建设优先级和能力依赖的层次关系。
第一梯队是地基,没有它第二梯队无法稳定运行; 第二梯队建立稳定性,是第三梯队自治能力的前提。
先把地基打好,再谈自治。
这个顺序,和盖楼一样,不能颠倒。
三条贯穿全局的设计原则
在这套架构里,有三条原则我认为最重要, 不管你的系统规模大小,都值得从第一天就写进设计里:
原则一:权限边界优先
设计任何Agent的职责之前, 首先问的问题不是"这个Agent能做什么", 而是"这个Agent能接触到什么"。
权限边界由运行环境决定,是最稳定的维度。 内网系统的访问权限不会因为模型升级而改变, 本地文件的物理位置不会随业务调整而变化。
以权限边界为第一划分维度, 能确保架构的稳定性不依赖于快速变化的技术参数。
原则二:主脑必须是本地的
持有最完整状态和最敏感信息的节点,必须运行在本地。
原因有三:隐私保护、稳定性、成本控制。
其他节点都应该尽可能无状态—— 任务完成后清空临时数据,结果推回本地主脑。
原则三:架构要为"切换"而设计
路由规则与执行逻辑必须分离。
所有"在什么情况下用什么方案"的决策, 都应该写在可热重载的配置文件里, 而不是嵌入代码。
业务场景在变,模型能力在进化,成本预算在波动—— 一个好的架构,必须把这种动态性内化为系统能力, 让切换变成修改配置,而不是重写代码。
写在最后
这四个阶段走下来, 我最深的一个感受是:
搭AI团队这件事,和带人类团队,用的是同一套底层直觉。
识别职责边界,建立共享信息, 明确谁做决策,设计协作流程, 处理冲突和例外,让系统能持续进化。
这些,都是管理者早就在做的事。
只是现在,执行这些设计的,变成了AI。
下一篇,我想聊一个更大的问题:
大模型让执行变得廉价之后,管理能力为什么反而更值钱了?不是安慰,是有逻辑的推断。
夜雨聆风