我是怎么一步步搭起AI团队的

写在前面

上一篇，我讲了一个让我豁然开朗的认知：

AI工具用得越多却越低效，根源不是工具问题，是组织问题。

传统的三种AI分工方式——按模型能力、按任务类型、按工具权限——各有各的局限。

但"发现问题"只是第一步。

这一篇，我想讲得更具体：

我到底是怎么一步步搭起自己的Multi-Agent系统的？走了哪些弯路，用了什么管理框架解决协作问题，现在这套系统长什么样。

不涉及代码。但会很具体。

第一阶段：单兵作战的天花板

最开始，我的AI使用方式非常原始。

把一个问题丢给一个AI，等它回答，再把答案搬到下一个工具里。

这个阶段的生产力提升是真实的—— 文档撰写速度提升了，信息整理效率高了，很多原本需要几小时的工作缩短到了几十分钟。

但随着工作复杂度提升，天花板很快出现了。

我管理的项目数量在增加，每个项目都有自己的里程碑、健康状态、风险点、关键干系人。

单个AI工具无法同时持有这些上下文，每次对话都需要我重新喂背景信息。

这本身就是一种巨大的隐性成本——不是AI在浪费时间，是我在反复喂背景的过程中浪费时间。

更深层的问题是：

AI工具帮我执行，但没有帮我管理。

它能帮我写一封措辞得当的邮件，但不知道这封邮件背后的项目风险有多高。

它能帮我整理一份数据表格，但不理解这些数据代表的业务含义。

上下文的割裂，让AI永远只能是工具，而不能成为真正的协作者。

这让我意识到一件事：

AI协作的价值，不在于单个工具的能力有多强，而在于上下文能否跨工具、跨时间持续积累。

这个认知，是我后来构建Multi-Agent系统的真正起点。

第二阶段：引入记忆与分工

意识到上下文断裂的问题之后，我做的第一件事是：

建立一个统一的知识库。

不是某个SaaS产品里的知识库，而是一套结构化的本地文档体系，包含：

我负责的所有项目的状态摘要
关键干系人信息和沟通风格
历史决策记录
我个人的工作偏好和行事风格

这个知识库成为了所有AI Agent共享的"长期记忆"。

每次启动一个AI会话，首先加载相关的知识库内容作为上下文；每次会话结束，产生的有价值信息更新回知识库。

效果是显著的。

AI开始能记住"上次这个项目遇到过什么风险"、 "这个干系人的沟通风格是什么"、 "我们团队处理类似问题的标准流程是什么"。

对话的质量从"一次性咨询"升级到了"持续协作"。

在这个基础上，我开始做分工：

Text
规划分析Agent：持有完整上下文，擅长推理
系统操作Agent：有权限访问内部系统，负责执行
技术实现Agent：与本地开发环境紧密集成

这个阶段的核心收益不是速度，而是认知负担的降低。

我不再需要在多个工具之间手动搬运信息，也不再需要为每个工具反复解释背景。

AI开始真正理解我的工作，而不只是响应我的指令。

第三阶段：用管理框架重构架构

随着Agent数量增加，新的问题出现了：

职责模糊，边界不清。

某些任务，两个Agent都"觉得"自己应该处理，于是产生重复输出或相互矛盾的结果。

某些任务，两个Agent都在等对方，形成死锁。

某些流程，信息在Agent之间流转时发生了损耗，导致最终输出质量下降。

这些问题，让我想起了在项目管理中非常经典的一类团队困境：

角色模糊。

当一个团队里，大家都不清楚"这件事谁最终负责"的时候，要么所有人都去抢，要么所有人都在等别人来做。

解决方案也是相似的——

用RACI矩阵，明确每个Agent在每类任务中的角色：

Text
R（Responsible）：谁来执行
A（Accountable）：谁来决策
C（Consulted）：谁需要被咨询
I（Informed）：谁需要被通知

用这个框架重新梳理Agent的职责之后，协作质量明显提升。

更重要的是，这套框架给了我一个可扩展的架构语言：

当我需要新增一个Agent的时候，不是"找个模型来凑"，而是"识别出系统里缺少哪个RACI角色，然后填补它"。

这个阶段让我深刻意识到：

Multi-Agent的系统设计，和团队组织设计，在本质上遵循同一套逻辑。

第四阶段：引入层级结构

随着协作场景越来越复杂，平行分工的局限性开始显现。

某些任务需要动态调度多个Agent协同完成，这要求有一个"懂全局"的角色来做任务分解和结果聚合。

于是我引入了层级结构：

Text
主调度Agent（管理层）
→ 接收指令
→ 理解意图
→ 分解任务
→ 分配给合适的执行Agent
→ 收集结果
→ 整合输出
执行层各Agent
→ 只负责自己那部分
→ 不需要关心全局

这个结构，和公司里的"中台"模式非常相似：

中台负责能力的复用和协调，前台（执行层）负责具体业务场景，总部（调度层）负责战略决策。

层级结构带来的最大收益，是复杂任务的成功率显著提升。

以前需要我手动拆解、逐步引导的复杂工作流，开始可以通过一条指令触发，由主调度Agent自动完成分解和协调。

这不只是效率的提升，更是认知外包的升级：

Text
从外包执行
→ 到外包规划
→ 到外包协调

每一层外包，都把我从更高度重复的认知劳动中解放出来，让我能专注在真正需要人类判断的决策点上。

现在这套系统长什么样

四个阶段迭代下来，我用一张组织架构图来描述现在这套系统的全貌。

它看起来真的很像一家公司：

Text
你（目标设定·决策·评估）
唯一不可被AI替代的角色
        ↓
总经理（主调度Agent）
意图理解·任务分解·结果聚合
        ↓
━━━━━━━━━━━━━━━━
第一梯队·核心架构部（地基）
━━━━━━━━━━━━━━━━
黑板架构部    事件总线部
（共享状态）   （异步通信）
技能沉淀部    层级协作部
（经验提炼）   （复杂任务分包）
━━━━━━━━━━━━━━━━
第二梯队·能力增强部（稳定性）
━━━━━━━━━━━━━━━━
工具标准化部  状态管理部  评估体系部
━━━━━━━━━━━━━━━━
第三梯队·高级特性部（自治进化）
━━━━━━━━━━━━━━━━
自进化部    自治管理部   长程规划部
━━━━━━━━━━━━━━━━
横向支撑：档案与记忆部（全局共享）
━━━━━━━━━━━━━━━━

三个梯队不是平行关系，而是建设优先级和能力依赖的层次关系。

第一梯队是地基，没有它第二梯队无法稳定运行；第二梯队建立稳定性，是第三梯队自治能力的前提。

先把地基打好，再谈自治。

这个顺序，和盖楼一样，不能颠倒。

三条贯穿全局的设计原则

在这套架构里，有三条原则我认为最重要，不管你的系统规模大小，都值得从第一天就写进设计里：

原则一：权限边界优先

设计任何Agent的职责之前，首先问的问题不是"这个Agent能做什么"，而是"这个Agent能接触到什么"。

权限边界由运行环境决定，是最稳定的维度。内网系统的访问权限不会因为模型升级而改变，本地文件的物理位置不会随业务调整而变化。

以权限边界为第一划分维度，能确保架构的稳定性不依赖于快速变化的技术参数。

原则二：主脑必须是本地的

持有最完整状态和最敏感信息的节点，必须运行在本地。

原因有三：隐私保护、稳定性、成本控制。

其他节点都应该尽可能无状态—— 任务完成后清空临时数据，结果推回本地主脑。

原则三：架构要为"切换"而设计

路由规则与执行逻辑必须分离。

所有"在什么情况下用什么方案"的决策，都应该写在可热重载的配置文件里，而不是嵌入代码。

业务场景在变，模型能力在进化，成本预算在波动—— 一个好的架构，必须把这种动态性内化为系统能力，让切换变成修改配置，而不是重写代码。

写在最后

这四个阶段走下来，我最深的一个感受是：

搭AI团队这件事，和带人类团队，用的是同一套底层直觉。

识别职责边界，建立共享信息，明确谁做决策，设计协作流程，处理冲突和例外，让系统能持续进化。

这些，都是管理者早就在做的事。

只是现在，执行这些设计的，变成了AI。

下一篇，我想聊一个更大的问题：

大模型让执行变得廉价之后，管理能力为什么反而更值钱了？不是安慰，是有逻辑的推断。