AI协作的组织架构思维

这是 思想研习室TUS 公众号连续日更的第 120天，感谢您一如既往的陪伴

AI 协作的组织架构思维 — Prompt 之后的核心竞争力

核心洞察：AI 协作的本质不是"人机对话"，而是"组织管理"。未来竞争力不在于你能写多好的 Prompt，而在于你能设计多合理的 AI 团队架构。

为什么 Prompt 思维会撞墙？

大多数人把 AI 协作理解为"写好 Prompt"——打磨提示词、研究工程技巧、试图用一段完美指令榨干模型能力。这就像一个 CEO 试图用一封邮件让陌生人完成复杂项目。

问题不在于"你说了什么"，而在于"你建了什么样的协作结构"。

人类社会处理复杂协作从来靠的不是精确指令，而是组织架构——职能分工、汇报关系、权责边界、协作默契。这套东西打磨了几千年，从军队到企业全在用。与其为 AI 重新发明轮子，不如直接把它纳入这套已验证的体系。

💡 我的思考：这个类比非常精准。我过去花大量时间优化 Prompt 的措辞、格式、分步指令，但效果始终不稳定——因为单条指令天然无法承载复杂协作所需的全部上下文。真正有效的做法，是把 Agent 当成一个"新人入职"：你需要告诉它组织位置、岗位职责、行为角色，而不只是给它一份操作手册。

组织架构三要素：给 AI 一个"组织身份"

一个人加入公司，第一天会被告知三件事：你在哪个部门（组织）、你的岗位是什么（职位）、你应该怎么做事（角色）。管理 AI Agent，逻辑完全一样。

第一层：组织（Organization）— Context 层

定义"你在系统中的位置与协作关系"。Agent 需要知道：谁是上游、谁是下游、和谁对齐信息、和谁交接产出物。

没有组织上下文的 Agent 就像空降兵被丢在战场上却没有通讯频道——个人能力再强也无法融入协作。

第二层：职位（Position）— Responsibilities & Boundaries 层

定义"你的权责边界"。Agent 需要清楚自己该做什么、不该做什么。测试 Agent 不该去改代码，编码 Agent 不该自己决定产品方向。

权责不清是所有组织混乱的根源。对人如此，对 AI 同样。

第三层：角色（Role）— Identity & Persona 层

定义"你是谁"。角色不是花哨的人设，而是行为模式的锚点。一个"高级项目经理"和"初级实习生"面对同样的问题，会给出完全不同的回应——不是因为他们掌握的信息不同，而是角色定义决定了思考的深度和维度。

💡 我的思考：三要素的优先级很清晰——组织先解决"你在哪"，职位再解决"你该做什么"，角色最后解决"你怎么做"。大多数人在用 AI 时直接跳到第三层（给它一个人设），却忽略了前两层。这就是为什么"角色扮演式 Prompt"效果有限：没有组织上下文和权责边界，角色定义就是空中楼阁。

沟通方式的转变：从"下指令"到"设定情境"

传统 Prompt 是命令式的：“帮我写一篇关于 X 的文章，要求 XXX”。

但当你把 Agent 当作团队成员，沟通方式应该是情境式的。借鉴 BDD（行为驱动开发）的 Given-When-Then 框架：


          1
2
3
4
5
          
            Given  我是一个拥有5年经验的高级项目经理
And    我正在处理一个紧急的资源冲突
When   用户请求提供解决方案
Then   我应提供三个基于优先级的选项
And    我应使用专业的商业语气

这不是一个"指令"，而是一个"角色行为规范"。它定义的不是"做这一件事"，而是"在这类情境下，你应该怎么做"。

前者是一次性的，后者是可复用的。前者需要每次都精心编写，后者一旦定义好，Agent 就能在相似场景中自主决策。

💡 我的思考：这个转变本质上就是从"命令下属做一件事"到"给下属一个岗位说明书"。好的 JD 不会写"今天做 A、明天做 B"，而是写"你的职责是 X，在 Y 情境下你应该 Z"。这解释了为什么 ChatGPT 的 Custom Instructions 效果有限——它更像一份操作手册，而不是一份 JD。

一个真实的困惑：我的 Agent 用完就忘，这正常吗？

我用 Agent 写项目的时候，有一个反复出现的体验：每次开始新对话，它完全不记得上一次我们讨论了什么。我得把背景重新说一遍，把需求重新解释一遍，把之前的约定重新交代一遍。

一开始我觉得这是 bug，后来发现这是默认行为。LLM 本身没有持久记忆，每次对话都是全新的"失忆状态"。

市面上的解法分两类：

第一类：给 Agent 加记忆。 比如 Cursor 的项目记忆、Claude 的 memory 功能、AutoGPT 的长期记忆存储。本质上就是在每次对话开始时，自动把之前的上下文摘要注入进去。

第二类：给 Agent 加工具。 比如让它把决策写进文件，下次启动时自动读取。或者搭建一个知识库，让 Agent 在执行任务前先检索相关历史。

但这两类方案都有一个共同问题：记忆越多，上下文越长，每一步的注意力就被稀释得越厉害。 你塞了 1000 条历史记录进去，Agent 反而对当前任务的关键信息视而不见。

这让我产生了一个判断：

💡 我的判断：当前阶段，与其追求"Agent 记住一切"，不如追求"Agent 每次都能快速进入状态"。具体来说——把关键信息从"对话记忆"变成"项目文件"。不是让 Agent 记住上次聊了什么，而是让项目本身的结构和文档永远在告诉 Agent “现在是什么情况”。README、任务看板、决策记录——这些才是 Agent 真正的"长期记忆"，而且不会随着对话结束而消失。

从"记忆问题"延伸出的更大问题

"用完就忘"这件事暴露了一个深层矛盾：

LLM 的能力设计是"无状态的"，但人类的工作方式是有状态的。 你不可能让一个同事每天失忆、重新入职，但这就是我们使用 Agent 的方式。

这意味着，Agent 的组织架构设计本质上是在弥补一个根本性的能力缺失——不是管理学意义上的缺失，而是工程实现上的缺失。

从这个角度看，文章提出的三要素（组织、职位、角色）与其说是"管理方法论"，不如说是一套在无状态工具上模拟有状态协作的工程补丁。就像在单机游戏里模拟联网体验——能做，但永远有延迟和损耗。

💡 我的判断：这个补丁会随着模型能力提升而逐渐消失。当 Agent 有了真正的持久记忆、更大的上下文窗口、更强的推理能力时，"组织架构"的重量会下降，"直接对话"会变得更高效。现在投入大量精力设计 Agent 团队架构，可能是在为一个即将过时的范式做准备。 更务实的策略是：用最简单的方式把当前任务做好，同时关注模型能力的演进，随时准备切换到更直接的工作方式。

一个我用亲身经历验证过的瓶颈

我试着给 Agent 写过"岗位说明书"——用 Given-When-Then 格式定义角色行为规范，把组织、职位、角色三要素都写清楚。写完的那一刻觉得完美，结果 Agent 一跑就露馅：

我写了"测试 Agent 不该修改代码"，但没有定义"什么算修改代码"——它把配置文件里的注释也算进去了
我写了"编码 Agent 在明确边界内产出"，但"明确边界"本身就是我模糊定义的
我写了"规划 Agent 负责任务拆解"，但拆解粒度该多细？我没写，它也判断不了

每次出问题，我都发现根因不在 Agent，在我自己——我对任务的拆解不够细，对边界条件的列举不够全，对"做到什么程度算好"没有清晰标准。 三要素框架告诉我"你需要定义这些"，但没告诉我"定义到什么精度才够用"。

这让我意识到一件事：三要素框架的真正难度不在于"知道要定义"，而在于"定义到足够的粒度"。 而粒度的把握，完全依赖你对这个任务本身的经验。

💡 我的判断：三要素框架的正确用法不是"按框架填空"，而是暴露你自身认知的盲区。每次 Agent 出错，不应该去改 Agent 的角色定义，而应该反问自己："我是不是对这件事的理解还不够深？"框架的真正价值是作为一面镜子，照出你自己的经验缺口——而不是作为一套工具，让没有经验的人凭空设计出好的 Agent 团队。

多 Agent 的"信任半径"：被文章跳过的隐性成本

有一个核心问题：Agent 之间能不能建立信任？

人类团队的信任建立在长期协作上——我知道你的能力边界在哪里，所以我敢把东西交给你。但 Agent 团队的信任只能建立在显式契约上：

规划 Agent 的输出必须符合什么格式，编码 Agent 才能正确解析？
编码 Agent 的代码必须满足什么标准，测试 Agent 才能准确判断？
如果规划 Agent 的拆解有歧义，编码 Agent 是猜还是问？

每个接口都是一个潜在的故障点。 三个 Agent 意味着至少三个接口，每个接口都需要明确的输入输出契约。而契约的设计和维护成本，文章完全没有提及。

💡 我的判断：在 Agent 能力还不够强的时候（比如当前），少即是多。两个 Agent 比三个 Agent 好，一个全能 Agent 可能比两个专精 Agent 更好——因为接口越少，故障点越少。只有当单个 Agent 确实无法在上下文窗口内完成全部工作时，拆分才有意义。不要为了"架构好看"而拆分。

适用范围：三要素在什么场景下会失灵？

对于场景是"规划→编码→测试"的软件开发场景，这个场景有一个特点：任务边界相对清晰，产出可以客观验证（代码能不能跑、测试能不能过）。

但这不是大多数人使用 AI 的场景。更多人的场景是模糊的：

“帮我做个市场调研”——产出标准是什么？
“帮我写个方案”——怎么判断写得好不好？
“帮我分析数据”——分析到什么程度算够？

在这些模糊场景下，三要素框架就开始失灵了——你很难给一个"选题 Agent"定义清晰的权责边界，因为"什么选题好"本身就依赖于主观判断。

💡 我的判断：这套方法论的适用范围比文章暗示的要窄。它适合可验证产出的结构化任务（开发、写作、数据处理），不适合需要主观判断的非结构化任务（创意构思、战略决策、人际沟通）。文章把"AI 协作"当成一个统一问题来处理，但实际上至少存在两种截然不同的协作模式——工程型协作和判断型协作——需要完全不同的组织架构。

我现在是怎么做的——以及为什么有意"不架构"

经历了上面说的那些坑之后，我现在的实际工作方式是：一个 Agent，一个文件，一条约定。

一个 Agent：不拆分。让同一个 Agent 全程负责，避免接口损耗和信息衰减。
一个文件：把所有上下文（背景、目标、约束、进展）写进一个项目文件，每次启动时自动加载。
一条约定：Agent 每次结束前必须把本次决策写回这个文件。

没有组织架构，没有角色定义，没有流水线。效果反而比之前精心设计的三 Agent 方案好——因为所有信息都在一个地方，没有交接，没有损耗。

我并不是说三要素框架错了。而是在当前 Agent 能力水平下，架构的复杂度超过了它带来的收益。就像一个 3 人的小公司不需要完整的人力资源部门一样——1 个人 + 1 个 Agent，用最简单的方式协作就够了。

💡 我的判断：三要素框架的真正价值不是"教你现在怎么搭建 Agent 团队"，而是建立一种思维方式——让你从"给机器下指令"切换到"与协作者分工"。这种思维方式是持久的，但具体的架构形式会随着工具进化而变化。现在要做的不是照搬框架，而是带着这种思维方式，用最简单的方式解决当前的问题——不要被方法论绑架。