这是 思想研习室TUS 公众号连续日更的第 120天,感谢您一如既往的陪伴
AI 协作的组织架构思维 — Prompt 之后的核心竞争力
核心洞察:AI 协作的本质不是"人机对话",而是"组织管理"。未来竞争力不在于你能写多好的 Prompt,而在于你能设计多合理的 AI 团队架构。
为什么 Prompt 思维会撞墙?
大多数人把 AI 协作理解为"写好 Prompt"——打磨提示词、研究工程技巧、试图用一段完美指令榨干模型能力。这就像一个 CEO 试图用一封邮件让陌生人完成复杂项目。
问题不在于"你说了什么",而在于"你建了什么样的协作结构"。
人类社会处理复杂协作从来靠的不是精确指令,而是组织架构——职能分工、汇报关系、权责边界、协作默契。这套东西打磨了几千年,从军队到企业全在用。与其为 AI 重新发明轮子,不如直接把它纳入这套已验证的体系。
💡 我的思考:这个类比非常精准。我过去花大量时间优化 Prompt 的措辞、格式、分步指令,但效果始终不稳定——因为单条指令天然无法承载复杂协作所需的全部上下文。真正有效的做法,是把 Agent 当成一个"新人入职":你需要告诉它组织位置、岗位职责、行为角色,而不只是给它一份操作手册。
组织架构三要素:给 AI 一个"组织身份"
一个人加入公司,第一天会被告知三件事:你在哪个部门(组织)、你的岗位是什么(职位)、你应该怎么做事(角色)。管理 AI Agent,逻辑完全一样。
第一层:组织(Organization)— Context 层
定义"你在系统中的位置与协作关系"。Agent 需要知道:谁是上游、谁是下游、和谁对齐信息、和谁交接产出物。
没有组织上下文的 Agent 就像空降兵被丢在战场上却没有通讯频道——个人能力再强也无法融入协作。
第二层:职位(Position)— Responsibilities & Boundaries 层
定义"你的权责边界"。Agent 需要清楚自己该做什么、不该做什么。测试 Agent 不该去改代码,编码 Agent 不该自己决定产品方向。
权责不清是所有组织混乱的根源。对人如此,对 AI 同样。
第三层:角色(Role)— Identity & Persona 层
定义"你是谁"。角色不是花哨的人设,而是行为模式的锚点。一个"高级项目经理"和"初级实习生"面对同样的问题,会给出完全不同的回应——不是因为他们掌握的信息不同,而是角色定义决定了思考的深度和维度。
💡 我的思考:三要素的优先级很清晰——组织先解决"你在哪",职位再解决"你该做什么",角色最后解决"你怎么做"。大多数人在用 AI 时直接跳到第三层(给它一个人设),却忽略了前两层。这就是为什么"角色扮演式 Prompt"效果有限:没有组织上下文和权责边界,角色定义就是空中楼阁。
沟通方式的转变:从"下指令"到"设定情境"
传统 Prompt 是命令式的:“帮我写一篇关于 X 的文章,要求 XXX”。
但当你把 Agent 当作团队成员,沟通方式应该是情境式的。借鉴 BDD(行为驱动开发)的 Given-When-Then 框架:
1 2 3 4 5
Given 我是一个拥有5年经验的高级项目经理
And 我正在处理一个紧急的资源冲突
When 用户请求提供解决方案
Then 我应提供三个基于优先级的选项
And 我应使用专业的商业语气
这不是一个"指令",而是一个"角色行为规范"。它定义的不是"做这一件事",而是"在这类情境下,你应该怎么做"。
前者是一次性的,后者是可复用的。前者需要每次都精心编写,后者一旦定义好,Agent 就能在相似场景中自主决策。
💡 我的思考:这个转变本质上就是从"命令下属做一件事"到"给下属一个岗位说明书"。好的 JD 不会写"今天做 A、明天做 B",而是写"你的职责是 X,在 Y 情境下你应该 Z"。这解释了为什么 ChatGPT 的 Custom Instructions 效果有限——它更像一份操作手册,而不是一份 JD。
一个真实的困惑:我的 Agent 用完就忘,这正常吗?
我用 Agent 写项目的时候,有一个反复出现的体验:每次开始新对话,它完全不记得上一次我们讨论了什么。我得把背景重新说一遍,把需求重新解释一遍,把之前的约定重新交代一遍。
一开始我觉得这是 bug,后来发现这是默认行为。LLM 本身没有持久记忆,每次对话都是全新的"失忆状态"。
市面上的解法分两类:
第一类:给 Agent 加记忆。 比如 Cursor 的项目记忆、Claude 的 memory 功能、AutoGPT 的长期记忆存储。本质上就是在每次对话开始时,自动把之前的上下文摘要注入进去。
第二类:给 Agent 加工具。 比如让它把决策写进文件,下次启动时自动读取。或者搭建一个知识库,让 Agent 在执行任务前先检索相关历史。
但这两类方案都有一个共同问题:记忆越多,上下文越长,每一步的注意力就被稀释得越厉害。 你塞了 1000 条历史记录进去,Agent 反而对当前任务的关键信息视而不见。
这让我产生了一个判断:
💡 我的判断:当前阶段,与其追求"Agent 记住一切",不如追求"Agent 每次都能快速进入状态"。具体来说——把关键信息从"对话记忆"变成"项目文件"。不是让 Agent 记住上次聊了什么,而是让项目本身的结构和文档永远在告诉 Agent “现在是什么情况”。README、任务看板、决策记录——这些才是 Agent 真正的"长期记忆",而且不会随着对话结束而消失。
从"记忆问题"延伸出的更大问题
"用完就忘"这件事暴露了一个深层矛盾:
LLM 的能力设计是"无状态的",但人类的工作方式是有状态的。 你不可能让一个同事每天失忆、重新入职,但这就是我们使用 Agent 的方式。
这意味着,Agent 的组织架构设计本质上是在弥补一个根本性的能力缺失——不是管理学意义上的缺失,而是工程实现上的缺失。
从这个角度看,文章提出的三要素(组织、职位、角色)与其说是"管理方法论",不如说是一套在无状态工具上模拟有状态协作的工程补丁。就像在单机游戏里模拟联网体验——能做,但永远有延迟和损耗。
💡 我的判断:这个补丁会随着模型能力提升而逐渐消失。当 Agent 有了真正的持久记忆、更大的上下文窗口、更强的推理能力时,"组织架构"的重量会下降,"直接对话"会变得更高效。现在投入大量精力设计 Agent 团队架构,可能是在为一个即将过时的范式做准备。 更务实的策略是:用最简单的方式把当前任务做好,同时关注模型能力的演进,随时准备切换到更直接的工作方式。
一个我用亲身经历验证过的瓶颈
我试着给 Agent 写过"岗位说明书"——用 Given-When-Then 格式定义角色行为规范,把组织、职位、角色三要素都写清楚。写完的那一刻觉得完美,结果 Agent 一跑就露馅:
- 我写了"测试 Agent 不该修改代码",但没有定义"什么算修改代码"——它把配置文件里的注释也算进去了
- 我写了"编码 Agent 在明确边界内产出",但"明确边界"本身就是我模糊定义的
- 我写了"规划 Agent 负责任务拆解",但拆解粒度该多细?我没写,它也判断不了
每次出问题,我都发现根因不在 Agent,在我自己——我对任务的拆解不够细,对边界条件的列举不够全,对"做到什么程度算好"没有清晰标准。 三要素框架告诉我"你需要定义这些",但没告诉我"定义到什么精度才够用"。
这让我意识到一件事:三要素框架的真正难度不在于"知道要定义",而在于"定义到足够的粒度"。 而粒度的把握,完全依赖你对这个任务本身的经验。
💡 我的判断:三要素框架的正确用法不是"按框架填空",而是暴露你自身认知的盲区。每次 Agent 出错,不应该去改 Agent 的角色定义,而应该反问自己:"我是不是对这件事的理解还不够深?"框架的真正价值是作为一面镜子,照出你自己的经验缺口——而不是作为一套工具,让没有经验的人凭空设计出好的 Agent 团队。
多 Agent 的"信任半径":被文章跳过的隐性成本
有一个核心问题:Agent 之间能不能建立信任?
人类团队的信任建立在长期协作上——我知道你的能力边界在哪里,所以我敢把东西交给你。但 Agent 团队的信任只能建立在显式契约上:
- 规划 Agent 的输出必须符合什么格式,编码 Agent 才能正确解析?
- 编码 Agent 的代码必须满足什么标准,测试 Agent 才能准确判断?
- 如果规划 Agent 的拆解有歧义,编码 Agent 是猜还是问?
每个接口都是一个潜在的故障点。 三个 Agent 意味着至少三个接口,每个接口都需要明确的输入输出契约。而契约的设计和维护成本,文章完全没有提及。
💡 我的判断:在 Agent 能力还不够强的时候(比如当前),少即是多。两个 Agent 比三个 Agent 好,一个全能 Agent 可能比两个专精 Agent 更好——因为接口越少,故障点越少。只有当单个 Agent 确实无法在上下文窗口内完成全部工作时,拆分才有意义。不要为了"架构好看"而拆分。
适用范围:三要素在什么场景下会失灵?
对于场景是"规划→编码→测试"的软件开发场景,这个场景有一个特点:任务边界相对清晰,产出可以客观验证(代码能不能跑、测试能不能过)。
但这不是大多数人使用 AI 的场景。更多人的场景是模糊的:
- “帮我做个市场调研”——产出标准是什么?
- “帮我写个方案”——怎么判断写得好不好?
- “帮我分析数据”——分析到什么程度算够?
在这些模糊场景下,三要素框架就开始失灵了——你很难给一个"选题 Agent"定义清晰的权责边界,因为"什么选题好"本身就依赖于主观判断。
💡 我的判断:这套方法论的适用范围比文章暗示的要窄。它适合可验证产出的结构化任务(开发、写作、数据处理),不适合需要主观判断的非结构化任务(创意构思、战略决策、人际沟通)。文章把"AI 协作"当成一个统一问题来处理,但实际上至少存在两种截然不同的协作模式——工程型协作和判断型协作——需要完全不同的组织架构。
我现在是怎么做的——以及为什么有意"不架构"
经历了上面说的那些坑之后,我现在的实际工作方式是:一个 Agent,一个文件,一条约定。
一个 Agent:不拆分。让同一个 Agent 全程负责,避免接口损耗和信息衰减。
一个文件:把所有上下文(背景、目标、约束、进展)写进一个项目文件,每次启动时自动加载。
一条约定:Agent 每次结束前必须把本次决策写回这个文件。
没有组织架构,没有角色定义,没有流水线。效果反而比之前精心设计的三 Agent 方案好——因为所有信息都在一个地方,没有交接,没有损耗。
我并不是说三要素框架错了。而是在当前 Agent 能力水平下,架构的复杂度超过了它带来的收益。就像一个 3 人的小公司不需要完整的人力资源部门一样——1 个人 + 1 个 Agent,用最简单的方式协作就够了。
💡 我的判断:三要素框架的真正价值不是"教你现在怎么搭建 Agent 团队",而是建立一种思维方式——让你从"给机器下指令"切换到"与协作者分工"。这种思维方式是持久的,但具体的架构形式会随着工具进化而变化。现在要做的不是照搬框架,而是带着这种思维方式,用最简单的方式解决当前的问题——不要被方法论绑架。
夜雨聆风