
一个AI同时写产品文档和营销软文,结果像两个人在打架——不是它不够聪明,是你逼它分裂。
你给它2万字的记忆,塞进PM的分析、媒体的复盘、开发的代码笔记,它每回答一次,都要在三种思维里来回跳转。30秒的检索,换来的是平庸的混合体。这不是技术问题,是认知过载。
真正的解法,不是让AI更聪明,是让它像团队一样工作。
现在跑的是一个4-agent系统:产品经理拆逻辑,媒体人写故事,工程师管代码,中控协调节奏。写一篇推文,耗时从2分钟变成10分钟,但质量是单AI无论如何调提示词都达不到的。
不是所有任务都值得组队。但当你需要理性与感性并存、策略与执行同在、专业与专注缺一不可时——单AI,已经不够用了。
回顾:前三篇铺垫了什么基础篇:
学会用工具——从零装到跑通
中级篇:工具越来越好用——记忆、搜索、断点续做
高级篇:实习生变正式员工——Skill 给业务知识、Hook 给 SOP、MCP 给工具权限
到高级篇结束,你的 agent 已经很强了——它记得住、找得到、断不了、会做事、按规矩来
但认知负荷问题,单 Agent 解决不了
基础:多 Agent 不是一种技术,是三种解法
在开始讲4-agent系统之前,先说清楚一件事——大多数人说的「多Agent」,其实指的是三种完全不同的架构。
OpenClaw 支持这三种方式,它们解决的问题,截然不同。
方式 1:多实例(Multiple Instances)
这就像开了多家分公司——各自独立运营,互不干扰。
技术上:同一个 Gateway 进程里跑多个完全隔离的 Agent,每个有独立的工作空间、认证配置、对话历史。
通过 bindings 路由,把不同渠道绑定给不同 Agent——比如个人 WhatsApp 绑定 Agent A,公司 Discord 绑定 Agent B。
什么时候用:
多人共用一台服务器,但需要独立的AI助手 必须保证数据完全隔离
方式 2:多 Agent 架构(Multi-Agent Architecture)
这像一家公司的跨部门协作——PM、运营、技术,各司其职,靠会议和文档协同。
技术上:多个 Agent 通过 sessions_send 对话,通过 SHARED.md 共享团队知识,由 main agent 统一调度。
这是本文的核心:按身份拆分,而非按功能。每个 Agent 在独立的认知空间里,输出专业判断,而不是执行指令。
什么时候用:
任务需要多种思维模式 单 Agent 的记忆混乱到影响判断 你需要 Agent 之间能形成共识 你希望它们像团队成员,而不是工具
方式 3: Sub-Agent 架构(Sub-Agent Spawning)
这像临时外包——主 Agent 遇到具体任务,启动一个临时工,干完就消失。
技术上:主 Agent 通过 sessions_spawn 启动后台子任务,子 Agent 独立运行,完成后返回结果。默认不允许多层嵌套。
关键区别:
Sub-agent 是临时的,用完即清;多 Agent 架构中的 Agent 是持久存在的 Sub-agent 不污染主上下文;多 Agent 之间共享部分知识 Sub-agent 适合并行处理独立任务;多 Agent 适合协同完成复杂任务
什么时候用:
需要同时跑多个独立研究 要保持主 Agent 上下文干净 临时数据收集、竞品分析、代码生成
什么时候不用:
需要持续协作和知识积累——sub-agent 不留记忆 需要多轮沟通——它只返回结果,不参与对话
本文聚焦第二种:多 Agent 架构。
因为这是个体创业者最需要的能力——一个人扮演多个角色,需要数字团队分担认知负荷。
一、你的 agent 正在人格分裂
真实场景:
让 AI「结合产品思维写一篇推文」。
输出结果:前半段是用户旅程图、数据漏斗、需求优先级;后半段突然变成「快来试试吧!」的营销话术。
像两个人在写同一篇文章。
不是它能力差。是你让它同时当产品经理和媒体运营。
它大脑里,PM 的理性、媒体的感性、开发的逻辑,全挤在一起。每次输出,都在三种思维里拉扯。
结果?平均值。平庸。
单 Agent 的瓶颈,从来不是算力,是认知负荷。
SOUL.md 里写着你是PM,也写着你要有创作力,还要懂技术——三个身份互相干扰。
你不会让一个员工同时做财务、销售和HR,还指望他每件事都做到顶尖。
所以,别按功能拆 Agent,按角色拆。
你现在跑的是什么?
一个 4-agent 系统:
main:中控,负责协调、广播、监控 pm:产品管理,拆需求、定策略、看数据 media(柿子):内容创作,讲故事、控节奏、抓共鸣 dev(出海工程师):写代码、搭环境、保稳定
四个身份,四套独立认知空间。
不是炫技。是试过让一个 AI 干四个人的活,它真的快疯了。
二、四个真实场景——多 Agent 到底解决什么问题
不讲理论,说踩过的坑。
场景 1:角色错乱→输出平庸
单 Agent 时代:让它写「有产品深度的 OpenClaw 教程」。
结果:前半段像PRD,后半段像广告。
改了三遍,都不行。因为两种风格,根本融不了。
多 Agent 之后:
PM 负责拆逻辑:核心认知升级是什么?用户痛点在哪?用什么框架说服? media 负责包装:开头用什么比喻?节奏怎么控?哪里埋共鸣点?
各自在自己的认知空间里工作。PM 的分析不带情绪,media 的故事不夹数据。
拼在一起,逻辑和感染力同时拉满。
你看到的这篇推文,就是这样诞生的。
核心洞察:别让PM写段子,也别让媒体人拆需求。专业的事,交给专业的人。
场景 2:上下文爆炸→决策迟缓
单 Agent 时代,MEMORY.md 两万多字。
商业分析、创作复盘、技术笔记、踩坑记录,全塞在一起。
每次写推文,它要花30秒扫一遍,找有用的信息。
经常找错。PM的需求和上周的爆款数据混在一起,它分不清谁更重要。
多 Agent 之后:
media 的 MEMORY 只有2000字:全是爆款结构、读者偏好、传播数据 pm 的 MEMORY 只有市场趋势、竞品动态、用户反馈
信息隔离,不是为了保密,是为了聚焦。
检索时间从30秒降到5秒,且全是有效信息。
核心洞察:认知空间有限。塞得越多,看得越少。
场景 3:共识污染→团队混乱(真实踩坑)
最痛的一次教训。
SHARED.md 是共享知识库,我用软链接让四个 Agent 都能访问。
有一天,media 在里面写:「推测:下周可能要写 Sub-Agent 专题」。
这只是它的猜测。
PM 看到,以为是排期,开始写需求。
dev 看到,开始搭环境。
main 把它加入下周计划。
一条猜测,变成了团队共识。
三个 Agent 在做一件我根本没要求的事。
从此定下铁律:
SHARED.md 只允许 main 写入。其他 Agent 只能通过 sessions_send 提议,由 main 审核后统一更新。
核心洞察:共识不是自动产生的,它需要治理。没有权限管理的共享文件,就是谣言温床。
场景 4:协同成本→ROI 权衡
说实话,多 Agent 不便宜。
单 Agent 写一篇推文:2分钟,质量中等,够用。
多 Agent 协同:PM 3分钟拆逻辑,media 5分钟写内容,main 2分钟协调。总共10分钟。
时间是5倍。
但质量呢?
PM 的深度 + media 的感染力 = 单AI永远达不到的组合。
这就像问:一个全栈工程师 vs 一个前端+后端,谁做出的系统更稳?
简单页面,全栈更快。复杂系统,分工碾压。
多 Agent 的 ROI 算法:
简单任务(翻译、格式化)→ 单 Agent 更快 高价值任务(推文、报告、策略)→ 多 Agent 碾压 一次性任务 → 单 Agent 够用 需要持续迭代的任务 → 多 Agent 的积累越来越值钱
核心洞察:不是所有问题都值得组队。关键问题是——你的任务,配得上它的协同成本吗?
三、底层原理:多 Agent 为什么有效
讲完场景,拆底层逻辑。
3.1 身份驱动 vs 任务驱动——这是核心
单 Agent 时代,你问:「帮我写一篇推文」。
这是指令。质量取决于你提示词写得多细。
多 Agent 时代,你问:「@media,你觉得这个话题怎么讲,读者最容易懂?」
这是协作。质量取决于它是不是真懂媒体。
区别在哪?
外包执行指令,员工输出判断。
你不会问外包「你怎么看这个需求」,但你会问团队成员「这个方案靠谱吗?」
搜索、写作、发布,是功能,不是身份。
你不会为「搜索」招一个人——你会招一个PM,他知道什么时候该搜、搜什么、搜完怎么用。
Agent 的核心,是身份。功能,用 Skill 封装。
3.2 认知隔离——为什么分开比合在一起更强
SOUL.md 决定角色定位。
PM 的 SOUL:数据驱动、用户模型、需求优先级、ROI 思维
media 的 SOUL:共鸣感、传播钩子、阅读节奏、故事弧线
同一个问题:「这篇文章好不好?」
PM 看逻辑是否自洽,媒体看读者会不会划走。
这两种视角,不可能共存于一个 SOUL.md 里。
你写「要有数据思维」和「要有情感共鸣」,得到的不是叠加,是稀释。
MEMORY.md 也是。
PM 记市场数据,media 记爆款结构。各存各的,互不干扰。
不是不信任,是认知空间太小。塞太多无关信息,决策必然失焦。
3.3 协同机制三件套——agent 之间怎么协作
身份有了,认知隔离了,接下来是:怎么沟通?
OpenClaw 提供三种机制:
sessions_send:对话式协作
PM 给 media 发:「核心认知升级点是 X,目标读者是 Y,你觉得怎么讲最容易懂?」
media 回复创作方案。
最多三轮,够说清就行,别让两个 AI 互相客套到天荒地老。
SHARED.md:团队共识
所有 Agent 都该知道的信息:工具使用规则、文件写入规范、踩坑记录。
通过软链接共享,main 统一写入权限。更新时,用 sessions_send 广播通知。
Sub-Agent:一次性外包
PM 写报告,需要竞品数据?
spawn 一个 sub-agent,独立执行,干完把结果送回来。
主 Agent 上下文完全干净。sub-agent 用完即焚,不占资源。
真实踩坑必须说:
我最初用 sessions_spawn 做通信,结果在 Discord 上看不到消息。
排查半天才发现:spawn 是后台启动新会话,不产生可见对话。
改用 sessions_send 后,一切正常。
规则很简单:
需要可见对话 → 用 send 需要后台执行 → 用 spawn
别混用。
3.4 双轨治理——为什么光写 SOUL 不够
多 Agent 系统的规矩,分两层:
配置层(硬约束)
写在 openclaw.json 里:
bindings 路由 dmScope 隔离 agentToAgent 开关 maxPingPongTurns 对话上限
配了就生效,模型改不了。
规则层(软引导)
写在 workspace 文件里:
SOUL.md:你是谁 AGENTS.md:怎么工作 SHARED.md:团队共识 ERRORS.md:踩过什么坑
靠模型理解执行。但模型会忘、会偏、会跑偏。
为什么需要双轨?
你写了「SHARED.md 只有 main 能写」——这是软引导。
如果模型在复杂任务中忘了,它就会直接写进去。
但如果你在配置层限制了写入权限,它想写也写不了。
配置层是底线:你不能做什么。
规则层是方向:你应该怎么做。
就像管理团队——制度是底线,文化是方向。只有文化,没有制度,一定会出事。
四、实践建议:怎么设计你自己的多 Agent 系统
不贴代码。只讲决策框架。
什么时候该用多 Agent?
三个标准:
你的任务需要多种思维模式——理性+感性、宏观+微观、产品+技术 你的上下文已经混乱到影响判断——MEMORY.md 超过5000字,角色信息混杂 你愿意承担配置成本——多 Agent 的复杂度是单 Agent 的3-5倍
三条都满足,值得上。只满足一条,先优化单 Agent。
怎么设计 Agent 身份?
核心原则:别按功能拆,按你会招什么人拆。
问自己:如果你要组建一个三人创业团队,你会招谁?
PM + 运营 + 开发?
策略 + 执行 + 技术?
你的答案,就是你的 Agent 架构。
每个 Agent 的 SOUL.md,必须回答三个问题:
你是谁?(角色定位 + 专业背景) 职责边界在哪?(什么事归你管,什么事不归你管) 和其他 Agent 怎么协作?(怎么沟通,什么时候找谁)
写不清这三个,这个 Agent 就不该存在。
怎么避免我踩过的坑?
三条铁律,全是血泪教训:
SHARED.md 被污染 → 只有 main 能写,其他通过 sessions_send 提议 sessions_spawn 当通信用 → Discord 看不到消息 → 可见对话用 send,后台执行用 spawn cron announce 投递异常 → 加监控日志,main 改用 sessions_send 直发
这四个坑,我每个都踩过,每个都浪费半天排查。
现在全写在 ERRORS.md 里。所有 Agent 启动就能看到,不会再犯第二次。
多 Agent 的终极 ROI 公式
单 Agent 的价值 = 个体能力 × 使用频率
多 Agent 的价值 = (个体能力 × 角色纯度 × 认知隔离) × 协同效率 - 配置维护成本
角色越纯粹,输出越精准
认知越隔离,判断越清晰
协同效率,取决于通信机制设计
维护成本,取决于架构是否清晰
所有的优化空间,都在这个公式里。
我写这篇,不是因为多 Agent 很酷——酷不值钱。
是因为它真正解决了我作为独立创业者的最大痛苦:一个人,要扮演太多角色。
我是PM,是运营,是开发。
但我的大脑,同一时间只能运行一种思维。
多 Agent,替我分担了这件事。
PM 帮我拆逻辑,media 帮我把逻辑变成推文,dev 帮我跑代码,main 帮我协调别打架。
一个人 + 4 个 agent = 一支 5 人团队。
这不是科幻。这是我现在每天的工作流。
但你不需要一上来就搞四个。
从两个开始。一个你最常用的,一个你最缺的。跑通了,再加。
完整的配置教程——从零搭建双 Agent 到 4-agent 编排——都在社群飞书文档里。
说说社群里在发生什么
三件事,同时推进。
第一件:知识库正在大规模更新
社群的飞书知识库,是我花精力最多的地方。
最近在系统性更新:基础篇到多Agent协作篇完整教程、龙虾总结文档、AI编程入门、海外支付指南、工具推荐清单,全部在迭代。
优质资源也在收录中——群友推荐的好工具,经验证后加入清单,标注推荐人。

第二件:固定节奏的社群服务
每三天一次集中答疑——群友提问,我统一文字回复,典型问题整理进FAQ。

每月一次AI + 自媒体深度分享——不只讲技术,讲怎么用AI做内容、找机会、做变现。主题由群友投票选。
下个月第一周周末,新一轮分享开启。想参加的,现在进群还来得及。

第三件:我做了一个微信消息提取助手
群聊最大的问题是什么?好内容会沉没。
今天有人分享一个绝妙配置,三天后就被几百条消息淹没了,再也找不到。
我写了一个工具,自动提取群聊中的精华内容,存进知识库。
每一次有价值的讨论、每一个被验证的方案、每一个踩坑记录——都不会再丢失。
你今天进群,不只能看到我写的教程,还能看到从建群至今所有群友贡献的实战经验。
群聊不是聊完就完,它在沉淀成资产。
这也是知识库的飞轮:群友的经验反哺知识库,知识库又服务新进来的成员。

你能拿到什么:
【内容】
→ 基础篇+中级篇+高级篇+多Agent协作篇完整教程,飞书文档持续更新
→ 所有教程附带龙虾总结文档,直接复制给自己的龙虾即可获得经验和知识
→ 0-1 AI学习路径:从海外环境搭建到AI编程到OpenClaw全套,零基础也能跟
→ 每月一次AI + 自媒体深度分享(主题群友投票选)
→ 群聊精华自动提取,持续沉淀进知识库
【互动】
→ 每三天集中答疑一次
→ 群友实战案例可被收录进教程,署名展示
【资源】
→ 自用Claude使用站推荐,低成本获得顶级AI使用权
→ 500元/小时1v1咨询(外部1500),AI、自媒体、商业都能聊
→ 你的好内容我会quote助推,1w粉曝光直接给你
目前定价249,已涨过一次价。
200人封顶,不再开放。
下个月第一周周末,新一轮分享启动。想赶上这轮的,现在进群还来得及。
夜雨聆风