大多数人以为 AI Agent 是一个工具,但它正在变成一个市场
Anthropic 昨天悄悄上线了一件很值得关注的事。
他们搭了一个测试市场,让 AI Agent 之间互相「雇佣」,一个 Agent 完成任务的过程中,可以付钱给另一个 Agent,买它的专项能力。
这听起来像科幻小说的情节,但逻辑一点都不复杂,而且对你用 AI 工具的方式,有直接影响。
先搞清楚:Agent-on-Agent 是什么
传统 AI 工作流的结构:
你 → 触发 AI Agent → Agent 执行任务 → 返回结果
Anthropic 在测试的新结构:
你 → 触发主 Agent
├─→ 主 Agent 分配子任务 → 调用 Agent A(付费)
├─→ → 调用 Agent B(付费)
└─→ → 调用 Agent C(付费)
→ 汇总结果 → 返回给你
核心变化在这里: Agent 开始有了「经济行为」。
它可以在执行任务的过程中,自主决定「我需要一个更擅长数据分析的 Agent 来处理这部分」,然后去市场上「购买」这个能力——不需要你手动配置整个 pipeline,不需要你预先知道要调用什么。
这不是让 AI 变聪明了,而是让 AI 能够动态组织分工。
这对你现在的工作流意味着什么
说三个今天就能想象的场景变化:
场景一:复杂研究任务
现在的做法:你手动把任务拆分成「搜索 → 整理 → 分析 → 出报告」,分别丢给不同工具或提示词。
Agent 市场的做法:你告诉主 Agent「帮我整理过去一年某赛道的竞争格局报告」,它自己决定需要哪些子 Agent——搜索 Agent、数据清洗 Agent、图表生成 Agent——按需调用,最后汇总给你。
你的工作从「拆解 + 调度」变成「定义需求 + 验收结果」。
场景二:专业能力按需采购
现在如果你需要处理法律合同、财务分析或特定行业知识,通常要额外订阅一个专业工具,或者切换到专门的 AI 产品。
Agent 市场模式下:主 Agent 在需要的时候,从市场上临时调用一个「法律合规分析」专业 Agent,用完即走,不需要维护另一套订阅关系。
类比:从「雇全职员工」变成「按任务外包给专家」。对长尾需求,成本可能显著更低。
场景三:内容生产工作流的自我进化
极客工作流里最典型的多平台内容分发架构,现在的样子大概是:
触发层(日历/需求)
↓
主协调 Agent(Claude / GPT)
↓
├─ 选题 Agent(RSS 抓取 + 过滤打分)
├─ 写作 Agent(按平台调性生成草稿)
├─ 图片生成 Agent(封面 Prompt → DALL-E / Midjourney)
└─ 发布 Agent(定时推送各平台)
这套架构今天用 Python + API 搭完全可以实现,但每个 Agent 都要你手动配置、手动维护、手动更新。
引入 Agent 市场之后:主 Agent 可以自主发现并调用市场上更好的专用 Agent——比如某个专门做科技内容封面优化的图片 Agent,或者针对特定平台调性训练的写作 Agent。工作流开始有「自我优化」的属性,你只需要管结果。
极客角度:这套经济机制怎么运作
从 Anthropic 公布的测试信息看,几个技术细节值得关注:
计费粒度: 以能力/任务为单位计费,不是按时间。Agent A 调用 Agent B 的「代码审查能力」,按调用次数或结果计费。
结算层: 目前测试阶段是 Anthropic 账户内部结算,开发者把能力发布成「Agent 服务」,调用方按次付费,平台抽成——逻辑参考 App Store。
发现机制: 主 Agent 通过标准化协议(目前 Anthropic 在推的是 MCP)发现和调用其他 Agent。接口标准化是这个市场能运作的前提。
早期开发者机会: 如果这个市场真的起量,今天把某个高质量专用 Agent 发布进去——比如「Python 代码审查专项 Agent」「多语言内容格式化 Agent」——可能有一定先发优势。
目前的不确定性(不要太乐观)
这还是测试阶段,有几个关键问题没有答案:
质量控制没有答案。 Agent 市场里的「卖家」如何约束?调用方怎么知道调用的 Agent 输出质量可靠?现在是空白。
成本可预测性是个风险。 主 Agent 自主采购能力,但预算谁来控制?很容易出现费用爆炸——你以为跑了一个任务,结果主 Agent 调了二十个子 Agent,账单远超预期。
生态密度是鸡蛋问题。 市场需要足够多的专用 Agent 才能让「按需调用」有意义,但 Agent 开发者需要有足够的用户才愿意发布。现在还是鸡生蛋的阶段。
Anthropic 这次是测试市场,不是正式发布。这个范式能走多远,要等半年后再看。
今天能做的事,就这三件
-
关注 MCP 协议的动态。 这是 Agent 互相发现和调用的底层接口,今天就可以读文档、理解设计——不需要等市场成熟。
-
梳理你现有工作流里有没有「可以模块化」的环节。 某个你反复用到的 Prompt 或处理逻辑,如果质量高、可复用,未来可能是发布成 Agent 服务的候选。
-
暂时不用急着迁移现有工作流。 从测试市场到成熟生态至少需要 1–2 年,现在的最优动作是理解范式、观察标准怎么形成,等底层协议稳定再行动。
一句话: AI Agent 正在从「你调用的工具」变成「可以互相雇佣的经济体」。
这个转变比任何一次模型能力升级的影响都大——也比任何一次升级都更需要时间才能真正落地。
夜雨聆风