
大型语言模型(LLM)在单Agent模式下,虽然可以执行复杂任务,但在超大规模工程项目中仍存在瓶颈。
2026年5月28日,Anthropic推出的Claude Dynamic Workflows提供了一种全新的解决方案,将LLM从单一执行者升级为动态协作系统。本文从技术原理出发,分析DW的机制,并与Subagent模式及国内外厂商进行对比。

官方案例:Bun 75 万行用 Rust 重写

Anthropic官方给出的案例非常典型:在一个真实工程项目中,通过动态工作流,Claude在11天内完成了75万行代码的 Zig → Rust 重写,并保持 99.8% 测试通过率。

输入问题
Zig 写的 Bun runtime
需要迁移到 Rust
代码规模:约 750,000 LOC

Dynamic Workflow执行方式
Step 1:全局拆解
Zig AST 映射 Rust 模块
生命周期分析任务
文件级迁移计划
Step 2:并行执行(hundreds of agents)
一个 agent 负责一个
.zig → .rs两个 reviewer agent 做验证
另一个 agent 专门跑 test suite
Step 3:反馈闭环
test fail → 自动生成修复 agent
再次 patch → 回归测试
直到收敛

结果
750k LOC 迁移
11 天完成
99.8% test suite pass
这已经不是“代码生成”,而是:
AI 驱动的持续集成系统(AI-driven CI/CD pipeline)
从2025~2026年的发展来看,整个行业正在向同一个方向收敛:
单 Agent → Multi-Agent → Workflow → Agent Operating System
但目前来看,Anthropic 的 Dynamic Workflows 是第一个把这套能力真正产品化,并且公开展示超大规模工程案例的厂商。

Dynamic Workflows 的技术原理

Dynamic Workflows的核心目标是将复杂任务自动拆分、并行调度、验证并收敛结果。

其技术架构可以拆解为四大核心模块

1
Planner(动态任务拆解器)
作用:根据用户提供的目标,分析任务依赖关系,生成动态 DAG(有向无环图)。
实现方式:
利用 Opus 4.8 强大的上下文理解能力解析项目结构。
自动识别模块边界、任务依赖和关键约束。
输出可执行的 workflow script,用于并行执行。
本质上,Planner 是一个运行时的任务编译器,它把高层目标转化为可调度的子任务图。
2
Executor Pool(并行 Agent 池)
作用:执行 DAG 中的各个子任务。
特点:
每个 Agent 处理独立子任务,可同时并行运行几十到上百个实例。
子任务仅需关注局部逻辑,实现高效计算。
优势:
显著缩短执行时间。
可扩展性强,适合大规模项目。
3
Critic / Verifier(对抗验证器)
作用:保证输出结果的正确性和一致性。
机制:
独立 Agent 检查其他 Agent 的输出。
自动发现冲突或逻辑错误。
生成修复任务,由子 Agent 迭代修正。
价值:
类似 CI/CD 的自动化回归测试。
减少人工干预,提高可靠性。
4
Aggregator(结果整合器)
作用:将各个子任务的输出整合为最终结果。
功能:
消除冲突和冗余。
保证全局一致性和完整性。
场景:
代码迁移、测试报告生成、文档整合等大规模任务。
典型执行流程

用户目标│▼Planner → 生成 DAG│▼Executor Pool → 并行执行子任务│▼Critic / Verifier → 自动修复│▼Aggregator → 输出最终结果
工程实践建议
任务可拆性:适合代码迁移、重构、测试生成等可独立验证任务。
验证机制:Dual-Agent Review + 测试驱动反馈 + 规则验证。
Fan-Out 控制:限制 Agent 数量、Workflow 深度和迭代次数,避免资源消耗过快。
Subagent vs Dynamic Workflows
Subagent是多Agent协作的早期实现,但仍存在局限:

总结:Subagent 更像是“多个工具人”,Dynamic Workflows 是“临时操作系统”,能够自动规划、执行、验证和收敛任务。

国内外厂商对比

1. Anthropic(Claude DW)
自动生成 DAG,动态调度 Agent。
内置验证与自愈机制。
典型案例:Bun 75 万行代码 Zig → Rust 重写,11 天完成,99.8% 测试通过。
2. OpenAI(AgentKit / Agents SDK)
支持多 Agent 协作与可视化 Workflow。
Workflow 主要由开发者定义。
动态 DAG 和自动收敛能力有限。
3. Google(ADK)
支持 Multi-Agent 和 Workflow DAG。
仍需开发者规划 Agent Team。
动态自我生成 DAG 尚未成熟。
4. 国内厂商

为什么 Anthropic 这次意义这么大?
因为以前大家做的是:
Workflow Engine
人│▼设计DAG│▼Agent执行
例如:
LangGraph
CrewAI
AutoGen
OpenAI Agents SDK
Anthropic 做的是:Workflow Generator
人 → 目标描述↓LLM 生成执行系统(DAG)↓hundreds of agents 并行执行↓adversarial verification↓自动收敛结果
这实际上跨过了一个巨大门槛,以前:
Programmer↓Workflow
现在:
LLM↓Workflow
从软件工程角度看未来,会形成三层架构:
目前:
Anthropic 最靠近第三层(Dynamic Workflow)
OpenAI 最强的是第二层(AgentKit + Agents SDK)
所以如果用一句话总结:
OpenAI 在打造 Agent 开发平台,Anthropic 在打造 Agent 操作系统。

国内玩家现状
国内厂商大致分成三个梯队:
Claude Dynamic Workflow▲│┌────────┼─────────┐│ │ │Coze 阿里 智谱│ │ │└────────-─────────┘
第一梯队:字节 Coze(扣子)
实际上最接近 Anthropic 思路的是字节,官方已经明确把 Coze 2.0 定位为:
长期规划、自主执行、多体协同的 Agent 平台。
其核心能力已经包括:
Workflow
Agent Skills
Agent Plan
长周期任务
多Agent协同
动态任务规划
官方甚至提出:
从流程工具升级为智能执行体。
这和Claude Dynamic Workflow的方向非常像:
用户目标│▼Agent Plan│▼Workflow│┌──┼───┐▼ ▼ ▼Agent Agent Agent
区别在于:
Claude:Workflow 运行时生成
Coze:Workflow 主要由用户设计
第二梯队:阿里(Qwen + 千问云)
阿里最近实际上已经开始全面转向 Agent。
2026 阿里云峰会发布的:千问云(Qwen Cloud)
官方定位:
为 Agent 而生的基础设施。
其中最值得注意的是:Skill 化
阿里把:
模型调用
工具调用
云资源
全部封装成:Skill形式。
这意味着,以前:
Agent│▼API以后:
Agent│▼Skill│▼云资源
这其实已经具备:
Agent Runtime
Tool Registry
Skill Marketplace
雏形。
与 Claude 差距在哪?
目前阿里更像:Agent Infrastructure
而 Claude 是:Agent Orchestration
差距主要在:
动态 DAG 生成
大规模并行 Agent 调度
自动收敛机制
第三梯队:智谱 AutoGLM
智谱是国内最早认真做 Agent 的厂商之一,其 AutoGLM 已经支持:
深度研究
自动搜索
自动规划
自动执行任务
等能力,其架构更接近:
Goal│▼Planner│▼Tool Use│▼Result
而不是:
Goal│▼Workflow Generator│▼100 Agents│▼Verifier所以,智谱目前更接近OpenAI Operator路线,而不是Claude Dynamic Workflow路线。
总结:国内厂商普遍处于 “平台化 Agent” 或 “固定 Planner + Task” 阶段,距离 Claude DW 的自动化 DAG 生成和大规模并行执行还有差距,但正在快速追赶。
为什么国内还没出现 Dynamic Workflow?
大致原因有以下几个:
01
模型能力刚够
Dynamic Workflow有个隐藏前提:Agent 要会写 Workflow
这要求:
长上下文
强规划能力
稳定 Tool Calling
同时在线。
Claude Opus 4.8 恰好是目前最强的 Coding Agent 之一。
02
成本问题
Anthropic 官方案例里:
几十 ~ 数百 Agent
同时运行。
阿里已经开始把整个云平台改造成 Agent-First 架构(Skills + CLI + Agent Runtime)。
DeepSeek 目前仍聚焦模型层,而不是 Agent 编排层。
从产业趋势看,2026~2027 年很可能出现这样的架构:
DeepSeek / Qwen / GLM│▼Dynamic Workflow Engine│▼100~1000 Agent Swarm│▼自动软件开发
而 Claude Dynamic Workflow 只是这一阶段最先落地的代表产品之一。
写在最后
Dynamic Workflows 的真正意义不是“更聪明的 AI”,而是:
把 AI 从“执行者”升级为“临时分布式系统编译器”
它带来的变化可以概括为三点:
从单 Agent → 多 Agent 协同系统
从静态 Subagent → 动态执行图
从一次性生成 → 持续验证与收敛
Claude Dynamic Workflows 的价值不仅在于生成代码,更在于:
自动生成 DAG 任务图。
并行调度数百 Agent。
内置验证和自愈机制。
Subagent 是工具人式协作,Dynamic Workflows 是操作系统级调度器。
国内厂商正在向这一方向追赶,而 Claude DW 已经成为大规模工程自动化的标杆。
END
夜雨聆风