把75万行Bun的zig源码用rust重构:Claude Dynamic Workflows技术原理及国内外对比分析

大型语言模型（LLM）在单Agent模式下，虽然可以执行复杂任务，但在超大规模工程项目中仍存在瓶颈。

2026年5月28日，Anthropic推出的Claude Dynamic Workflows提供了一种全新的解决方案，将LLM从单一执行者升级为动态协作系统。本文从技术原理出发，分析DW的机制，并与Subagent模式及国内外厂商进行对比。‍

官方案例：Bun 75 万行用 Rust 重写

Anthropic官方给出的案例非常典型：在一个真实工程项目中，通过动态工作流，Claude在11天内完成了75万行代码的 Zig → Rust 重写，并保持 99.8% 测试通过率。

输入问题

Zig 写的 Bun runtime
需要迁移到 Rust
代码规模：约 750,000 LOC

Dynamic Workflow执行方式

Step 1：全局拆解

Zig AST 映射 Rust 模块
生命周期分析任务
文件级迁移计划

Step 2：并行执行（hundreds of agents）

一个 agent 负责一个 .zig → .rs
两个 reviewer agent 做验证
另一个 agent 专门跑 test suite

Step 3：反馈闭环

test fail → 自动生成修复 agent
再次 patch → 回归测试
直到收敛

结果

750k LOC 迁移
11 天完成
99.8% test suite pass

这已经不是“代码生成”，而是：

AI 驱动的持续集成系统（AI-driven CI/CD pipeline）

从2025～2026年的发展来看，整个行业正在向同一个方向收敛：

单 Agent → Multi-Agent → Workflow → Agent Operating System

但目前来看，Anthropic 的 Dynamic Workflows 是第一个把这套能力真正产品化，并且公开展示超大规模工程案例的厂商。

Dynamic Workflows 的技术原理

Dynamic Workflows的核心目标是将复杂任务自动拆分、并行调度、验证并收敛结果。

其技术架构可以拆解为四大核心模块

Planner（动态任务拆解器）

作用：根据用户提供的目标，分析任务依赖关系，生成动态 DAG（有向无环图）。
实现方式：

利用 Opus 4.8 强大的上下文理解能力解析项目结构。
自动识别模块边界、任务依赖和关键约束。
输出可执行的 workflow script，用于并行执行。

本质上，Planner 是一个运行时的任务编译器，它把高层目标转化为可调度的子任务图。

Executor Pool（并行 Agent 池）

作用：执行 DAG 中的各个子任务。
特点：

每个 Agent 处理独立子任务，可同时并行运行几十到上百个实例。
子任务仅需关注局部逻辑，实现高效计算。

优势：

显著缩短执行时间。
可扩展性强，适合大规模项目。

Critic / Verifier（对抗验证器）

作用：保证输出结果的正确性和一致性。
机制：

独立 Agent 检查其他 Agent 的输出。
自动发现冲突或逻辑错误。
生成修复任务，由子 Agent 迭代修正。

价值：

类似 CI/CD 的自动化回归测试。
减少人工干预，提高可靠性。

Aggregator（结果整合器）

作用：将各个子任务的输出整合为最终结果。
功能：

消除冲突和冗余。
保证全局一致性和完整性。

场景：

代码迁移、测试报告生成、文档整合等大规模任务。

典型执行流程

用户目标     │     ▼Planner  → 生成 DAG     │     ▼Executor Pool → 并行执行子任务     │     ▼Critic / Verifier → 自动修复     │     ▼Aggregator → 输出最终结果

工程实践建议

任务可拆性：适合代码迁移、重构、测试生成等可独立验证任务。
验证机制：Dual-Agent Review + 测试驱动反馈 + 规则验证。
Fan-Out 控制：限制 Agent 数量、Workflow 深度和迭代次数，避免资源消耗过快。

Subagent vs Dynamic Workflows

Subagent是多Agent协作的早期实现，但仍存在局限：

特性	Subagent	Dynamic Workflows
任务拆分	固定或人工定义	动态生成 DAG
执行结构	串行或弱并行	强并行，支持上百 Agent
调度能力	外部控制	内生调度，自动优化
验证机制	弱或依赖人工	内置 adversarial verification
适用规模	中小型任务	超大规模工程项目

总结：Subagent 更像是“多个工具人”，Dynamic Workflows 是“临时操作系统”，能够自动规划、执行、验证和收敛任务。

国内外厂商对比

1. Anthropic（Claude DW）

自动生成 DAG，动态调度 Agent。
内置验证与自愈机制。
典型案例：Bun 75 万行代码 Zig → Rust 重写，11 天完成，99.8% 测试通过。

2. OpenAI（AgentKit / Agents SDK）

支持多 Agent 协作与可视化 Workflow。
Workflow 主要由开发者定义。
动态 DAG 和自动收敛能力有限。

3. Google（ADK）

支持 Multi-Agent 和 Workflow DAG。
仍需开发者规划 Agent Team。
动态自我生成 DAG 尚未成熟。

4. 国内厂商

厂商	状态	特点
字节Coze	接近 DW	用户目标 → Agent Plan → Workflow → 多Agent协作
阿里千问云	Agent Infrastructure	Skill化 + 云资源管理，偏向平台化Agent
智谱AutoGLM	Planner + Task 执行	固定角色团队，缺少大规模并行DAG

为什么 Anthropic 这次意义这么大？

因为以前大家做的是：

Workflow Engine


 人 │ ▼设计DAG │ ▼Agent执行

例如：

LangGraph
CrewAI
AutoGen
OpenAI Agents SDK

Anthropic 做的是：Workflow Generator

人 → 目标描述        ↓ LLM 生成执行系统（DAG）        ↓ hundreds of agents 并行执行        ↓ adversarial verification        ↓   自动收敛结果

这实际上跨过了一个巨大门槛，以前：


Programmer   ↓Workflow

现在：


  LLM   ↓Workflow

从软件工程角度看未来，会形成三层架构：

目前：

Anthropic 最靠近第三层（Dynamic Workflow）
OpenAI 最强的是第二层（AgentKit + Agents SDK）

所以如果用一句话总结：

OpenAI 在打造 Agent 开发平台，Anthropic 在打造 Agent 操作系统。

国内玩家现状

国内厂商大致分成三个梯队：


Claude Dynamic Workflow          ▲          │ ┌────────┼─────────┐ │        │         │Coze     阿里      智谱 │        │         │ └────────-─────────┘

第一梯队：字节 Coze（扣子）

实际上最接近 Anthropic 思路的是字节，官方已经明确把 Coze 2.0 定位为：

长期规划、自主执行、多体协同的 Agent 平台。

其核心能力已经包括：

Workflow
Agent Skills
Agent Plan
长周期任务
多Agent协同
动态任务规划

官方甚至提出：

从流程工具升级为智能执行体。

这和Claude Dynamic Workflow的方向非常像：


用户目标    │    ▼Agent Plan    │    ▼Workflow    │ ┌──┼───┐ ▼  ▼   ▼Agent Agent Agent

区别在于：

Claude：Workflow 运行时生成

Coze：Workflow 主要由用户设计

第二梯队：阿里（Qwen + 千问云）

阿里最近实际上已经开始全面转向 Agent。

2026 阿里云峰会发布的：千问云（Qwen Cloud）

官方定位：

为 Agent 而生的基础设施。

其中最值得注意的是：Skill 化

阿里把：

模型调用
工具调用
云资源

全部封装成：Skill形式。

这意味着，以前：


Agent  │  ▼API
以后：


Agent  │  ▼Skill  │  ▼云资源

这其实已经具备：

Agent Runtime
Tool Registry
Skill Marketplace

雏形。

与 Claude 差距在哪？

目前阿里更像：Agent Infrastructure

而 Claude 是：Agent Orchestration

差距主要在：

动态 DAG 生成
大规模并行 Agent 调度
自动收敛机制

第三梯队：智谱 AutoGLM

智谱是国内最早认真做 Agent 的厂商之一，其 AutoGLM 已经支持：

深度研究
自动搜索
自动规划
自动执行任务

等能力，其架构更接近：


Goal │ ▼Planner │ ▼Tool Use │ ▼Result

而不是：


Goal │ ▼Workflow Generator │ ▼100 Agents │ ▼Verifier
所以，智谱目前更接近OpenAI Operator路线，而不是Claude Dynamic Workflow路线。

总结：国内厂商普遍处于 “平台化 Agent” 或 “固定 Planner + Task” 阶段，距离 Claude DW 的自动化 DAG 生成和大规模并行执行还有差距，但正在快速追赶。

为什么国内还没出现 Dynamic Workflow？

大致原因有以下几个：

模型能力刚够

Dynamic Workflow有个隐藏前提：Agent 要会写 Workflow

这要求：

长上下文
强规划能力
稳定 Tool Calling

同时在线。

Claude Opus 4.8 恰好是目前最强的 Coding Agent 之一。

成本问题

Anthropic 官方案例里：

几十 ~ 数百 Agent

同时运行。

阿里已经开始把整个云平台改造成 Agent-First 架构（Skills + CLI + Agent Runtime）。
DeepSeek 目前仍聚焦模型层，而不是 Agent 编排层。

从产业趋势看，2026～2027 年很可能出现这样的架构：


DeepSeek / Qwen / GLM          │          ▼Dynamic Workflow Engine          │          ▼100~1000 Agent Swarm          │          ▼自动软件开发

而 Claude Dynamic Workflow 只是这一阶段最先落地的代表产品之一。

写在最后

Dynamic Workflows 的真正意义不是“更聪明的 AI”，而是：

把 AI 从“执行者”升级为“临时分布式系统编译器”

它带来的变化可以概括为三点：

从单 Agent → 多 Agent 协同系统
从静态 Subagent → 动态执行图
从一次性生成 → 持续验证与收敛

Claude Dynamic Workflows 的价值不仅在于生成代码，更在于：

自动生成 DAG 任务图。
并行调度数百 Agent。
内置验证和自愈机制。

Subagent 是工具人式协作，Dynamic Workflows 是操作系统级调度器。

国内厂商正在向这一方向追赶，而 Claude DW 已经成为大规模工程自动化的标杆。

END