AI 实用工具
2026-05-29

今天最重磅的是 Anthropic 在 Claude Code 中悄然开放了 Workflow 模式——用 JavaScript 脚本取代自然语言编排多 agent 协作,这是一个足以和 MCP、Skills 并列的范式升级。另外三个工具也围绕"让 agent 从对话升级为工程系统"这个方向。
Claude Code Workflow — 用代码取代 Prompt 编排多 Agent
5 月中旬发布的 Claude Code v2.1.147 中,Anthropic 在发布说明里删掉了对这个功能的描述,但它稳定可用:Workflow 模式。核心就是把多 agent 编排从自然语言"临场指挥"升级为 JavaScript 脚本"代码驱动"——用代码处理控制流(循环/条件/并行/重试),LLM 只负责每个步骤内的判断工作。
为什么这件事重要?当前所有 AI agent 编排方案都有一个根本缺陷:主 agent 需要把每个子 agent 的输出拼进自己的上下文窗口,子 agent 越多、上下文越长,性能越差、token 成本越高(学术界称为"lost in the middle"问题)。Workflow 把这个负担从 LLM 上下文里拆出来,放到 JavaScript 变量里——编排脚本本身不消耗模型 token,只有每个 agent() 调用消耗。方案完成后只把最终结果返回给你,中间所有 agent 的对话历史都不进入主会话。
使用时只需设置一个环境变量启动 Claude Code,然后在 prompt 中包含 workflow 关键词,或者使用 ultracode 模式:
export ANTHROPIC_WORKFLOW=1
claude
# 然后在对话中输入:workflow 分析当前 PR 并生成多 agent review 工作流后运行Claude Code 不会直接执行任务,而是先编写一个完整的 JavaScript 脚本。脚本包含元数据、多个执行阶段(Stage)、每个阶段的 Agent 定义。你可以用 /workflows 命令打开可视化监控界面。完整的工作流脚本示例——deep-research 深度研究(官方内置):
export default {
metadata: {
name: "deep-research",
description: "Multi-source parallel search, fact verification, report synthesis"
},
stages: [
{
id: "search",
description: "并行搜索官方文档、学术论文和社区讨论",
parallel: true,
agents: [
{ id: "official-docs", tools: ["web-search"], ... },
{ id: "papers", tools: ["arxiv-search"], ... },
{ id: "community", tools: ["reddit", "github"], ... }
]
},
{
id: "verification",
description: "交叉验证三个来源,标记矛盾",
dependsOn: ["search"],
agents: [{ id: "fact-checker", tools: ["web-search"], ... }]
},
{
id: "synthesis",
description: "生成最终技术报告",
dependsOn: ["verification"],
agents: [{ id: "report-writer", ... }]
}
],
return: async (context) => { ... }
};Workflow 和已有的 Skills / Sub-agent / Agent Teams 的关系值得理清:Skills 解决"能力封装",Sub-agent 解决"临时委派",Agent Teams 解决"多角色并行",Workflow 解决的是"流程固化"——把编排写成代码,让多 agent 协作变得可复现、可追踪、可验证。一句话:Skills 封装能力,Workflow 封装流程。
同类工具对比
| 工具 | 编排方式 | 复现性 | 成熟度 |
|---|---|---|---|
| Claude Code Workflow | JavaScript 脚本,代码驱动 | 完全可复现 | Research Preview |
| Claude Code Sub-agent | 自然语言 prompt | 不可复跑 | 稳定 |
| LangGraph | Python DAG | 代码驱动,可复现 | GA |
需要 Claude Code v2.1.154+,Max/Team/Enterprise 计划可用。community skill: ray-amjad/claude-code-workflow-creator
📦 Claude Code v2.1.154+ · Research Preview · 官方文档: code.claude.com/docs/en/workflows
AgentKit — 像 create-vite 一样脚手架多 Agent 工作流
大多数开发者使用 Claude Code 的方式是单次长对话:描述需求、Claude 写代码、纠错、再提示。AgentKit 要解决的就是这个:把 Claude Code 从"聊天式一对一代码助手"升级到"可编排的多 agent 工程流水线"。
核心思路很简洁。AgentKit 本身不含任何 AI——它是一个结构生成工具,在项目里脚手架出一套编排文件:CLAUDE.md、PLAYBOOK.md、AGENT_WORKFLOW.md。工作流分三个阶段:Phase 0 分解(Claude Code 读蓝图,提出 agent 拆分方案)→ 技能注入暂停(往每个 agent 目录丢 API 文档和数据)→ Phase 1 执行(每个 agent 按顺序跑,失败自动重试三次)。
npx @patricksardinha/agentkit-cli init
npx @patricksardinha/agentkit-cli init --blueprint PROJECT_BLUEPRINT.md
# 然后在 Claude Code 中输入: Read PLAYBOOK.md and execute the procedure.作者用 AgentKit 自举构建了一个真实项目——DevLog Desktop,一个基于 Tauri v2 + Ollama 本地 RAG 的桌面应用。结果:6 个 agent 自主执行,68 个测试通过,完整中英文国际化、暗色模式、语义搜索。整个过程在一个 Claude Code 会话中完成。
⭐ 1 · v1.0.0 · MIT · github.com/patricksardinha/agentkit-cli
Mirage — 给 AI Agent 一个统一的虚拟文件系统
AI agent 面临一个根本性的碎片化问题:要访问 S3 桶里的日志、Google Drive 里的文档、Slack 频道里的消息、GitHub 仓库里的代码——每种数据源有自己的 SDK 和认证方式。Mirage 用一个统一的虚拟文件系统解决这个问题:把所有数据源挂载到同一个文件树下,agent 用 ls、cat、grep、cp 这些最熟悉的 bash 命令就能操作一切。
# Python
uv add mirage-ai
# TypeScript
npm install @struktoai/mirage-node
npx install @struktoai/mirage-browser # 浏览器/边缘
# CLI
npx install -g @struktoai/mirage-clifrom mirage import Workspace
from mirage.resource.s3 import S3Resource, S3Config
ws = Workspace({
"/data": RAMResource(),
"/s3": S3Resource(S3Config(bucket="my-bucket")),
})
await ws.execute("cp /s3/report.csv /data/report.csv")
await ws.execute("grep alert /s3/log.jsonl | wc -l")五月初发布三周内拿到 2.7k stars,增速说明这是个真实且未被满足的需求。
⭐ 2,703 · v0.0.1 · Apache 2.0 · github.com/strukto-ai/mirage
Pullfrog — 开源版 CodeRabbit,Zod 作者新作
AI 代码审查赛道过去一年增长有目共睹:CodeRabbit 是品类定义者,GitHub Copilot Code Review 上线后迅速铺开。但这些工具要么闭源托管 SaaS,要么绑定特定模型供应商。Pullfrog 走了第三条路:完全开源,运行在你自己仓库的 GitHub Actions 里,模型自选(BYOK),代码和数据都不出你的 GitHub 环境。
Pullfrog 由 Colin McDonnell 创建——他是 Zod(TypeScript 生态最流行的 schema 验证库,42,000+ stars)的作者。Pullfrog 是一个运行在 CI 中的 agent 编排层:监听 GitHub webhook 事件,按配置触发 agent 执行。使用方式简单:安装 Pullfrog GitHub App → 在仓库里加一个 workflow → 在 PR 或 issue 里 @pullfrog 触发。
# .github/workflows/pullfrog.yml
jobs:
pullfrog:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v6
- uses: pullfrog/pullfrog@v0
with:
prompt: ${{ inputs.prompt }}
env:
ANTHROPIC_API_KEY: ${{ secrets.ANTHROPIC_API_KEY }}| 工具 | 部署方式 | 模型策略 | 价格 |
|---|---|---|---|
| Pullfrog | GitHub Actions(自托管) | BYOK,多供应商 | 开源免费 |
| CodeRabbit | 托管 SaaS | 自有模型 | 免费层 + $12/月 |
| GitHub Copilot Code Review | GitHub 原生 | Copilot 模型 | Copilot 订阅内含 |
⭐ 400+ · Beta · MIT · github.com/pullfrog/pullfrog · pullfrog.com
夜雨聆风