AI 实用工具 · 2026-05-29

AI 实用工具

2026-05-29

今天最重磅的是 Anthropic 在 Claude Code 中悄然开放了 Workflow 模式——用 JavaScript 脚本取代自然语言编排多 agent 协作，这是一个足以和 MCP、Skills 并列的范式升级。另外三个工具也围绕"让 agent 从对话升级为工程系统"这个方向。

Claude Code Workflow — 用代码取代 Prompt 编排多 Agent

5 月中旬发布的 Claude Code v2.1.147 中，Anthropic 在发布说明里删掉了对这个功能的描述，但它稳定可用：Workflow 模式。核心就是把多 agent 编排从自然语言"临场指挥"升级为 JavaScript 脚本"代码驱动"——用代码处理控制流（循环/条件/并行/重试），LLM 只负责每个步骤内的判断工作。

为什么这件事重要？当前所有 AI agent 编排方案都有一个根本缺陷：主 agent 需要把每个子 agent 的输出拼进自己的上下文窗口，子 agent 越多、上下文越长，性能越差、token 成本越高（学术界称为"lost in the middle"问题）。Workflow 把这个负担从 LLM 上下文里拆出来，放到 JavaScript 变量里——编排脚本本身不消耗模型 token，只有每个 agent() 调用消耗。方案完成后只把最终结果返回给你，中间所有 agent 的对话历史都不进入主会话。

使用时只需设置一个环境变量启动 Claude Code，然后在 prompt 中包含 workflow 关键词，或者使用 ultracode 模式：

export ANTHROPIC_WORKFLOW=1
claude
# 然后在对话中输入：workflow 分析当前 PR 并生成多 agent review 工作流后运行

Claude Code 不会直接执行任务，而是先编写一个完整的 JavaScript 脚本。脚本包含元数据、多个执行阶段（Stage）、每个阶段的 Agent 定义。你可以用 /workflows 命令打开可视化监控界面。完整的工作流脚本示例——deep-research 深度研究（官方内置）：

export default {
  metadata: {
    name: "deep-research",
    description: "Multi-source parallel search, fact verification, report synthesis"
  },
  stages: [
    {
      id: "search",
      description: "并行搜索官方文档、学术论文和社区讨论",
      parallel: true,
      agents: [
        { id: "official-docs", tools: ["web-search"], ... },
        { id: "papers", tools: ["arxiv-search"], ... },
        { id: "community", tools: ["reddit", "github"], ... }
      ]
    },
    {
      id: "verification",
      description: "交叉验证三个来源，标记矛盾",
      dependsOn: ["search"],
      agents: [{ id: "fact-checker", tools: ["web-search"], ... }]
    },
    {
      id: "synthesis",
      description: "生成最终技术报告",
      dependsOn: ["verification"],
      agents: [{ id: "report-writer", ... }]
    }
  ],
  return: async (context) => { ... }
};

Workflow 和已有的 Skills / Sub-agent / Agent Teams 的关系值得理清：Skills 解决"能力封装"，Sub-agent 解决"临时委派"，Agent Teams 解决"多角色并行"，Workflow 解决的是"流程固化"——把编排写成代码，让多 agent 协作变得可复现、可追踪、可验证。一句话：Skills 封装能力，Workflow 封装流程。

同类工具对比

工具	编排方式	复现性	成熟度
Claude Code Workflow	JavaScript 脚本，代码驱动	完全可复现	Research Preview
Claude Code Sub-agent	自然语言 prompt	不可复跑	稳定
LangGraph	Python DAG	代码驱动，可复现	GA

需要 Claude Code v2.1.154+，Max/Team/Enterprise 计划可用。community skill: ray-amjad/claude-code-workflow-creator

📦 Claude Code v2.1.154+ · Research Preview · 官方文档: code.claude.com/docs/en/workflows

AgentKit — 像 create-vite 一样脚手架多 Agent 工作流

大多数开发者使用 Claude Code 的方式是单次长对话：描述需求、Claude 写代码、纠错、再提示。AgentKit 要解决的就是这个：把 Claude Code 从"聊天式一对一代码助手"升级到"可编排的多 agent 工程流水线"。

核心思路很简洁。AgentKit 本身不含任何 AI——它是一个结构生成工具，在项目里脚手架出一套编排文件：CLAUDE.md、PLAYBOOK.md、AGENT_WORKFLOW.md。工作流分三个阶段：Phase 0 分解（Claude Code 读蓝图，提出 agent 拆分方案）→ 技能注入暂停（往每个 agent 目录丢 API 文档和数据）→ Phase 1 执行（每个 agent 按顺序跑，失败自动重试三次）。

npx @patricksardinha/agentkit-cli init
npx @patricksardinha/agentkit-cli init --blueprint PROJECT_BLUEPRINT.md
# 然后在 Claude Code 中输入: Read PLAYBOOK.md and execute the procedure.

作者用 AgentKit 自举构建了一个真实项目——DevLog Desktop，一个基于 Tauri v2 + Ollama 本地 RAG 的桌面应用。结果：6 个 agent 自主执行，68 个测试通过，完整中英文国际化、暗色模式、语义搜索。整个过程在一个 Claude Code 会话中完成。

⭐ 1 · v1.0.0 · MIT · github.com/patricksardinha/agentkit-cli

Mirage — 给 AI Agent 一个统一的虚拟文件系统

AI agent 面临一个根本性的碎片化问题：要访问 S3 桶里的日志、Google Drive 里的文档、Slack 频道里的消息、GitHub 仓库里的代码——每种数据源有自己的 SDK 和认证方式。Mirage 用一个统一的虚拟文件系统解决这个问题：把所有数据源挂载到同一个文件树下，agent 用 ls、cat、grep、cp 这些最熟悉的 bash 命令就能操作一切。

# Python
uv add mirage-ai
# TypeScript
npm install @struktoai/mirage-node
npx install @struktoai/mirage-browser   # 浏览器/边缘
# CLI
npx install -g @struktoai/mirage-cli

from mirage import Workspace
from mirage.resource.s3 import S3Resource, S3Config
ws = Workspace({
    "/data": RAMResource(),
    "/s3":   S3Resource(S3Config(bucket="my-bucket")),
})
await ws.execute("cp /s3/report.csv /data/report.csv")
await ws.execute("grep alert /s3/log.jsonl | wc -l")

五月初发布三周内拿到 2.7k stars，增速说明这是个真实且未被满足的需求。

⭐ 2,703 · v0.0.1 · Apache 2.0 · github.com/strukto-ai/mirage

Pullfrog — 开源版 CodeRabbit，Zod 作者新作

AI 代码审查赛道过去一年增长有目共睹：CodeRabbit 是品类定义者，GitHub Copilot Code Review 上线后迅速铺开。但这些工具要么闭源托管 SaaS，要么绑定特定模型供应商。Pullfrog 走了第三条路：完全开源，运行在你自己仓库的 GitHub Actions 里，模型自选（BYOK），代码和数据都不出你的 GitHub 环境。

Pullfrog 由 Colin McDonnell 创建——他是 Zod（TypeScript 生态最流行的 schema 验证库，42,000+ stars）的作者。Pullfrog 是一个运行在 CI 中的 agent 编排层：监听 GitHub webhook 事件，按配置触发 agent 执行。使用方式简单：安装 Pullfrog GitHub App → 在仓库里加一个 workflow → 在 PR 或 issue 里 @pullfrog 触发。

# .github/workflows/pullfrog.yml
jobs:
  pullfrog:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v6
      - uses: pullfrog/pullfrog@v0
        with:
          prompt: ${{ inputs.prompt }}
        env:
          ANTHROPIC_API_KEY: ${{ secrets.ANTHROPIC_API_KEY }}

工具	部署方式	模型策略	价格
Pullfrog	GitHub Actions（自托管）	BYOK，多供应商	开源免费
CodeRabbit	托管 SaaS	自有模型	免费层 + $12/月
GitHub Copilot Code Review	GitHub 原生	Copilot 模型	Copilot 订阅内含

⭐ 400+ · Beta · MIT · github.com/pullfrog/pullfrog · pullfrog.com