乐于分享
好东西不私藏

AI开发进入下一阶段

AI开发进入下一阶段

Harness Engineering 教你怎么让 Agent 写出靠谱的代码,Symphony 教你怎么让几十个 Agent 同时跑起来你只需要看结果。

说个暴论,2026年AI编码工具的竞争已经结束了。

不是谁的模型更强的问题,是谁先解决人类注意力瓶颈的问题。

OpenAI 刚刚开源的 Symphony,18.2K Star,1500 Fork,不是什么新框架新模型,就一份 SPEC 文件。

但这份 SPEC 揭示了一件事:AI编码的下一个阶段,不是让 Agent 更聪明,而是让人类从监督Agent变成管理工作。

瓶颈不在Agent,在你

OpenAI 自己的团队碰到了一个尴尬的真相。

每个工程师同时能有效监督的 Codex 会话,只有3到5个。

超过5个,生产力断崖式下跌。

忘记哪个会话在干什么,在十几个终端间跳来跳去纠正偏航的 Agent,调试卡在半路的长时间任务。

Agent 本身越来越快,模型越来越强,但人类注意力成了整个系统的瓶颈。

用 OpenAI 团队自己的话说:

我们实际上组建了一支能力极强的初级工程师团队,然后让人类工程师去微观管理他们。这没法扩展。

这句话说得特别精准。

你以为 AI 时代拼的是谁的模型强,其实当 Agent 足够强之后,拼的是谁先解决人类注意力的天花板。

Harness Engineering 的下一步

去年 OpenAI 发了一篇 Harness Engineering 的文章。

核心理念是:把仓库变成 Agent 能自主工作的乐园。

自动化测试全覆盖,CI/CD 完善,文档清晰,每个 PR 都有 guardrails 挡着。

Harness Engineering 解决的问题是:让 Agent 的输出靠谱。

但它没解决另一个问题:一个工程师同时管不了几个 Agent。

你把仓库调教得再好,一个工程师也只能盯着 3-5 个会话。

Symphony 就是 Harness Engineering 之后的下一步。

如果说 Harness Engineering 是把仓库变成 Agent 友好的,那 Symphony 是把工作流变成 Agent 友好的。

从”教 Agent 怎么写代码”到”告诉 Agent 该做什么”,这个转变比任何模型升级都重要。

Symphony 到底做了什么

一句话:Issue 进去,验证过的 PR 出来,中间的过程 AI 自己搞定。

传统的工作流是这样的:

工程师手动开 Codex → 分配任务 → 监督执行 → 审查输出 → 循环

Symphony 的工作流变成:

工程师在 Linear 创建 Issue → Symphony 自动分配 Agent → Agent 自主完成 → 工程师只看结果

它是一个长运行的自动化服务,核心就这么几件事:

  1. 持续轮询 Issue:每隔 30 秒扫一次 Linear 看板
  2. 每个 Issue 一个独立 Agent:隔离工作空间,互不干扰
  3. Agent 自己跑完所有步骤:写代码、跑测试、提 PR、录演示视频
  4. 人类只做最后审查:CI 全绿了、安全审查过了,才出现在你的 Review 队列

它的设计哲学特别有意思,Spec-first,实现自由

OpenAI 没有给你一个锁定在特定语言的框架,而是给了一份精确的规范文档。

你可以让任何编码 Agent 按照这份 SPEC,用你喜欢的语言实现。

一个提示词就搞定:

请根据以下规范实现 Symphony:https://github.com/openai/symphony/blob/main/SPEC.md

WORKFLOW.md:一切的起点

每个用 Symphony 的项目,根目录放一个 WORKFLOW.md。

这个文件用 YAML 定义运行配置(轮询间隔、并发数、超时),用 Markdown 定义给 Agent 的提示模板。

---tracker:  kind: linear  project_slug: my-team/backendpolling:  interval_ms: 30000agent:  max_concurrent_agents: 10codex:  command: codex app-server  turn_timeout_ms: 3600000---你是一个正在处理 Linear Issue 的编码 Agent。请根据以下任务描述完成工作:{{ issue.title }}{{ issue.description }}

注意 max_concurrent_agents: 10。

以前一个工程师管 3-5 个会话就崩溃了,现在直接并行跑 10 个、20 个、50 个。

因为你不监督了,你只看结果。

500% 的 PR 增长

OpenAI 报告,部分团队采用 Symphony 后,前三周落地的 PR 数量增长了 500%

500%。

但比这个数字更重要的是三个认知变化:

探索成本趋近于零。

不确定某个方案可行?直接丢个 Issue 给 Agent 试探,不满意就扔掉。

以前你需要花一天验证一个想法,现在五分钟就能看到 Agent 的尝试结果。

工作发起去中心化。

产品经理和设计师可以直接往 Symphony 里提需求,获得包含视频演示的完整审查包。

不需要先找工程师排期,不需要写完需求文档再等实现。

工程师只做真正需要人的事。

日常实现工作交给 Agent,工程师把精力集中在需要判断力和专业能力的任务上。

OpenAI 分享了一个场景:一位工程师在山间小屋,用手机上的 Linear App,通过不太稳定的 WiFi,提交了三个重要改动。

因为 Symphony 7×24 小时运行,你从任何地方添加任务,都有 Agent 接手。

任务即状态机

Symphony 把 Linear 的工单状态当成工作流的状态机:

Todo → Agent 认领任务,开始工作

In Progress → Agent 编码、测试、提交 PR

Human Review → 等待人类审查

Done → 工作完成

关键设计:工作和 PR 解耦。

一个 Issue 可能产生跨仓库的多个 PR,也可能纯粹是调研分析,从不碰代码。

这让 Issue 能表示更大粒度的工作单元。

还支持 DAG 依赖和自动编排,Agent 自己创建子任务并定义依赖关系。

比如一次 React 升级可能被拆分为:

Vite 迁移 ← Agent 先完成这个

React 升级 ← Vite 完成后自动开始

测试修复 ← React 升级后自动开始

Agent 只处理未被阻塞的任务,执行自然地并行展开。

AI编码的三个阶段

过去一年半,AI编码工具经历了非常清晰的演进路径:

第一阶段:Copilot 式辅助。

AI 帮你补全代码,你仍然主导,按 Tab 就行。

第二阶段:Agent 式交互。

AI 独立完成任务,你审查结果,Claude Code 和 Codex 就是这个阶段。

第三阶段:编排式自主。

AI 自主管理任务队列,你管理工作而非 Agent。

Symphony 是第三个阶段的第一个标志性产物。

它把软件工程师的角色进一步推向”定义问题和审查方案的人”。

诚实地说

Symphony 现在还有明确的边界。

只支持 Linear。 其他项目管理工具需要自行适配。规范是语言和平台无关的,社区适配只是时间问题,但现在就是只有 Linear。

需要 Harness Engineering 的基础。 你的仓库如果没有完善的自动化测试、CI/CD 和文档,Symphony 效果会大打折扣。说白了,如果 Agent 写出来的代码你都不敢自动合并,编排再多层也没用。

复杂任务仍需人类。 模糊的需求、需要深度判断的问题,Symphony 不能完全替代。

安全信任问题。 让 Agent 自动提交代码,对安全和合规提出更高要求。OpenAI 自己说得很清楚,这是一个低密级的工程预览版,在可信环境里测试用。

你现在该做什么

如果你已经在用 Codex 或 Claude Code 做开发:

第一步,先把 Harness Engineering 做好。

自动化测试、CI/CD、文档、guardrails,这是所有后续事情的基础。

没有这一层,编排工具就是空中楼阁。

第二步,认真读一遍 SPEC.md。

哪怕你现在不用 Symphony,理解它的设计哲学本身就是收获。

从”管理 Agent”到”管理工作”这个视角的转变,值得所有使用 AI 编码工具的人思考。

第三步,试试让你当前的编码 Agent 按 SPEC 实现一个你自己的版本。

OpenAI 的参考实现是 Elixir 写的,但规范是语言无关的。

用你熟悉的技术栈,花一个下午就能搞出来。

说实话,现在大多数团队还停留在第二阶段,少数团队刚摸到第三阶段的门。

但这个方向的窗口期不会太长。

当越来越多的团队学会编排几十个 Agent 同时工作,个人效率的差距会被组织效率的差距彻底甩开。

跟当初 Harness Engineering 出来时一样,先吃螃蟹的人,先拿到复利。


相关链接:

  • OpenAI 官方博客:An open-source spec for Codex orchestration: Symphony[1]
  • GitHub 仓库:openai/symphony(18.2K Star)[2]
  • 前置概念:Harness Engineering[3]

⚠️ 免责声明

  • 本文内容仅供参考和学习交流,不构成任何投资建议或专业意见
  • 信息来源均为公开渠道,已尽力核实但不保证完全准确
  • 如有侵权或不妥之处,请联系删除
  • 转载请注明来源:Future Observation

📦 更多好内容

🤖 AI研习室合集 — AI前沿、模型解读、实战技巧,每天学一点📱 今日生活合集 — 消费电子、新车发布、数码好物,每天精选💻 今日科技合集 — AI动态、开源项目、前沿技术,每天3分钟


Future Observation · AI研习室,和你一起深入理解人工智能

长按识别二维码,关注我们 👇

关注二维码

引用链接

[1] OpenAI 官方博客:An open-source spec for Codex orchestration: Symphony: https://openai.com/index/open-source-codex-orchestration-symphony/[2] GitHub 仓库:openai/symphony(18.2K Star): https://github.com/openai/symphony[3] 前置概念:Harness Engineering: https://openai.com/index/harness-engineering/