AI Coding 正在重写软件工程:从 Vibe Coding 到 Harness Engineering

AI Coding 正在重写软件工程：从 Vibe Coding 到 Harness Engineering

一篇看懂 Vibe Coding、TDD、SDD、OpenSpec、Spec Kit、Claude Team、superpowers、Context Engineering、Harness Engineering 之间关系的全景文章。

先说结论

过去的软件工程，核心问题是“如何把代码写出来并写正确”；今天的 AI Coding，核心问题已经慢慢变成了：

• 如何把需求讲清楚
• 如何把上下文组织好
• 如何把验证闭环搭起来
• 如何让代理在正确的环境里持续稳定地产出

这也是为什么最近一年，开发圈突然冒出很多“有名字的方法论”：

• Vibe Coding
• TDD
• SDD
• OpenSpec
• Spec Kit
• Claude Team
• superpowers
• Context Engineering
• Harness Engineering

很多人第一次看到这些词，会有一种混乱感：它们都像是在讨论 AI 编程，但又不像同一类东西。

这篇文章的目标，就是把这几个名字放到一张工程地图里，讲清楚：

1. 它们分别解决什么问题
2. 它们处在开发流程的哪一层
3. 它们彼此之间到底是替代关系，还是组合关系
4. 一个团队真正落地 AI Coding 时，应该如何把它们串起来

说明：这篇文章只讨论“命名开发范式 / 工作流”，不展开 Prompt、MCP、Skills、Rule 这些基础构件。它们更像积木，不是本文要讨论的方法论品牌。

术语提醒：SDD 在社区里经常一词多义。本文默认把 SDD 写作 Spec-Driven Development；如果特指多个子代理分工执行，我会写成 Subagent-Driven Development，避免混淆。

零、先把这些名字翻译成人话

很多文章一上来就直接丢缩写，读者如果不是天天泡在 AI Coding 圈里，很容易第一段就掉队。所以在进入正文之前，我们先把这些名字逐个“翻译成人话”。

一张表看懂这些名词

名称	全称 / 来源	直译	更容易理解的中文说法	一句话解释
`Vibe Coding`	社区流行说法	氛围式编程 / 感觉流编程	凭感觉和 AI 一来一回把东西做出来	先做出来再说，适合原型，不适合复杂系统
`TDD`	`Test-Driven Development`	测试驱动开发	先写测试，再写实现	用测试反向约束代码行为
`SDD`	`Spec-Driven Development`	规格驱动开发	也常被通俗写成“规范驱动开发”	先把需求、边界、验收标准写成 spec，再驱动后续开发
`OpenSpec`	社区开源框架名	开放规格	轻量级规格驱动框架	把 spec 直接放进代码仓库里管理
`Spec Kit`	GitHub 开源工具箱	规格工具箱	规格驱动开发工具链	把 spec、plan、tasks 串成一条可执行流程
`Claude Team`	本文的归纳说法	Claude 团队式协作	团队级人机协作范式	把 AI 当成团队协作中的参与者，而不是补全插件
`superpowers`	`obra/superpowers` 项目名	超能力	给 AI 代理配一整套开发超能力	用固定 workflow 把 planning、subagent、TDD、review 串起来
`Context Engineering`	社区 / GitHub 官方文章用法	上下文工程	给 AI 组织上下文的方法论	不是给更多信息，而是给更相关的信息
`Harness Engineering`	OpenAI 提法	Harness 可译作工装 / 执行框架 / 试验台	面向代理的执行环境工程	给代理搭一套能运行、验证、修复、回归的闭环环境

几个最容易误解的词

1. `Spec` 到底是什么意思？

Spec 是 Specification 的缩写。在软件工程里，它不是“随手写两句说明”，而是对需求、边界、约束、验收标准的结构化表达。

所以 SDD 更准确的翻译，其实是：

• 规格驱动开发

但在中文技术社区里，很多人也会把它说成：

• 规范驱动开发

这两种翻法都有人用。如果追求准确，规格驱动开发 更贴近英文原意；如果面向大众表达，规范驱动开发 更容易让人一下子理解它强调“先把标准写清楚”。

2. `Harness` 为什么这么难翻？

Harness 在英文里本义是“马具、安全带、束具”，核心含义是“把东西套住、固定住、控制起来”。在软件工程语境里，它经常出现在：

• test harness
• evaluation harness
• agent harness

所以 Harness Engineering 如果硬翻，会很别扭。更容易理解的方式是把它解释成：

• 为代理搭建执行工装
• 为代理搭建验证与回路环境
• 为代理设计可运行、可观测、可修复的执行框架

它强调的重点不是“写 prompt”，而是“搭环境”。

3. `Claude Team` 是不是一个官方固定术语？

严格说，不是。它更像我在这篇文章里对 Anthropic 官方案例的一种归纳命名，用来指代“团队级地使用 Claude / Claude Code 进行协作”的那种范式。

也就是说，TDD、SDD 这类词是相对经典的方法论名词；而 Claude Team 更接近一种“可被识别的人机协作风格”。

4. `superpowers` 为什么叫这个名字？

它字面意思就是“超能力”。这个项目想表达的是：不是只给 AI 一个聊天框，而是给它一整套可复用的软件开发超能力，比如：

• brainstorming
• 计划编写
• 子代理分工
• TDD
• code review
• branch finish

所以它叫 superpowers，本质上是在表达“给代理装上完整开发能力包”。

一、为什么 AI Coding 时代突然出现这么多“有名字的方法论”？

因为 AI 编程已经不再只是“让模型补几行代码”。

早期大家谈 AI Coding，重点通常是：

• 哪个模型更强
• 哪个提示词更准
• 哪个 IDE 更顺手

但一旦 AI 真正进入真实项目，问题马上会升级：

• 为什么模型写出来的第一版总是“看着像对的，但细节不对”？
• 为什么小 Demo 很顺，但一进大仓库就开始飘？
• 为什么多人协作、多轮会话、跨模块改造时，AI 表现明显下降？
• 为什么 AI 很擅长生成代码，却不擅长持续稳定地把任务做完？

答案是：代码生成本身，只是整个工程闭环里最便宜的一步。

真正昂贵、也真正决定交付质量的，是下面这些事情：

• 意图是否被正确定义
• 需求是否被结构化沉淀
• 测试是否能形成约束
• 上下文是否足够且相关
• 工具是否接得正确
• 代理是否有验证与回退机制

也正因为这样，AI Coding 的讨论重点，开始从“模型是否聪明”转向“系统是否可靠”。而这些新范式，本质上就是对这个问题的不同回答。

维度	OpenSpec	Spec Kit
定位	轻量 spec-driven framework	GitHub 风格的 spec-driven toolkit
气质	简洁、通用、工具无关	流程更完整、组织化更强
适用	想低成本开始 spec 化	想把 spec 驱动变成团队级工作方式
强项	轻、快、好上手	流程完整、适合系统化落地

名称	它主要回答的问题	所在层次	最适合的场景	主要短板
`Vibe Coding`	能不能先做出来？	原型层	Demo、原型、探索	容易失控
`TDD`	代码行为是否正确？	验证层	模块实现、回归保护	不擅长定义系统意图
`SDD`	我们到底要构建什么？	规格层	中大型功能、多人协作	容易被做重
`OpenSpec`	怎么把规格落到仓库里？	规划层	存量项目、持续迭代	需要持续维护
`Spec Kit`	怎么把规格驱动变成工具链？	流程层	团队级落地	上手成本更高
`Claude Team`	怎么让 AI 真正融入团队？	协作层	跨角色协同、复杂推进	依赖团队习惯
`superpowers`	怎么把 planning 到 review 串成 workflow？	执行层	想把 AI 工作流模板化的团队	对纪律要求高
`Context Engineering`	怎么让代理一直拿到正确上下文？	上下文层	长流程、多轮、多代理协作	做不好会污染上下文
`Harness Engineering`	怎么让代理稳定闭环执行？	环境层	长时任务、自动化研发体系	建设成本最高

AI Coding 正在重写软件工程：从 Vibe Coding 到 Harness Engineering

先说结论

零、先把这些名字翻译成人话

一张表看懂这些名词

几个最容易误解的词

1. Spec 到底是什么意思？

2. Harness 为什么这么难翻？

3. Claude Team 是不是一个官方固定术语？

4. superpowers 为什么叫这个名字？

一、为什么 AI Coding 时代突然出现这么多“有名字的方法论”？

图 1：AI Coding 范式总览

二、这些名字其实不在一个层级上

图 2：这些范式分别处在哪一层

三、Vibe Coding：最快的起点，也是最容易失控的起点

Vibe Coding 的优点

Vibe Coding 的问题

它适合什么，不适合什么？

插图建议

四、TDD：AI 时代最被低估、却重新变得更重要的方法

为什么 TDD 在 AI Coding 里更重要？

图 3：TDD 在 AI Coding 中的作用

TDD 的价值

TDD 的边界

五、SDD：AI 时代真正该先写的，往往不是代码，而是规格

SDD 解决的核心问题

SDD 的本质

常见误区

六、OpenSpec：把 SDD 变成仓库里的轻量规划层

图 4：OpenSpec 的核心产物

OpenSpec 为什么适合 AI Coding？

OpenSpec 更适合谁？

七、Spec Kit：GitHub 把规格驱动开发做成了一整套工具箱

Spec Kit 关注的流程

OpenSpec 和 Spec Kit 的区别

八、Claude Team：当 AI 不再只是工具，而开始像团队成员

这说明了什么？

图 5：Claude Team 式的人机协作

Claude Team 范式的核心

九、superpowers：把 brainstorming、计划、子代理、TDD、Review 串成强制工作流

图 6：superpowers 的核心 workflow

为什么 superpowers 值得单独讲？

它适合什么团队？

十、Context Engineering：AI Coding 真正的分水岭，不是更会写 Prompt，而是更会给上下文

Context Engineering 在做什么？

常见失败场景

图 7：错误上下文 vs 正确上下文

它的本质是什么？

十一、Harness Engineering：代理时代真正的工程，开始于环境设计

Harness Engineering 的几个关键点

图 8：Harness Engineering 的闭环

它为什么重要？

十二、把 9 个名字放在一起看：它们分别在回答什么问题？

十三、一个真实项目里，这些范式应该怎么组合？

推荐组合路径

图 9：更现实的 AI Coding 组合路径

十四、哪些名字最容易被忽略，但最值得补充？

1. Vibe Coding

2. Spec Kit

3. superpowers

4. Context Engineering

5. Subagent-Driven Development

十五、对团队和个人来说，最重要的变化是什么？

图 10：开发者角色变化

十六、写在最后：AI 不是在替代软件工程，而是在逼软件工程升级

可直接用于配图的文案建议

封面标题候选

封面图提示词

正文插图建议

参考资料

wang

猜你喜欢

1. `Spec` 到底是什么意思？

2. `Harness` 为什么这么难翻？

3. `Claude Team` 是不是一个官方固定术语？

4. `superpowers` 为什么叫这个名字？

`Vibe Coding` 的优点

`Vibe Coding` 的问题

`SDD` 解决的核心问题

`SDD` 的本质

`Spec Kit` 关注的流程

为什么 `superpowers` 值得单独讲？

`Context Engineering` 在做什么？

1. `Vibe Coding`

2. `Spec Kit`

3. `superpowers`

4. `Context Engineering`

5. `Subagent-Driven Development`