AI 把“做出来”变容易了,把“做下去”变难了

1. 真正的问题，不是它能不能写

AI 给软件行业带来的变化，已经不能简单地用“效率提升”来概括了。

“效率提升”当然是真的。现在做一个东西，确实比以前快得多。很多过去要花几天才能拼起来的原型，现在一个晚上就能有个样子。页面能出来，接口能通，流程能跑，连一些原本懒得碰的小想法，也因为 AI 的存在突然变得“值得做一下”。

但问题恰恰也在这里。

你会越来越频繁地遇到一种状态：东西做出来了，但它并没有真正成为你的东西。你能把它跑起来，却很难说自己真正控制了它。它可以演示，可以截图，可以在某一个瞬间显得很完整；可一旦你想继续往前推进，想让它经得住修改，经得住协作，经得住交付，经得住时间，问题就开始暴露出来了。

这不是单纯的能力问题，也不完全是模型强弱的问题。更像是我们突然获得了一种极强的生成能力，却还没有形成与之匹配的生产方式。

很多关于 AI 的讨论，从一开始就把问题说窄了。大家最关心的是“它能不能写代码”。但这件事其实没有那么核心。

代码当然重要，但它只是软件生产过程里最显眼的一层，不是最决定性的那一层。真正决定一件事能不能成立的，从来不是它能不能被写出来，而是它能不能在写出来之后继续成立，继续演进，继续被使用。

也就是说，决定生产力的，不只是生成，而是收敛。

2. 越来越多人开始去用 AI coding

这个判断不是从概念里推出来的，反而是从几种很不同的体验里被逼出来的。

一方面，越来越多人开始主动去用 AI coding，去试各种产品，去真的把东西做出来。不是只盯着一个工具，而是不断比较不同产品的边界、风格和工作方式。因为这件事的价值是真实的。它确实降低了软件实现的门槛，也确实让“先把东西做出来”第一次变得这么轻。很多过去不会开始的人开始了，很多过去只停在脑子里的想法，第一次有了落地的机会。

但也正因为越来越多人真的开始去用，另一个问题反而越来越清楚：AI coding 最先解决的是生成，不是收敛。你越频繁地用，越容易看到它那些惊艳时刻背后的不稳定性。第一次生成可能很好，第二次修改就开始变形；单点看起来成立，一接到真实流程里就开始露出边界问题；演示的时候很完整，一进入协作和交付就变得沉重。

尤其是在做个人项目的时候，这种感受会更强。

过去很多会拖住人的环节，现在都像被削掉了。你不再需要先搭那么多脚手架，不再需要一点点去抹平那些重复的胶水代码，也不再需要为了验证一个小想法先付出整套工程成本。你只要有一点感觉，就可以往前推。

那种状态很容易让人上瘾。因为它让开发第一次变得像一种几乎没有摩擦的表达。

但问题也很快出现。项目越往后走，你越会发现这种“轻”并不稳。结构是松的，边界是糊的，验证是弱的。很多代码第一眼看没问题，第二眼也未必能看出问题，直到你真的去动它、改它、接它的时候，才发现整个东西并没有一个坚实的内部组织。

它不是不能用，而是很难持续地用。

它没有真正长成产品，更像是一次次成功生成出来的片段，恰好在某个时刻拼成了一个看似完整的结果。

所以后来我越来越不愿意只用“效率提升”来形容这种体验。因为效率如果不能沉淀，最后只是把试错的速度加快了，把混乱的密度提高了。你今天可以比昨天更快地做出十个东西，但如果这十个东西都无法继续生长，那么这个“快”本身并没有构成真正的生产力。

能做出来，不等于能做下去。

AI 还有一个很少被认真讨论的问题：它让很多事情变得更容易验证，但也更容易失败。

一个小想法今天可以很快做出来。一个页面、一个工具、一个原型，甚至一个过去根本不会开始的念头，现在都可以迅速被拉到现实里看一眼。这当然是巨大的解放。但它的另一面是，失败也被提前了。很多东西不是死在做不出来，而是死在“好像已经做出来了，但就是做不下去”。

尤其是那些真正值得坚持的事情。AI 很擅长帮你跨过启动门槛，却不自动帮你跨过长期建设的门槛。它会给你很强的前期正反馈，让你误以为整条路都变轻了；可一旦进入结构整理、反复修改、长期维护这些阶段，摩擦就会重新回来。甚至因为前面太顺，后面的挫败感会更强。

我还越来越明显地感受到一种新的焦虑，可以叫它 token 焦虑。人会忍不住想趁上下文还在、趁这轮对话还顺、趁模型还“懂我”，赶紧多写一点、多做一点、多推进一点。结果是动作很多，产出也不少，但真正沉淀下来的进展却并不多。你看起来一直在生产，实际上只是一直在生成。

这种焦虑不只发生在一次对话里，也发生在工具之间。你会不断去比较和切换：Codex、Claude Code、Kimi、GLM、Gemini、OpenClaw、Hermes，各种 coding plan，各种会员，各种额度。这个月试这个，下个月续那个；这个工具上下文更长，那个工具生成更快；这个看起来更懂工程，那个似乎更会写页面。表面上看，你是在积极寻找最好的生产方式，但很多时候，真正被放大的不是判断，而是焦虑本身。人会误以为只要再换一个工具、再升级一个套餐、再多买一层额度，进展就会回来。

可现实往往不是这样。很多时候，问题并不在于你缺一个更强的模型，而在于你没有把问题收紧，没有把任务拆准，没有把验证路径设计清楚。于是工具越多，切换越频繁，心理上越像在持续推进，实际上却越容易停留在“我已经做了很多事”的感觉里。你花了很多精力研究哪个 plan 更划算、哪个会员更值、哪个产品更适合 coding，最后真正被压缩的，反而是对问题本身的耐心。

这种焦虑会制造一种新的假勤奋。过去很多人焦虑的是“我会不会写得太慢”，现在很多人焦虑的是“我会不会没有把这轮生成机会用满”。前一种焦虑约束的是执行速度，后一种焦虑扭曲的却是判断质量。你为了不浪费这轮对话，拼命把更多东西塞进去，最后优化的往往不是问题有没有被真正解决，而是这一轮是不是显得足够充实。

你看起来一直在生产，实际上只是一直在生成（垃圾）。

3. 真正进入工作流以后，关键不是放开 AI，而是限制 AI

反过来，在真实的工作流里，很多有效的做法几乎是相反的。

不是让 AI 放开去生成，而是在不断想办法限制它。会去想，能不能让它记住团队平时怎么写东西、怎么拆任务、怎么调试、怎么联调、怎么验收；能不能把这些原本存在于经验里的默会知识，一点点外化出来，变成一种更稳定的运行方式。

刚开始这样做的时候，甚至会有一点逆潮流的感觉。因为整个行业都在强调“更自然的交互”“更自由的表达”“更少的约束”，而你做的事情却像是在反方向走：给它加规则，给它加边界，给它加检查点，给它加回路。这些约束平时都在自己的经验里，哪条路好走，跌倒里什么姿势爬起来。

但真正让 AI 开始变得有用的，恰恰就是这些约束。

因为一种不被限制的能力，很多时候更像刮刮乐。它当然会不断给你惊喜，时不时刮出一张“这次居然真的成了”的兴奋感，让人误以为自己已经掌握了某种稳定的生产方式。可问题在于，刮刮乐的本质不是可重复，不是可积累，不是可规划，而是偶尔中奖。没有约束的生成能力也是这样。它可以很亮眼，但很难让人放心；可以频繁制造惊艳时刻，却不自动构成一个能持续运转的系统。

一旦这些东西慢慢成形，整个系统的感觉就不一样了。输出不再只是“也许能用”，而是开始朝着“应该会这样工作”的方向靠近。你知道它大概会在哪些地方出错，知道什么地方要补验证，知道什么地方可以放手，什么地方必须收紧。

你不再只是等待它生成一个答案，而是在组织一种让答案更容易正确出现的机制。

不被限制的能力更像刮刮乐，能制造惊喜，但不制造稳定。

这时候，harness 这个词对我来说才真正变得具体。

它不是一个时髦概念，也不只是 prompt engineering 换了个名字。至少在我的理解里，它更接近一种把人的工作方式编译给 AI 的过程。你把开发习惯、调试模式、交付方式、验证逻辑，从“经验”变成“系统的一部分”，让 AI 不是按照它自己的统计惯性，而是按照你希望的工程惯性去运行。

如果一定要打个比方，我觉得它有点像交通系统的发展。

最早的时候，人依赖的是很直接的控制，像骑马一样。靠经验，靠感觉，靠不断调整身体和缰绳的细小动作，让它朝你想去的方向走。这个阶段非常灵活，也非常依赖个体能力。你可以随时转弯，随时停下，随时脱离路径，但代价是速度有限，稳定性有限，也很难形成大规模、可复制的系统。

后来变成汽车。开始有道路，有交通规则，有更复杂的动力系统，但整体仍然是开放环境。它比骑马快得多，也现代得多，可它依然高度依赖驾驶者的即时判断。

很多今天的 AI 工具，其实就停留在这个阶段：已经不是最原始的直接生成了，已经有了工作流，有了 agent，有了各种包装好的交互界面，但本质上还是在开放道路上跑车。它能跑，甚至跑得很漂亮，但很难天然地保证稳定。

真正的飞跃，其实发生在高铁和飞机这样的系统里。

不是因为它们单纯“动力更强”，而是因为它们有专用轨道，有航道，有调度系统，有严格的运行规则。它们不再依赖一个人时时刻刻凭经验去拽着方向，而是在一个被高度约束的通道里，把速度和稳定性同时推到很高的水平。

你会发现，一个系统越往工业化的方向发展，它的自由度往往不是更高，而是更低。它不是靠“想怎么跑就怎么跑”获得效率，而是靠“只能在正确路径上跑”获得效率。

这也是现在一个更关键的问题：大家确实已经开始谈 harness，开始谈 workflow，开始谈 agent system，开始谈怎么把 AI 接进真实生产过程里。

但问题不在于有没有意识到“要铺轨道”，而在于轨道最难的部分并没有因为这个词开始流行就自动解决。模型更强了，窗口更长了，速度更快了，围绕 harness 的讨论也多了，这些当然都重要。可如果没有与之匹配的规则系统、验证系统、回退系统、协作系统，那么很多建设最后还是会停留在能力展示层面，而不是进入真正的生产层面。

4. 很多 AI-first，first 的不是 AI，而是 fear

这两年还有一个感受越来越强：很多时候，AI-first 并不真的是一种面向未来的主动拥抱，反而更像一种机会焦虑下的防御姿态。Ai first基本是管理者无能的表现。

大家说自己要 AI-first，未必是因为已经想清楚 AI 应该怎样重构产品、流程和生产方式，而是因为害怕失去窗口，害怕在下一轮竞争里显得动作不够快，害怕自己成为那个“没有上车的人”。

这也解释了为什么很多看起来很激进的 AI 转向，最后落地得并不深。因为当一件事首先服务的是“证明我们没有掉队”，它最容易产出的就不是稳定的生产系统，而是可展示的生成结果。demo、界面、入口、编排、概念，都比约束、验证、回退和协作机制更容易先被做出来。

于是很多 AI-first 最后变成了一种很吊诡的反义词：first 的不是 AI，而是 fear。

所以对很多所谓 harness 产品，会天然保留一点判断。不是因为 harness 这个方向不重要，恰恰相反，是因为它非常重要，所以更容易被做浅。

现在市面上不少产品，做的其实是更顺滑的 prompt 管理、更漂亮的 agent 编排、更方便的界面包装。它们在争夺 AI 的入口，在争夺使用场景，但未必真的解决了最核心的工程问题。

那个问题始终没有变过：如何让一个本身具有概率性、不稳定性的系统，在真实生产环境里持续地产生可信的结果。

如果不能回答这个问题，那么再好的交互，也只是“更好用的生成”，不是“可依赖的生产”。

5. 开发者真正不能交出去的，不是代码，而是控制权

从这个角度再去看“开发者到底还要不要自己写代码”，问题也会变得不一样。

很多人会焦虑，觉得如果代码写少了，竞争力是不是会下降。我越来越觉得，真正会下降的，不是因为写得少，而是因为控制得少。

这两年还有一种讨论越来越多：AI coding 最先毁掉的，会不会不是程序员这份工作，而是程序员自己。这个说法听上去有点极端，但它指向的问题并不假。真正值得担心的，不是工程师以后还写不写代码，而是会不会越来越习惯于跳过理解、跳过验证、跳过追问，只保留一个“把结果弄出来”的动作。人一旦长期处在这种工作方式里，被削弱的就不只是手感，而是对系统的判断力，对边界的敏感度，对错误的警觉，以及对复杂问题保持耐心的能力。

代码在过去之所以重要，不只是因为它是产物，更因为它曾经是人控制系统最直接的方式。你理解每个分支、每个状态、每个边界，于是你理解这个系统为什么这样工作。

现在 AI 把大量实现工作拿走了，真正的风险不是你不再亲手写这些，而是你也把判断、验证和约束一并交出去了。

那才是危险的地方。

所以“放手”当然是一种解脱，但它只能解放你的执行负担，不能解除你的责任。你可以不再亲自写每一行代码，但你不能不再追问这段逻辑为什么成立，不能不再设计系统在失败时如何被发现、被纠正、被重试。

否则到最后，你不是在使用 AI 提升生产力，而是在把自己降格成一个等待结果的操作员。

6. 未来真正稀缺的，不是生成能力，而是收敛能力

这也是为什么，AI 对软件行业的影响更适合被理解成一种生产力组织方式的变化，而不是简单的工具升级。

真正被改变的，不是“写代码这件事变快了”，而是软件生产的重心正在从实现，慢慢转向约束、验证和收敛。

如果再往前看一步，leader 和架构师的价值也会跟着一起变化。过去大家会更直接地用“技术深度”“系统经验”“架构能力”这些词去描述这类角色；以后这些能力不会消失，但会越来越具体地体现在另一件事上：能不能把一个复杂问题拆成模型可以理解、可以执行、可以验证、可以回退的结构。一个人对模型和系统的拆解程度，会越来越直接地转变成他在 AI 辅助条件下组织工程、搭建系统、推进交付的能力。

这也是为什么，未来很多团队里的关键差距，未必首先体现在谁写得更快，而是体现在谁更会拆。谁能把模糊需求拆成清晰任务，谁能把复杂系统拆成稳定边界，谁能把工程经验拆成 AI 可以重复执行的轨道，谁就更可能把 AI 真正变成生产力。反过来，如果拆解能力不够，再强的模型也很容易只停留在“看起来什么都能做一点”，最后却没有一部分能真正做深、做稳、做完。

过去大家比的是谁能更快实现一个需求；未来越来越比的，可能是谁能更稳定地组织一个系统，让生成出来的东西进入一个可持续、可维护、可交付的轨道之中。

如果这么看，很多表面上的矛盾就会变得清楚。

为什么 AI demo 这么多，真正稳定的 AI 产品却没那么多？因为 demo 只需要一次成功，产品需要持续成功。

为什么很多 AI coding 体验非常惊艳，但越往后做越重？因为生成本身没有错，问题在于它没有自动带来结构。

为什么有些团队用了 AI 之后觉得效率提升明显，有些团队却觉得只是更热闹了？因为前者开始建设收敛机制，后者仍然停留在自由生成的兴奋里。

所以到最后，问题也许可以说得更直接一点：

AI 带来的，不是“更会写代码的机器”，而是一个逼着我们重新回答“什么才算生产力”的时刻。

如果一种能力只能帮助你更快地产生结果，却不能帮助你更稳定地积累结果，那它距离真正的生产力仍然有一段距离。只有当生成开始被约束，约束开始变成系统，系统开始允许规模化复用，AI 才真正从一个令人兴奋的能力，变成一种新的生产力基础设施。

也许未来回头看，这一轮变化最关键的部分，从来不是模型有多强，而是谁先学会了给这股动力铺轨道。