1. 真正的问题,不是它能不能写
AI 给软件行业带来的变化,已经不能简单地用“效率提升”来概括了。
“效率提升”当然是真的。现在做一个东西,确实比以前快得多。很多过去要花几天才能拼起来的原型,现在一个晚上就能有个样子。页面能出来,接口能通,流程能跑,连一些原本懒得碰的小想法,也因为 AI 的存在突然变得“值得做一下”。
但问题恰恰也在这里。
你会越来越频繁地遇到一种状态:东西做出来了,但它并没有真正成为你的东西。你能把它跑起来,却很难说自己真正控制了它。它可以演示,可以截图,可以在某一个瞬间显得很完整;可一旦你想继续往前推进,想让它经得住修改,经得住协作,经得住交付,经得住时间,问题就开始暴露出来了。
这不是单纯的能力问题,也不完全是模型强弱的问题。更像是我们突然获得了一种极强的生成能力,却还没有形成与之匹配的生产方式。
很多关于 AI 的讨论,从一开始就把问题说窄了。大家最关心的是“它能不能写代码”。但这件事其实没有那么核心。
代码当然重要,但它只是软件生产过程里最显眼的一层,不是最决定性的那一层。真正决定一件事能不能成立的,从来不是它能不能被写出来,而是它能不能在写出来之后继续成立,继续演进,继续被使用。
也就是说,决定生产力的,不只是生成,而是收敛。
2. 越来越多人开始去用 AI coding
这个判断不是从概念里推出来的,反而是从几种很不同的体验里被逼出来的。
一方面,越来越多人开始主动去用 AI coding,去试各种产品,去真的把东西做出来。不是只盯着一个工具,而是不断比较不同产品的边界、风格和工作方式。因为这件事的价值是真实的。它确实降低了软件实现的门槛,也确实让“先把东西做出来”第一次变得这么轻。很多过去不会开始的人开始了,很多过去只停在脑子里的想法,第一次有了落地的机会。
但也正因为越来越多人真的开始去用,另一个问题反而越来越清楚:AI coding 最先解决的是生成,不是收敛。你越频繁地用,越容易看到它那些惊艳时刻背后的不稳定性。第一次生成可能很好,第二次修改就开始变形;单点看起来成立,一接到真实流程里就开始露出边界问题;演示的时候很完整,一进入协作和交付就变得沉重。
尤其是在做个人项目的时候,这种感受会更强。
过去很多会拖住人的环节,现在都像被削掉了。你不再需要先搭那么多脚手架,不再需要一点点去抹平那些重复的胶水代码,也不再需要为了验证一个小想法先付出整套工程成本。你只要有一点感觉,就可以往前推。
那种状态很容易让人上瘾。因为它让开发第一次变得像一种几乎没有摩擦的表达。
但问题也很快出现。项目越往后走,你越会发现这种“轻”并不稳。结构是松的,边界是糊的,验证是弱的。很多代码第一眼看没问题,第二眼也未必能看出问题,直到你真的去动它、改它、接它的时候,才发现整个东西并没有一个坚实的内部组织。
它不是不能用,而是很难持续地用。
它没有真正长成产品,更像是一次次成功生成出来的片段,恰好在某个时刻拼成了一个看似完整的结果。
所以后来我越来越不愿意只用“效率提升”来形容这种体验。因为效率如果不能沉淀,最后只是把试错的速度加快了,把混乱的密度提高了。你今天可以比昨天更快地做出十个东西,但如果这十个东西都无法继续生长,那么这个“快”本身并没有构成真正的生产力。
能做出来,不等于能做下去。
AI 还有一个很少被认真讨论的问题:它让很多事情变得更容易验证,但也更容易失败。
一个小想法今天可以很快做出来。一个页面、一个工具、一个原型,甚至一个过去根本不会开始的念头,现在都可以迅速被拉到现实里看一眼。这当然是巨大的解放。但它的另一面是,失败也被提前了。很多东西不是死在做不出来,而是死在“好像已经做出来了,但就是做不下去”。
尤其是那些真正值得坚持的事情。AI 很擅长帮你跨过启动门槛,却不自动帮你跨过长期建设的门槛。它会给你很强的前期正反馈,让你误以为整条路都变轻了;可一旦进入结构整理、反复修改、长期维护这些阶段,摩擦就会重新回来。甚至因为前面太顺,后面的挫败感会更强。
我还越来越明显地感受到一种新的焦虑,可以叫它 token 焦虑。人会忍不住想趁上下文还在、趁这轮对话还顺、趁模型还“懂我”,赶紧多写一点、多做一点、多推进一点。结果是动作很多,产出也不少,但真正沉淀下来的进展却并不多。你看起来一直在生产,实际上只是一直在生成。
这种焦虑不只发生在一次对话里,也发生在工具之间。你会不断去比较和切换:Codex、Claude Code、Kimi、GLM、Gemini、OpenClaw、Hermes,各种 coding plan,各种会员,各种额度。这个月试这个,下个月续那个;这个工具上下文更长,那个工具生成更快;这个看起来更懂工程,那个似乎更会写页面。表面上看,你是在积极寻找最好的生产方式,但很多时候,真正被放大的不是判断,而是焦虑本身。人会误以为只要再换一个工具、再升级一个套餐、再多买一层额度,进展就会回来。
可现实往往不是这样。很多时候,问题并不在于你缺一个更强的模型,而在于你没有把问题收紧,没有把任务拆准,没有把验证路径设计清楚。于是工具越多,切换越频繁,心理上越像在持续推进,实际上却越容易停留在“我已经做了很多事”的感觉里。你花了很多精力研究哪个 plan 更划算、哪个会员更值、哪个产品更适合 coding,最后真正被压缩的,反而是对问题本身的耐心。
这种焦虑会制造一种新的假勤奋。过去很多人焦虑的是“我会不会写得太慢”,现在很多人焦虑的是“我会不会没有把这轮生成机会用满”。前一种焦虑约束的是执行速度,后一种焦虑扭曲的却是判断质量。你为了不浪费这轮对话,拼命把更多东西塞进去,最后优化的往往不是问题有没有被真正解决,而是这一轮是不是显得足够充实。
你看起来一直在生产,实际上只是一直在生成(垃圾)。
3. 真正进入工作流以后,关键不是放开 AI,而是限制 AI
反过来,在真实的工作流里,很多有效的做法几乎是相反的。
不是让 AI 放开去生成,而是在不断想办法限制它。会去想,能不能让它记住团队平时怎么写东西、怎么拆任务、怎么调试、怎么联调、怎么验收;能不能把这些原本存在于经验里的默会知识,一点点外化出来,变成一种更稳定的运行方式。
刚开始这样做的时候,甚至会有一点逆潮流的感觉。因为整个行业都在强调“更自然的交互”“更自由的表达”“更少的约束”,而你做的事情却像是在反方向走:给它加规则,给它加边界,给它加检查点,给它加回路。这些约束平时都在自己的经验里,哪条路好走,跌倒里什么姿势爬起来。
但真正让 AI 开始变得有用的,恰恰就是这些约束。
因为一种不被限制的能力,很多时候更像刮刮乐。它当然会不断给你惊喜,时不时刮出一张“这次居然真的成了”的兴奋感,让人误以为自己已经掌握了某种稳定的生产方式。可问题在于,刮刮乐的本质不是可重复,不是可积累,不是可规划,而是偶尔中奖。没有约束的生成能力也是这样。它可以很亮眼,但很难让人放心;可以频繁制造惊艳时刻,却不自动构成一个能持续运转的系统。
一旦这些东西慢慢成形,整个系统的感觉就不一样了。输出不再只是“也许能用”,而是开始朝着“应该会这样工作”的方向靠近。你知道它大概会在哪些地方出错,知道什么地方要补验证,知道什么地方可以放手,什么地方必须收紧。
你不再只是等待它生成一个答案,而是在组织一种让答案更容易正确出现的机制。
不被限制的能力更像刮刮乐,能制造惊喜,但不制造稳定。
这时候,harness 这个词对我来说才真正变得具体。
它不是一个时髦概念,也不只是 prompt engineering 换了个名字。至少在我的理解里,它更接近一种把人的工作方式编译给 AI 的过程。你把开发习惯、调试模式、交付方式、验证逻辑,从“经验”变成“系统的一部分”,让 AI 不是按照它自己的统计惯性,而是按照你希望的工程惯性去运行。
如果一定要打个比方,我觉得它有点像交通系统的发展。
最早的时候,人依赖的是很直接的控制,像骑马一样。靠经验,靠感觉,靠不断调整身体和缰绳的细小动作,让它朝你想去的方向走。这个阶段非常灵活,也非常依赖个体能力。你可以随时转弯,随时停下,随时脱离路径,但代价是速度有限,稳定性有限,也很难形成大规模、可复制的系统。
后来变成汽车。开始有道路,有交通规则,有更复杂的动力系统,但整体仍然是开放环境。它比骑马快得多,也现代得多,可它依然高度依赖驾驶者的即时判断。
很多今天的 AI 工具,其实就停留在这个阶段:已经不是最原始的直接生成了,已经有了工作流,有了 agent,有了各种包装好的交互界面,但本质上还是在开放道路上跑车。它能跑,甚至跑得很漂亮,但很难天然地保证稳定。
真正的飞跃,其实发生在高铁和飞机这样的系统里。
不是因为它们单纯“动力更强”,而是因为它们有专用轨道,有航道,有调度系统,有严格的运行规则。它们不再依赖一个人时时刻刻凭经验去拽着方向,而是在一个被高度约束的通道里,把速度和稳定性同时推到很高的水平。
你会发现,一个系统越往工业化的方向发展,它的自由度往往不是更高,而是更低。它不是靠“想怎么跑就怎么跑”获得效率,而是靠“只能在正确路径上跑”获得效率。
这也是现在一个更关键的问题:大家确实已经开始谈 harness,开始谈 workflow,开始谈 agent system,开始谈怎么把 AI 接进真实生产过程里。
但问题不在于有没有意识到“要铺轨道”,而在于轨道最难的部分并没有因为这个词开始流行就自动解决。模型更强了,窗口更长了,速度更快了,围绕 harness 的讨论也多了,这些当然都重要。可如果没有与之匹配的规则系统、验证系统、回退系统、协作系统,那么很多建设最后还是会停留在能力展示层面,而不是进入真正的生产层面。
4. 很多 AI-first,first 的不是 AI,而是 fear
这两年还有一个感受越来越强:很多时候,AI-first 并不真的是一种面向未来的主动拥抱,反而更像一种机会焦虑下的防御姿态。Ai first基本是管理者无能的表现。
大家说自己要 AI-first,未必是因为已经想清楚 AI 应该怎样重构产品、流程和生产方式,而是因为害怕失去窗口,害怕在下一轮竞争里显得动作不够快,害怕自己成为那个“没有上车的人”。
这也解释了为什么很多看起来很激进的 AI 转向,最后落地得并不深。因为当一件事首先服务的是“证明我们没有掉队”,它最容易产出的就不是稳定的生产系统,而是可展示的生成结果。demo、界面、入口、编排、概念,都比约束、验证、回退和协作机制更容易先被做出来。
于是很多 AI-first 最后变成了一种很吊诡的反义词:first 的不是 AI,而是 fear。
所以对很多所谓 harness 产品,会天然保留一点判断。不是因为 harness 这个方向不重要,恰恰相反,是因为它非常重要,所以更容易被做浅。
现在市面上不少产品,做的其实是更顺滑的 prompt 管理、更漂亮的 agent 编排、更方便的界面包装。它们在争夺 AI 的入口,在争夺使用场景,但未必真的解决了最核心的工程问题。
那个问题始终没有变过:如何让一个本身具有概率性、不稳定性的系统,在真实生产环境里持续地产生可信的结果。
如果不能回答这个问题,那么再好的交互,也只是“更好用的生成”,不是“可依赖的生产”。
5. 开发者真正不能交出去的,不是代码,而是控制权
从这个角度再去看“开发者到底还要不要自己写代码”,问题也会变得不一样。
很多人会焦虑,觉得如果代码写少了,竞争力是不是会下降。我越来越觉得,真正会下降的,不是因为写得少,而是因为控制得少。
这两年还有一种讨论越来越多:AI coding 最先毁掉的,会不会不是程序员这份工作,而是程序员自己。这个说法听上去有点极端,但它指向的问题并不假。真正值得担心的,不是工程师以后还写不写代码,而是会不会越来越习惯于跳过理解、跳过验证、跳过追问,只保留一个“把结果弄出来”的动作。人一旦长期处在这种工作方式里,被削弱的就不只是手感,而是对系统的判断力,对边界的敏感度,对错误的警觉,以及对复杂问题保持耐心的能力。
代码在过去之所以重要,不只是因为它是产物,更因为它曾经是人控制系统最直接的方式。你理解每个分支、每个状态、每个边界,于是你理解这个系统为什么这样工作。
现在 AI 把大量实现工作拿走了,真正的风险不是你不再亲手写这些,而是你也把判断、验证和约束一并交出去了。
那才是危险的地方。
所以“放手”当然是一种解脱,但它只能解放你的执行负担,不能解除你的责任。你可以不再亲自写每一行代码,但你不能不再追问这段逻辑为什么成立,不能不再设计系统在失败时如何被发现、被纠正、被重试。
否则到最后,你不是在使用 AI 提升生产力,而是在把自己降格成一个等待结果的操作员。
6. 未来真正稀缺的,不是生成能力,而是收敛能力
这也是为什么,AI 对软件行业的影响更适合被理解成一种生产力组织方式的变化,而不是简单的工具升级。
真正被改变的,不是“写代码这件事变快了”,而是软件生产的重心正在从实现,慢慢转向约束、验证和收敛。
如果再往前看一步,leader 和架构师的价值也会跟着一起变化。过去大家会更直接地用“技术深度”“系统经验”“架构能力”这些词去描述这类角色;以后这些能力不会消失,但会越来越具体地体现在另一件事上:能不能把一个复杂问题拆成模型可以理解、可以执行、可以验证、可以回退的结构。一个人对模型和系统的拆解程度,会越来越直接地转变成他在 AI 辅助条件下组织工程、搭建系统、推进交付的能力。
这也是为什么,未来很多团队里的关键差距,未必首先体现在谁写得更快,而是体现在谁更会拆。谁能把模糊需求拆成清晰任务,谁能把复杂系统拆成稳定边界,谁能把工程经验拆成 AI 可以重复执行的轨道,谁就更可能把 AI 真正变成生产力。反过来,如果拆解能力不够,再强的模型也很容易只停留在“看起来什么都能做一点”,最后却没有一部分能真正做深、做稳、做完。
过去大家比的是谁能更快实现一个需求;未来越来越比的,可能是谁能更稳定地组织一个系统,让生成出来的东西进入一个可持续、可维护、可交付的轨道之中。
如果这么看,很多表面上的矛盾就会变得清楚。
为什么 AI demo 这么多,真正稳定的 AI 产品却没那么多?因为 demo 只需要一次成功,产品需要持续成功。
为什么很多 AI coding 体验非常惊艳,但越往后做越重?因为生成本身没有错,问题在于它没有自动带来结构。
为什么有些团队用了 AI 之后觉得效率提升明显,有些团队却觉得只是更热闹了?因为前者开始建设收敛机制,后者仍然停留在自由生成的兴奋里。
所以到最后,问题也许可以说得更直接一点:
AI 带来的,不是“更会写代码的机器”,而是一个逼着我们重新回答“什么才算生产力”的时刻。
如果一种能力只能帮助你更快地产生结果,却不能帮助你更稳定地积累结果,那它距离真正的生产力仍然有一段距离。只有当生成开始被约束,约束开始变成系统,系统开始允许规模化复用,AI 才真正从一个令人兴奋的能力,变成一种新的生产力基础设施。
也许未来回头看,这一轮变化最关键的部分,从来不是模型有多强,而是谁先学会了给这股动力铺轨道。
夜雨聆风