你用AI写了17倍的代码,但软件只多了30%

MIT追踪10万开发者6年，发现AI编程存在一个反直觉的"漏斗困局"

2026年，你身边还有不用AI写代码的开发者吗？

从2022年GitHub Copilot发布算起，AI编程工具用了不到4年时间完成了近乎100%的渗透。现在你用Cursor、用Claude Code、用Copilot——它们让你写代码的速度快了不知道多少倍。

但一个扎心的问题：你发布软件的速度，真的加快了相应倍数吗？

MIT和宾夕法尼亚大学的研究者最近发布了一份NBER工作论文，追踪了10万名开发者从2020年3月到2026年5月的产出数据，试图回答这个问题。

答案是：代码量暴涨了741%，软件发布量只多了20%-30%。

三代AI工具的效率爬升

研究先把AI编程工具按能力分为三代：

第一代自动补全 GitHub Copilot（2022）+26% 效率第二代同步Agent Cursor 提交量+140% 第三代异步Agent Claude Code 提交量+180%

一代比一代猛。Claude Code这种级别——Agent自己读代码、写代码、跑测试、提PR——效率提升已经到了肉眼可见的程度。

但问题出在下一层。

漏斗：代码→发布，每步都在缩水

研究者把整个软件生产链条拆开看：

代码量产出 +741%（17.3倍）← AI的全力输出 ↓ 提交（commits）+109% ← 筛选、整理 ↓ PR提交 +65% ← 准备review ↓ 软件发布 +20%~30% ← 人类瓶颈

每经过一道人工环节，AI的效率优势就缩水一个数量级。从741%到109%到65%到30%，链条越往下游，人的因素越重，AI的加速度就越难穿透。

研究者甚至做了一个极端假设：就算AI能在瞬间写完整个应用的代码，在现有工作流下，最终发布量的增长上限也只有约26%。

瓶颈不在「写」。在「审」、在「调」、在「决策」。

为什么？

Code Review成了新瓶颈——生成代码的人（AI）写代码只需要3秒，但审代码的人（你）仍然要用30分钟通读一遍。AI帮你加速了代码生产，但没加速你的阅读速度。
AI代码的安全隐患——Opsera 2026年的Benchmark报告显示，AI生成的PR在审查队列中的等待时间是人类PR的4.6倍，且引入安全漏洞的概率高出15-18%。不是AI写得差，是审查者天然不信任非自己写的代码。
产品决策AI做不了——AI不帮你判断哪个功能该做、哪个需求该砍、哪个用户反馈值得重视。这些决策消耗的时间不亚于写代码，而AI对此毫无帮助。

市场上的信号：应用泛滥，成功更难

Apple App Store的月新上架应用从约4万款飙升至近10万款——AI让做应用的门槛前所未有地低。但与此同时，「僵尸应用」（发布3个月内不足10条用户评分的应用）的比例从79%上升到了86%。

换句话说：做应用的人多了、做得快了，但用户注意力的蛋糕没有变大。大部分新应用根本没人下载。

做软件变便宜了，做成功的软件更难了。

这不是AI的问题，这是供需关系的铁律：当供给侧爆发式增长时，需求侧的力量决定了谁赢谁输。

对一人AI工作室的3个启示

一人工作室最稀缺的永远是时间。AI让你一天产出以前一周的代码，但你的工作时间还是8小时（甚至更多）。核心问题不是"怎么能写更多代码"，而是"怎么能写对代码"。

如果你仔细看这个漏斗，真正值得优化的环节不是顶端的代码生成（已经很强了），而是中间的人工瓶颈：

一个人+AI=之前3-5人团队？前提是你得把这些中间环节的自动化补上，否则你只是从"写代码的瓶颈"变成了"审代码的瓶颈"。

MIT研究最深刻的结论我认为是：AI大幅降低了执行成本，但没有降低决策成本。

知道做什么、知道不该做什么、知道什么时候该停下来——这些能力没有因为AI的出现而自动获得。反而因为"什么都能做"了，选择变得更难了。

对于一人工作室来说，这意味着：真正的竞争优势不在于你用AI写了多快的代码，而在于你选择了做什么。

数据来源：MIT & University of Pennsylvania NBER Working Paper · 10万开发者 · 2020.03-2026.05