MIT追踪10万开发者6年,发现AI编程存在一个反直觉的"漏斗困局"

2026年,你身边还有不用AI写代码的开发者吗?
从2022年GitHub Copilot发布算起,AI编程工具用了不到4年时间完成了近乎100%的渗透。现在你用Cursor、用Claude Code、用Copilot——它们让你写代码的速度快了不知道多少倍。
但一个扎心的问题:你发布软件的速度,真的加快了相应倍数吗?
MIT和宾夕法尼亚大学的研究者最近发布了一份NBER工作论文,追踪了10万名开发者从2020年3月到2026年5月的产出数据,试图回答这个问题。
答案是:代码量暴涨了741%,软件发布量只多了20%-30%。
三代AI工具的效率爬升
研究先把AI编程工具按能力分为三代:
第一代 自动补全 GitHub Copilot(2022)+26% 效率 第二代 同步Agent Cursor 提交量+140% 第三代 异步Agent Claude Code 提交量+180%
一代比一代猛。Claude Code这种级别——Agent自己读代码、写代码、跑测试、提PR——效率提升已经到了肉眼可见的程度。
但问题出在下一层。
漏斗:代码→发布,每步都在缩水
研究者把整个软件生产链条拆开看:
代码量产出 +741%(17.3倍)← AI的全力输出 ↓ 提交(commits)+109% ← 筛选、整理 ↓ PR提交 +65% ← 准备review ↓ 软件发布 +20%~30% ← 人类瓶颈
每经过一道人工环节,AI的效率优势就缩水一个数量级。从741%到109%到65%到30%,链条越往下游,人的因素越重,AI的加速度就越难穿透。
研究者甚至做了一个极端假设:就算AI能在瞬间写完整个应用的代码,在现有工作流下,最终发布量的增长上限也只有约26%。
瓶颈不在「写」。在「审」、在「调」、在「决策」。
为什么?
Code Review成了新瓶颈——生成代码的人(AI)写代码只需要3秒,但审代码的人(你)仍然要用30分钟通读一遍。AI帮你加速了代码生产,但没加速你的阅读速度。
AI代码的安全隐患——Opsera 2026年的Benchmark报告显示,AI生成的PR在审查队列中的等待时间是人类PR的4.6倍,且引入安全漏洞的概率高出15-18%。不是AI写得差,是审查者天然不信任非自己写的代码。
产品决策AI做不了——AI不帮你判断哪个功能该做、哪个需求该砍、哪个用户反馈值得重视。这些决策消耗的时间不亚于写代码,而AI对此毫无帮助。
市场上的信号:应用泛滥,成功更难
Apple App Store的月新上架应用从约4万款飙升至近10万款——AI让做应用的门槛前所未有地低。但与此同时,「僵尸应用」(发布3个月内不足10条用户评分的应用)的比例从79%上升到了86%。
换句话说:做应用的人多了、做得快了,但用户注意力的蛋糕没有变大。大部分新应用根本没人下载。
做软件变便宜了,做成功的软件更难了。
这不是AI的问题,这是供需关系的铁律:当供给侧爆发式增长时,需求侧的力量决定了谁赢谁输。
对一人AI工作室的3个启示
不要在代码量上内卷
一人工作室最稀缺的永远是时间。AI让你一天产出以前一周的代码,但你的工作时间还是8小时(甚至更多)。核心问题不是"怎么能写更多代码",而是"怎么能写对代码"。
瓶颈在哪,机会就在哪
如果你仔细看这个漏斗,真正值得优化的环节不是顶端的代码生成(已经很强了),而是中间的人工瓶颈:
自动化测试覆盖 AI辅助Code Review CI/CD管线自动化 模板化发布流程
一个人+AI=之前3-5人团队?前提是你得把这些中间环节的自动化补上,否则你只是从"写代码的瓶颈"变成了"审代码的瓶颈"。
真正的壁垒是判断力
MIT研究最深刻的结论我认为是:AI大幅降低了执行成本,但没有降低决策成本。
知道做什么、知道不该做什么、知道什么时候该停下来——这些能力没有因为AI的出现而自动获得。反而因为"什么都能做"了,选择变得更难了。
对于一人工作室来说,这意味着:真正的竞争优势不在于你用AI写了多快的代码,而在于你选择了做什么。
数据来源:MIT & University of Pennsylvania NBER Working Paper · 10万开发者 · 2020.03-2026.05
夜雨聆风