六个月不碰 AI,你的直觉就过期了?
Harj Taggar 是 YC 前合伙人,在硅谷工程圈有广泛影响力。5 月 23 日,他在 X 上发了这样一段话:
"AI is embarrassing a lot of senior engineers. A junior who touched the frontier yesterday often has better instincts for what's possible than someone experienced who last touched it six months ago."
「AI 正在让很多资深工程师蒙羞。一个昨天刚接触前沿的初级工程师,对什么已经可能的直觉,常常比一个六个月没碰过前沿的老手更好。」

▲ Harj Taggar 的原帖,评论区迅速形成针锋相对的两派
这段话的杀伤力在于——他没有说资深工程师不行,他说的是你的经验有保质期,而这个保质期正在急速缩短。
过去,一个 senior 工程师花五年踩坑积累下来的「什么能做、什么不能做」的判断力,是团队里最值钱的资产。但当 AI 编程工具的能力每隔几个月就跳一个台阶——上下文窗口从 8K 涨到百万级、代码理解从片段到全仓库、agent 从补全助手进化到自主执行——半年前形成的「可行性直觉」,今天可能已经是错的。
你以为这个任务做不到?可能只是你用的还是去年的工具。
评论区立刻分裂:经验到底过不过期?
Harj 的帖子发出后,评论区迅速形成了几派对峙。
「知识半衰期」派立刻跟上。有 13 年经验的开发者 Alexander Benz 回复说,自己也感受到了同样的变化:
最大的优势已经不再来自经验,而是你距离上一次更新「什么已经可能」的认知有多近。AI 知识半衰期大概只有三个月。
三个月。也就是说,你上个季度对 AI 编程工具形成的判断,这个季度可能就不准了。
但「生产现实」派马上反击。开发者 Kimo 给出了整个讨论里最精准的边界限定:
"AI is not embarrassing senior engineers. It is embarrassing senior engineers who stopped updating... production still punishes people who don't understand systems, debugging, tradeoffs, and failure modes."
「AI 没有让资深工程师蒙羞。它让那些停止更新的资深工程师蒙羞……生产环境依然惩罚不懂系统、不懂调试、不懂权衡、不懂故障模式的人。」
还有人从另一个角度切入。John Collins 认为,好的工程直觉来自多年被生产事故锤出来的教训,更好的工具不会自动赋予这种直觉——如果一个 junior 问错了问题或者误读了 AI 的回答,速度快反而更危险。
Srinivas Raju M 则提供了一个更温和的解释:AI 没有让初级工程师在所有维度超越资深工程师,但它大幅降低了进入陌生代码库、建立上下文、加速交付的门槛。过去需要 senior 手把手带三个月才能上手的工作,现在可能几天就能跑起来。
这些争论指向同一个核心问题:AI 改变的到底是什么?
84% 的开发者已经上车,但只有 3% 真正信任 AI
争论归争论,有一件事没有争议:AI 编程工具已经成为开发者的日常。
Stack Overflow 2025 开发者调查给出了一组关键数据:84% 的受访者正在使用或计划使用 AI 工具(上一年为 76%),其中超过一半的专业开发者每天都在用。

▲ Stack Overflow 2025 调查:AI 工具使用率 84%,日常使用比例超过一半
GitHub 2023 年对 500 名美国大型企业开发者的调查更早就揭示了这个趋势:92% 的开发者已经在工作内外使用 AI 编码工具,70% 认为 AI 工具会在工作中带来优势。

▲ GitHub 调查:92% 美国企业开发者已使用 AI 编码工具
但使用率高不等于信任度高。
Stack Overflow 同一份调查里,46% 的开发者主动表示不信任 AI 输出的准确性,高于信任 AI 的 33%。而只有 3% 的开发者表示「高度信任」AI 的输出。
更值得注意的是,经验越丰富的开发者越谨慎。资深开发者群体中,「高度信任」AI 的比例只有2.6%,「高度不信任」的比例却高达20%——在所有经验层级中最高。

▲ 资深开发者对 AI 的信任度最低、不信任比例最高
66% 的开发者说他们遇到的最大挫折是「AI 给出的方案几乎对了,但又不完全对」。45% 认为调试 AI 生成的代码比自己从头写更费时间。
这些数据背后藏着一个反直觉的事实:资深工程师对 AI 更保守,可能并不是因为他们跟不上时代。他们承担的质量责任更重,更清楚「差不多对了」在生产环境里意味着什么。
以为 AI 帮你提速 20%?实际可能拖慢你 19%
如果上面的信任数据还不够刺激,METR 的一项严格实验会让你重新审视自己对 AI 工具的信心。
这项发表在 arXiv 上的随机对照实验(RCT)找了16 名经验丰富的开源开发者,让他们在自己平均有5 年经验的成熟项目上完成246 个任务。一半任务允许使用 AI 工具(主要是 Cursor Pro + Claude 3.5/3.7 Sonnet),另一半不允许。

▲ METR 论文:对经验丰富的开源开发者进行 AI 生产力的随机对照实验
结果出来,所有人都愣了:
任务开始前,开发者预测 AI 会帮自己减少 24% 的完成时间 任务结束后,开发者回顾估计 AI 帮自己减少了 20% 的完成时间 但实际 RCT 数据显示,允许使用 AI 反而让完成时间增加了 19%
"allowing AI actually increases completion time by 19%—AI tooling slowed developers down."
「允许使用 AI 实际让完成时间增加了 19%——AI 工具让开发者变慢了。」
事前觉得会快 24%,事后觉得快了 20%,实际却慢了 19%。主观感受和客观结果之间的鸿沟大得惊人。
为什么会这样?论文指出了几个可能的原因:在成熟代码库中,AI 生成的代码需要大量的审查、调试和集成工作;开发者花了额外时间跟 AI 沟通上下文和需求;而且 AI 输出的「看起来对」的代码,往往在边界情况和深层逻辑上出问题,修这些 bug 的时间吞掉了前面省下的速度。
这个结论不是说 AI 工具没用。它说的是:在你最熟悉的代码库里做最熟悉的事情时,AI 的收益可能远没有你感觉的那么大。而「觉得自己变快了」这种主观感受本身,就是一个陷阱。
真正被贬值的,到底是什么?
把 Harj 的观点、评论区的争论、Stack Overflow 的数据和 METR 的实验放在一起看,一个更清晰的图景浮出来了:
AI 正在重新定价工程师的三层能力。
第一层:可行性直觉。这是 Harj 真正在说的东西。过去,判断「这个任务能不能做、用什么方案做」需要多年经验积累。现在,AI 工具的能力边界每隔几个月就变一次——上个季度用 AI 做不到的事情,这个季度可能已经可以了。如果你不持续跟踪 frontier,你的「可行性直觉」就在贬值。
第二层:执行效率。AI 把很多过去需要经验才能快速完成的任务——读懂陌生代码、生成候选方案、写测试雏形、迁移脚本——变成了低门槛操作。初级工程师借助 AI 可以更快地建立上下文、产出原型。这意味着「我写代码比你快」这个优势,正在被工具抹平。
第三层:质量判断。但 Stack Overflow 的数据和 METR 的实验共同指向一件事——AI 生成的代码需要人来验证,而验证能力恰恰来自经验。66% 的开发者被「差不多对」的 AI 输出困扰,45% 觉得调试 AI 代码更费时间。能看出 AI 输出哪里不对、能设计验证路径、能判断什么时候该信 AI 什么时候不该信——这些能力反而在升值。
所以,真正在贬值的不是「经验」这个整体概念。贬值的是那种停在原地、不再更新工具链和认知边界的经验。升值的是那种持续校准、能把 AI 产出放进生产系统并为结果负责的经验。
你要怎么办?
如果你是资深工程师,Harj 的帖子可能让你不舒服。但不舒服的原因可能恰恰是——你知道他说的有几分道理。
METR 的实验提醒我们,「觉得自己在用 AI」和「AI 真的在帮你」之间有巨大的鸿沟。Stack Overflow 的数据告诉我们,谨慎并没有错,但谨慎不能变成不碰。
经验并没有消失,只是不能再躺在简历里计息。
AI 把旧经验里「知道怎么写」的部分压低了价格,却把「知道如何验证、如何取舍、如何上线、如何在工具变化时持续校准」的部分抬高了价格。
真正被 AI 蒙羞的,从来都是停止更新的人。
— END —
夜雨聆风