AI 正在让资深工程师「蒙羞」:你的经验优势,可能每三个月就贬值一半

导读Harj Taggar 在 X 上扔出一个刺痛工程圈的判断：一个昨天刚摸过 frontier AI 的初级工程师，对「什么已经可能」的直觉，常常比六个月没碰过的资深工程师更准。评论区立刻炸开——有人说 AI 知识半衰期只有三个月，有人反击说生产系统仍然惩罚不懂调试和架构的人。更扎心的数据来自一项严格实验：资深开发者以为 AI 帮自己提速了 20%，实际却被拖慢了 19%。经验到底还值不值钱？答案比你想的复杂。

六个月不碰 AI，你的直觉就过期了？

Harj Taggar 是 YC 前合伙人，在硅谷工程圈有广泛影响力。5 月 23 日，他在 X 上发了这样一段话：

"AI is embarrassing a lot of senior engineers. A junior who touched the frontier yesterday often has better instincts for what's possible than someone experienced who last touched it six months ago."

「AI 正在让很多资深工程师蒙羞。一个昨天刚接触前沿的初级工程师，对什么已经可能的直觉，常常比一个六个月没碰过前沿的老手更好。」

▲ Harj Taggar 的原帖，评论区迅速形成针锋相对的两派

这段话的杀伤力在于——他没有说资深工程师不行，他说的是你的经验有保质期，而这个保质期正在急速缩短。

过去，一个 senior 工程师花五年踩坑积累下来的「什么能做、什么不能做」的判断力，是团队里最值钱的资产。但当 AI 编程工具的能力每隔几个月就跳一个台阶——上下文窗口从 8K 涨到百万级、代码理解从片段到全仓库、agent 从补全助手进化到自主执行——半年前形成的「可行性直觉」，今天可能已经是错的。

你以为这个任务做不到？可能只是你用的还是去年的工具。

评论区立刻分裂：经验到底过不过期？

Harj 的帖子发出后，评论区迅速形成了几派对峙。

「知识半衰期」派立刻跟上。有 13 年经验的开发者 Alexander Benz 回复说，自己也感受到了同样的变化：

最大的优势已经不再来自经验，而是你距离上一次更新「什么已经可能」的认知有多近。AI 知识半衰期大概只有三个月。

三个月。也就是说，你上个季度对 AI 编程工具形成的判断，这个季度可能就不准了。

但「生产现实」派马上反击。开发者 Kimo 给出了整个讨论里最精准的边界限定：

"AI is not embarrassing senior engineers. It is embarrassing senior engineers who stopped updating... production still punishes people who don't understand systems, debugging, tradeoffs, and failure modes."

「AI 没有让资深工程师蒙羞。它让那些停止更新的资深工程师蒙羞……生产环境依然惩罚不懂系统、不懂调试、不懂权衡、不懂故障模式的人。」

还有人从另一个角度切入。John Collins 认为，好的工程直觉来自多年被生产事故锤出来的教训，更好的工具不会自动赋予这种直觉——如果一个 junior 问错了问题或者误读了 AI 的回答，速度快反而更危险。

Srinivas Raju M 则提供了一个更温和的解释：AI 没有让初级工程师在所有维度超越资深工程师，但它大幅降低了进入陌生代码库、建立上下文、加速交付的门槛。过去需要 senior 手把手带三个月才能上手的工作，现在可能几天就能跑起来。

这些争论指向同一个核心问题：AI 改变的到底是什么？

84% 的开发者已经上车，但只有 3% 真正信任 AI

争论归争论，有一件事没有争议：AI 编程工具已经成为开发者的日常。

Stack Overflow 2025 开发者调查给出了一组关键数据：84% 的受访者正在使用或计划使用 AI 工具（上一年为 76%），其中超过一半的专业开发者每天都在用。

▲ Stack Overflow 2025 调查：AI 工具使用率 84%，日常使用比例超过一半

GitHub 2023 年对 500 名美国大型企业开发者的调查更早就揭示了这个趋势：92% 的开发者已经在工作内外使用 AI 编码工具，70% 认为 AI 工具会在工作中带来优势。

▲ GitHub 调查：92% 美国企业开发者已使用 AI 编码工具

但使用率高不等于信任度高。

Stack Overflow 同一份调查里，46% 的开发者主动表示不信任 AI 输出的准确性，高于信任 AI 的 33%。而只有 3% 的开发者表示「高度信任」AI 的输出。

更值得注意的是，经验越丰富的开发者越谨慎。资深开发者群体中，「高度信任」AI 的比例只有2.6%，「高度不信任」的比例却高达20%——在所有经验层级中最高。

▲ 资深开发者对 AI 的信任度最低、不信任比例最高

66% 的开发者说他们遇到的最大挫折是「AI 给出的方案几乎对了，但又不完全对」。45% 认为调试 AI 生成的代码比自己从头写更费时间。

这些数据背后藏着一个反直觉的事实：资深工程师对 AI 更保守，可能并不是因为他们跟不上时代。他们承担的质量责任更重，更清楚「差不多对了」在生产环境里意味着什么。

以为 AI 帮你提速 20%？实际可能拖慢你 19%

如果上面的信任数据还不够刺激，METR 的一项严格实验会让你重新审视自己对 AI 工具的信心。

这项发表在 arXiv 上的随机对照实验（RCT）找了16 名经验丰富的开源开发者，让他们在自己平均有5 年经验的成熟项目上完成246 个任务。一半任务允许使用 AI 工具（主要是 Cursor Pro + Claude 3.5/3.7 Sonnet），另一半不允许。

▲ METR 论文：对经验丰富的开源开发者进行 AI 生产力的随机对照实验

结果出来，所有人都愣了：

任务开始前，开发者预测 AI 会帮自己减少 24% 的完成时间
任务结束后，开发者回顾估计 AI 帮自己减少了 20% 的完成时间
但实际 RCT 数据显示，允许使用 AI 反而让完成时间增加了 19%

"allowing AI actually increases completion time by 19%—AI tooling slowed developers down."

「允许使用 AI 实际让完成时间增加了 19%——AI 工具让开发者变慢了。」

事前觉得会快 24%，事后觉得快了 20%，实际却慢了 19%。主观感受和客观结果之间的鸿沟大得惊人。

为什么会这样？论文指出了几个可能的原因：在成熟代码库中，AI 生成的代码需要大量的审查、调试和集成工作；开发者花了额外时间跟 AI 沟通上下文和需求；而且 AI 输出的「看起来对」的代码，往往在边界情况和深层逻辑上出问题，修这些 bug 的时间吞掉了前面省下的速度。

这个结论不是说 AI 工具没用。它说的是：在你最熟悉的代码库里做最熟悉的事情时，AI 的收益可能远没有你感觉的那么大。而「觉得自己变快了」这种主观感受本身，就是一个陷阱。

真正被贬值的，到底是什么？

把 Harj 的观点、评论区的争论、Stack Overflow 的数据和 METR 的实验放在一起看，一个更清晰的图景浮出来了：

AI 正在重新定价工程师的三层能力。

第一层：可行性直觉。这是 Harj 真正在说的东西。过去，判断「这个任务能不能做、用什么方案做」需要多年经验积累。现在，AI 工具的能力边界每隔几个月就变一次——上个季度用 AI 做不到的事情，这个季度可能已经可以了。如果你不持续跟踪 frontier，你的「可行性直觉」就在贬值。

第二层：执行效率。AI 把很多过去需要经验才能快速完成的任务——读懂陌生代码、生成候选方案、写测试雏形、迁移脚本——变成了低门槛操作。初级工程师借助 AI 可以更快地建立上下文、产出原型。这意味着「我写代码比你快」这个优势，正在被工具抹平。

第三层：质量判断。但 Stack Overflow 的数据和 METR 的实验共同指向一件事——AI 生成的代码需要人来验证，而验证能力恰恰来自经验。66% 的开发者被「差不多对」的 AI 输出困扰，45% 觉得调试 AI 代码更费时间。能看出 AI 输出哪里不对、能设计验证路径、能判断什么时候该信 AI 什么时候不该信——这些能力反而在升值。

所以，真正在贬值的不是「经验」这个整体概念。贬值的是那种停在原地、不再更新工具链和认知边界的经验。升值的是那种持续校准、能把 AI 产出放进生产系统并为结果负责的经验。

你要怎么办？

如果你是资深工程师，Harj 的帖子可能让你不舒服。但不舒服的原因可能恰恰是——你知道他说的有几分道理。

METR 的实验提醒我们，「觉得自己在用 AI」和「AI 真的在帮你」之间有巨大的鸿沟。Stack Overflow 的数据告诉我们，谨慎并没有错，但谨慎不能变成不碰。

经验并没有消失，只是不能再躺在简历里计息。

AI 把旧经验里「知道怎么写」的部分压低了价格，却把「知道如何验证、如何取舍、如何上线、如何在工具变化时持续校准」的部分抬高了价格。

真正被 AI 蒙羞的，从来都是停止更新的人。

— END —