微软CTO的AI「冷水」:最聪明的人正在犯一个最笨的错误

关注并加入星标，每天 7:33 准时送达一手洞察 🌟

在旧金山一家酒吧里，微软CTO Kevin Scott对着满屋子开发者和记者，泼了一盆冷水。

他说的是「能力过剩」——AI模型的能力已经远远超过了我们实际使用它的场景。「一个AI模型能力很强，并不意味着它就能被快速部署。」

这句话听起来像老生常谈的「技术落地难」。但如果你仔细听，会发现他真正在说的，是一个更让人不安的事实：我们正在为一个能造出火箭的引擎，找一个开去菜市场的理由。

一个反直觉的现象：AI越好，问题反而越糟

Scott把AI领域分成两块。一块是「编程智能体」，这是目前AI能力最领先的领域——模型写代码的能力已经远超大部分人类程序员。另一块是其他所有领域。

在编程领域，反馈循环极短：模型写完代码，编译器马上告诉你对不对，测试用例立刻验证结果。这是一个完美的「闭环」——输出可以立刻被测量并反馈回来，优化下一轮。

但问题就出在这里：正因为编程的反馈循环太完美，它反而成了AI落地的例外，而不是常态。

Scott说了一句值得反复琢磨的话：「不要把AI的能力和实际部署速度划等号。在某些地方，能力提升确实会带来快速部署，但在另一些地方，完全不会。」

换句话说，AI模型越强，我们越容易陷入一个认知陷阱：以为能力强就等于用得上。

为什么「好工具」反而让人更难下手？

这里有一个反直觉的机制。

当一个工具的能力远超过你当前的需求时，你反而会陷入「不知道该怎么用它」的困境。这不是因为工具不好，而是因为你对自己的任务缺乏清晰的认知。

想想看：如果你的螺丝刀只能拧一种螺丝，你知道什么时候用它。但如果你的螺丝刀能拧100种螺丝，还能当撬棍、开瓶器、甚至小锤子——你反而会犹豫：我现在该用它吗？用它的哪个功能最合适？会不会大材小用？

这就是Scott说的「能力过剩」的真正含义。AI模型的能力提升，并没有自动创造出对应的使用场景。相反，它暴露了一个更深层的问题：我们对自己的工作流程、任务结构、决策逻辑的理解，远远落后于AI的能力。

真正被低估的瓶颈：任务结构的「反馈循环」

Scott的第二个观察点才是关键：为什么编程领域能跑在前面？因为它的反馈循环最短、最清晰。

写一段代码→编译→看结果→修改。这个循环可能在几秒钟内完成。而且反馈是确定的：编译通过就是通过，不通过就是不通过。

但企业里大多数任务，反馈循环长得多。比如：

• 市场策略调整：可能需要几周甚至几个月才能看到效果

• 产品设计决策：用户反馈的收集和分析需要时间

• 管理决策：团队士气的变化、组织效率的提升，很难量化

当反馈循环长、信号弱、结果模糊时，AI的「能力过剩」就变成了一个问题。因为你无法判断：这个AI帮我做的决策到底对不对？这个AI生成的方案，跟我的直觉判断相比，哪个更好？

Scott说得很直白：「我们不应该对AI能力的提升抱有一致的信仰，认为能力越强，部署就越快。在某些地方确实会快，但在另一些地方，完全不会。」

这句话的核心判断是：反馈循环的结构，决定了AI落地的速度，而不是模型的能力。

一个危险的推论：最聪明的人正在犯的错

如果你接受了上面的逻辑，就会推导出一个令人不安的结论。

硅谷和AI行业最聪明的人，正在集中精力做一件事：把模型能力推到极致。他们相信「能力到了，场景自然会出现」。这是一种「Field of Dreams」式的信仰——「建好了，他们就会来」。

但Scott明确说这不是真的。「在某些地方，是的；在某些地方，不是。」

问题在于：当能力提升的速度远超过场景创造的速度时，差距不是在缩小，而是在扩大。

这就是为什么现在出现了大量「AI很强，但用不上」的案例。企业买了最好的模型，建了最大的算力集群，然后发现：我们根本不知道拿它来做什么。不是因为AI不够好，而是因为我们对自身的任务结构缺乏理解。

最聪明的人正在犯一个最笨的错误：他们把精力放在解决「AI不够强」的问题上，而真正的问题是「我们对任务的理解不够深」。

边界条件：什么情况下这个判断会失效？

当然，这个判断不是放之四海而皆准的。有三个边界条件需要注意：

第一，如果AI能力继续爆发式增长，达到「通用智能」的程度，那么反馈循环的问题可能会被绕过——因为模型自己就能理解任务结构、设计反馈机制。但Scott的观察暗示，这个临界点还远未到来。

第二，在某些「反馈循环天然短」的领域，AI的落地速度确实会很快——比如编程、数据分析、文档处理。Scott也承认这一点。但这恰恰印证了他的核心论点：落地的瓶颈在任务结构，而不是模型能力。

第三，如果企业愿意投入巨资重构业务流程、建立新的反馈机制，那么反馈循环的问题也可以被缓解——但这需要巨大的组织变革成本，不是所有企业都愿意或能够承担。

所以，Scott的「冷水」更准确地说，是一个阶段性判断：在AI达到通用智能之前，任务结构的反馈循环，是比模型能力更重要的瓶颈。

这意味着什么？

如果Scott是对的，那么AI行业需要做几件跟直觉相反的事：

第一，停止只盯着模型能力，开始研究任务结构。 我们需要搞清楚：哪些任务的反馈循环是短的？哪些是长的？能不能把长循环的任务拆成短循环的？能不能在任务中嵌入更快速的反馈机制？

第二，接受一个事实：AI落地的速度，不会比我们理解自身任务的速度更快。 这意味着，企业需要的不是更强的AI，而是更好的「任务审计」——搞清楚自己到底在做什么、怎么做、为什么这么做。

第三，警惕「能力过剩」带来的认知扭曲。 当一个工具的能力远超过你的需求时，你很容易产生错觉：以为工具本身就等于解决方案。但工具只是工具，真正的价值在于你用它解决什么问题。如果你连问题都说不清楚，再好的工具也只是摆设。

Scott的演讲没有给出具体的解决方案。但他的诊断本身，就是最有价值的信号。它告诉我们：AI的瓶颈不在模型里，在我们的脑子里。

问题不是「AI能做什么」，而是「我们知道自己需要AI做什么吗？」

最后一个问题

Scott在演讲中提到了一个有趣的对比：编程领域之所以AI落地最快，是因为它有「最紧密的反馈循环」。编译器的检查、测试用例的验证、代码审查的流程——这些机制让AI的输出可以立刻被评估和优化。

但其他领域呢？市场营销的反馈周期是按月计算的。战略决策的反馈周期是按季度甚至按年计算的。组织变革的效果，可能一两年后才显现。

问题来了：如果一个任务的反馈循环天然很长，我们能做什么？

一种思路是：在任务中嵌入「人工反馈循环」。比如，让AI生成的方案先在小范围内测试，快速收集反馈，再迭代。另一种思路是：接受一个事实——有些任务就不适合交给AI，不是因为AI做不到，而是因为我们无法判断它做得好不好。

这是一个让人不舒服的结论。但它可能比任何「AI万能论」都更接近真相。

Kevin Scott在旧金山酒吧里说的那番话，本质上是在提醒我们：不要把AI当作银弹。没有银弹。有的只是一个个具体的、需要被理解的任务，和一个个需要被建立的反馈循环。

而建立反馈循环这件事，比训练一个更大的模型，要难得多。