关注并加入星标,每天 7:33 准时送达一手洞察 🌟
在旧金山一家酒吧里,微软CTO Kevin Scott对着满屋子开发者和记者,泼了一盆冷水。
他说的是「能力过剩」——AI模型的能力已经远远超过了我们实际使用它的场景。「一个AI模型能力很强,并不意味着它就能被快速部署。」
这句话听起来像老生常谈的「技术落地难」。但如果你仔细听,会发现他真正在说的,是一个更让人不安的事实:我们正在为一个能造出火箭的引擎,找一个开去菜市场的理由。

一个反直觉的现象:AI越好,问题反而越糟
Scott把AI领域分成两块。一块是「编程智能体」,这是目前AI能力最领先的领域——模型写代码的能力已经远超大部分人类程序员。另一块是其他所有领域。
在编程领域,反馈循环极短:模型写完代码,编译器马上告诉你对不对,测试用例立刻验证结果。这是一个完美的「闭环」——输出可以立刻被测量并反馈回来,优化下一轮。
但问题就出在这里:正因为编程的反馈循环太完美,它反而成了AI落地的例外,而不是常态。
Scott说了一句值得反复琢磨的话:「不要把AI的能力和实际部署速度划等号。在某些地方,能力提升确实会带来快速部署,但在另一些地方,完全不会。」
换句话说,AI模型越强,我们越容易陷入一个认知陷阱:以为能力强就等于用得上。

为什么「好工具」反而让人更难下手?
这里有一个反直觉的机制。
当一个工具的能力远超过你当前的需求时,你反而会陷入「不知道该怎么用它」的困境。这不是因为工具不好,而是因为你对自己的任务缺乏清晰的认知。
想想看:如果你的螺丝刀只能拧一种螺丝,你知道什么时候用它。但如果你的螺丝刀能拧100种螺丝,还能当撬棍、开瓶器、甚至小锤子——你反而会犹豫:我现在该用它吗?用它的哪个功能最合适?会不会大材小用?
这就是Scott说的「能力过剩」的真正含义。AI模型的能力提升,并没有自动创造出对应的使用场景。相反,它暴露了一个更深层的问题:我们对自己的工作流程、任务结构、决策逻辑的理解,远远落后于AI的能力。

真正被低估的瓶颈:任务结构的「反馈循环」
Scott的第二个观察点才是关键:为什么编程领域能跑在前面?因为它的反馈循环最短、最清晰。
写一段代码→编译→看结果→修改。这个循环可能在几秒钟内完成。而且反馈是确定的:编译通过就是通过,不通过就是不通过。
但企业里大多数任务,反馈循环长得多。比如:
• 市场策略调整:可能需要几周甚至几个月才能看到效果
• 产品设计决策:用户反馈的收集和分析需要时间
• 管理决策:团队士气的变化、组织效率的提升,很难量化
当反馈循环长、信号弱、结果模糊时,AI的「能力过剩」就变成了一个问题。因为你无法判断:这个AI帮我做的决策到底对不对?这个AI生成的方案,跟我的直觉判断相比,哪个更好?
Scott说得很直白:「我们不应该对AI能力的提升抱有一致的信仰,认为能力越强,部署就越快。在某些地方确实会快,但在另一些地方,完全不会。」
这句话的核心判断是:反馈循环的结构,决定了AI落地的速度,而不是模型的能力。

一个危险的推论:最聪明的人正在犯的错
如果你接受了上面的逻辑,就会推导出一个令人不安的结论。
硅谷和AI行业最聪明的人,正在集中精力做一件事:把模型能力推到极致。他们相信「能力到了,场景自然会出现」。这是一种「Field of Dreams」式的信仰——「建好了,他们就会来」。
但Scott明确说这不是真的。「在某些地方,是的;在某些地方,不是。」
问题在于:当能力提升的速度远超过场景创造的速度时,差距不是在缩小,而是在扩大。
这就是为什么现在出现了大量「AI很强,但用不上」的案例。企业买了最好的模型,建了最大的算力集群,然后发现:我们根本不知道拿它来做什么。不是因为AI不够好,而是因为我们对自身的任务结构缺乏理解。
最聪明的人正在犯一个最笨的错误:他们把精力放在解决「AI不够强」的问题上,而真正的问题是「我们对任务的理解不够深」。

边界条件:什么情况下这个判断会失效?
当然,这个判断不是放之四海而皆准的。有三个边界条件需要注意:
第一,如果AI能力继续爆发式增长,达到「通用智能」的程度,那么反馈循环的问题可能会被绕过——因为模型自己就能理解任务结构、设计反馈机制。但Scott的观察暗示,这个临界点还远未到来。
第二,在某些「反馈循环天然短」的领域,AI的落地速度确实会很快——比如编程、数据分析、文档处理。Scott也承认这一点。但这恰恰印证了他的核心论点:落地的瓶颈在任务结构,而不是模型能力。
第三,如果企业愿意投入巨资重构业务流程、建立新的反馈机制,那么反馈循环的问题也可以被缓解——但这需要巨大的组织变革成本,不是所有企业都愿意或能够承担。
所以,Scott的「冷水」更准确地说,是一个阶段性判断:在AI达到通用智能之前,任务结构的反馈循环,是比模型能力更重要的瓶颈。
这意味着什么?
如果Scott是对的,那么AI行业需要做几件跟直觉相反的事:
第一,停止只盯着模型能力,开始研究任务结构。 我们需要搞清楚:哪些任务的反馈循环是短的?哪些是长的?能不能把长循环的任务拆成短循环的?能不能在任务中嵌入更快速的反馈机制?
第二,接受一个事实:AI落地的速度,不会比我们理解自身任务的速度更快。 这意味着,企业需要的不是更强的AI,而是更好的「任务审计」——搞清楚自己到底在做什么、怎么做、为什么这么做。
第三,警惕「能力过剩」带来的认知扭曲。 当一个工具的能力远超过你的需求时,你很容易产生错觉:以为工具本身就等于解决方案。但工具只是工具,真正的价值在于你用它解决什么问题。如果你连问题都说不清楚,再好的工具也只是摆设。
Scott的演讲没有给出具体的解决方案。但他的诊断本身,就是最有价值的信号。它告诉我们:AI的瓶颈不在模型里,在我们的脑子里。
问题不是「AI能做什么」,而是「我们知道自己需要AI做什么吗?」

最后一个问题
Scott在演讲中提到了一个有趣的对比:编程领域之所以AI落地最快,是因为它有「最紧密的反馈循环」。编译器的检查、测试用例的验证、代码审查的流程——这些机制让AI的输出可以立刻被评估和优化。
但其他领域呢?市场营销的反馈周期是按月计算的。战略决策的反馈周期是按季度甚至按年计算的。组织变革的效果,可能一两年后才显现。
问题来了:如果一个任务的反馈循环天然很长,我们能做什么?
一种思路是:在任务中嵌入「人工反馈循环」。比如,让AI生成的方案先在小范围内测试,快速收集反馈,再迭代。另一种思路是:接受一个事实——有些任务就不适合交给AI,不是因为AI做不到,而是因为我们无法判断它做得好不好。
这是一个让人不舒服的结论。但它可能比任何「AI万能论」都更接近真相。
Kevin Scott在旧金山酒吧里说的那番话,本质上是在提醒我们:不要把AI当作银弹。没有银弹。有的只是一个个具体的、需要被理解的任务,和一个个需要被建立的反馈循环。
而建立反馈循环这件事,比训练一个更大的模型,要难得多。
夜雨聆风