走进任何一家数据中心,你都会看到成千上万的服务器灯光闪烁,风扇轰鸣,仿佛每一台机器都在为一场无声的竞赛拼命运转。我们以为 AI 热潮可能只是泡沫,消费端的需求远远不足以支撑如此庞大的算力投入,但事实是,Agent(智能体)正在悄然改变规则。2022 年的 ChatGPT 启动了人类管理的 LLM(大语言模型)时代,2024 年 o1 实现了内部推理自检,而 2025 年的 Opus 4.5 则催生了 Claude Code 这样的 Agent 流程——能自主调度模型并调用确定性工具,长时间完成任务。企业市场成为新的核心战场,Agent 不知疲倦地替代组织中难以管理的人类零件,将“最佳组织规模”推向更小团队,释放真正的生产力。同时,模型与控制软件的深度整合成为竞争护城河,推动算力需求持续上升。于是,AI 不再只是技术噱头,而是一场正在重塑企业结构、经济价值和算力布局的深刻变革。
【读书笔记】
1.我们当前并不处于AI泡沫之中,超大规模云厂商扩张资本开支是合理的,LLM的弱点正被指数级增长的算力解决;推动AI需求爆发所需的高效使用者数量在减少;Agent带来的回报同时体现在利润端和收入端;即使面对资本市场质疑,几乎所有云厂商依然强调算力需求远超供给,并宣布了远超预期的开支计划
2.LLM经历了三次范式演进,从需要人类高度参与过渡到了自动化验证的Agent阶段,2022年11月的ChatGPT让世界意识到能力边界,但存在幻觉且需要人类主动管理;2024年9月的o1通过内部推理进行自我评估,更加可靠;2025年11月的Opus 4.5 催生了Claude Code等Agent流程,能自主调度模型并调用确定性工具,持续数小时正确完成任务
3.AI对海量算力的持续调用不再依赖于人类社会的大规模普及,过去利用AI需要人类具备“主动性”去管理模型;但功能完备的Agent将人类从模型管理中解放出来后,一个具备主动性的人可以同时控制多个Agent,这使得极少数人群就足以推动海量算力的持续调用,并创造出经济价值
4.专注企业市场的策略才是正确的,AI将驱动企业将“最佳组织规模”推向更小的员工数量,企业愿意为提升生产力的软件买单;大型组织存在巨大的协同成本,而Agent不知疲倦地工作,能替换掉难以管理的人类组织零件,实现“纯粹加速”
5.模型并不会完全走向大宗商品化,模型与Harness的深度整合才是差异化竞争和获取利润的关键,尽管DeepSeek用600万美元训练出了匹敌1亿美元系统的模型,引发了商品化论调,但推理模型需要极高计算速度和巨大内存,难以在本地运行;更关键的是,Agent需要模型与控制软件的深度整合,它们是不可分割的整体,无法自由替换
本文编译自发布于 2026 年 3 月 16 日的 Stratechery 的专栏,原链接:
https://stratechery.com/2026/agents-over-bubbles/
以下是原文的全文翻译,enjoy!
注:正文中标蓝部分为读书笔记的对应原文
【正文】
在 AI 发展前景的判断上,存在一个奇怪的悖论:一方面,你不愿意成为那个彻底否定最可怕末日场景的人;毕竟,谁愿意最终被证明是个愚蠢的乐观主义者呢?但另一方面,你也面临着另一种压力——必须认真对待“我们正处于泡沫之中”的可能性,认为如今所有的热潮和投入最终都会化为泡影。
过去,我一直反对前一种观点,但对后一种观点相当认同,并且专门论证过:泡沫未必是坏事。然而,坐在 2026 年 3 月、Nvidia GTC 开幕当天的这个早晨,我得出了一个不同的结论:我认为我们并不处于泡沫之中。
LLM 范式演进
过去几周里,无论是在分析 Nvidia 财报时,还是上周讨论 Oracle 财报时,我都提到了 LLM 的三个关键拐点。
ChatGPT: 第一个 LLM 拐点是 2022 年 11 月 ChatGPT 的发布,这几乎无需解释。确实,基于 Transformer 的大型语言模型早在 2017 年就已经出现,其能力令人惊叹且持续进步,但长期被市场低估。2022 年 10 月,Stratechery 甚至围绕 Daniel Gross 和 Nat Friedman 启动了一档访谈系列,其出发点是:这里有一项不可思议的新技术,但它严重缺乏产品化应用和创业生态的推动。
不用说,仅仅几周之后,这个判断就被彻底颠覆了。ChatGPT 让全世界第一次真正意识到 LLM 的能力边界。但与此同时,初代版本也有两个问题,而这两个问题至今仍深深影响着许多人,尤其是那些坚信 AI 泡沫论的人。
第一个问题是,LLM 经常出错;更糟糕的是,当它不知道答案时,还会产生幻觉。这让 LLM 更像一种令人惊叹的魔术表演:运行顺利时效果震撼,但你无法真正依赖它。
第二个问题与第一个问题相关。即便在这种不完美状态下,LLM 已经极其有用,但前提是你必须先知道该拿它做什么,而且需要主动管理错误、验证输出结果,以防模型产生幻觉。
o1: 第二个 LLM 拐点是 OpenAI 于 2024 年 9 月发布的 o1 模型。到了那个阶段,LLM 已经取得了巨大的进步。一方面是新一代基础模型的推出,另一方面则是后训练能力的持续提升。这意味着,无论是在 ChatGPT 还是 Claude 中,模型输出答案的正确率都显著提高,幻觉出现的概率也有所下降。
但真正让 o1 与众不同的,是它会在回答你之前先对答案进行推理。我当时在一篇 Update 中这样解释:
传统 LLM 面临的核心挑战在于路径依赖(path-dependent)。它们可以理解整个问题,但一旦在推理过程中做出某个判断,就会被锁定在这条路径上,并最终一路错到底。这其实是所有“自回归大型语言模型(auto-regressive large language models)”的根本弱点,而直到当时,所有主流模型都属于这一类别。
推理模型会进行自我评估。它们会先推导答案,然后再判断答案是否正确,或者是否存在更好的替代方案。换句话说,针对我前面提到的缺陷,它们开始主动在内部管理错误,从而减轻用户持续引导 LLM 的负担,而结果也非常惊人。
在我看来,如果 ChatGPT 的伟大之处在于让 LLM 更容易理解、更容易使用,那么 o1 的伟大之处则在于让 LLM 变得更加可靠,也更加不可或缺。
Opus 4.5: Anthropic 于 2025 年 11 月 24 日发布了 Opus 4.5,最初市场反响并不热烈。但到了 12 月的某个时间点,搭载 Opus 4.5 的 Claude Code 突然开始展现出此前从未出现过的能力。几乎同一时期,OpenAI 于 12 月 18 日发布 GPT-5.2-Codex,其表现同样令人震惊。人们已经讨论了很久“Agent”,但这一次情况不同了。Claude 和 Codex 不再只是展示能力,而是真正开始完成任务,其中有些任务甚至持续数小时,而且最终能够正确完成。
不过,Opus 4.5 的发布时间本身其实揭示了一个关键事实:Agent 工作流的核心并不仅仅是模型本身,也不仅仅是像 o1 那样递归调用模型。真正关键的是“Harness”,也就是负责控制模型运行的软件系统。
换句话说,Claude Code 和 OpenAI Codex 实际上把用户从模型管理中抽象了出来。用户不再直接操纵模型,而是向 Agent 下达指令,再由 Agent 去调度模型完成工作。更重要的是,Agent 还能调用其他确定性工具,因此能够主动验证自己的结果。
以编程为例:在第一种范式中,LLM 负责生成代码;在第二种范式中,LLM 会思考自己正在生成的代码,并不断迭代优化答案;而在第三种范式中,Agent 会指挥模型生成代码,然后检查代码是否真的能够运行,如果不能,就自动重新尝试,整个过程无需用户参与。
换句话说,初代 ChatGPT 最大的几个缺陷,如今已经在很大程度上得到解决,至少对于编程这类可验证场景而言是如此:LLM 首次答对的概率更高了;推理能力进一步提升了正确率;如今 Agent 还能主动验证结果,而不需要人类持续参与。剩下的唯一问题是:到底该拿这些能力做什么。
对主动性的需求正在下降
过去几周我反复讨论这三个拐点,是为了说明为什么整个行业如此缺算力,以及为什么超大规模云厂商持续扩张资本开支是合理的。
• 第一种范式需要大量训练算力,但推理——也就是回答用户问题——相对高效。模型生成答案后,直接输出即可。
• 第二种范式让推理算力需求大幅上升,原因有两个。首先,生成答案需要消耗更多 Token,因为推理过程本身也需要 Token,而不仅仅是最终答案。其次,推理能力让模型变得更加有用,因此使用频率提高,又进一步推高了 Token 消耗。
• 而第三种范式,则真正让资本开支从“投机性投资”变成了“满足现实需求的必要投入”。首先,一个答案往往需要多次调用推理模型。其次,Agent 本身也需要算力,而且 Agent 所需的算力以及 Agent 调用的大量工具,更适合运行在 CPU 上,而非 GPU。第三,Agent 再次带来了效用上的跃迁,这意味着它们未来的使用量甚至会超过聊天机器人中的推理模型。但我认为,市场最容易低估的,恰恰是第三点最终会如何体现。毕竟,如今使用聊天机器人的人远远多于使用 Agent 的人。而且我甚至认为,大多数人对聊天机器人的使用程度都远远不够。这本质上是一个主动性的问题:想要充分利用 AI,你必须主动去使用 AI。我在 2024 年的《MKBHD’s For Everything》中曾写道:
大型语言模型是智能的,但它们没有目标、没有价值观,也没有内在驱动力。它们只是工具,而工具只有在有人愿意并且主动使用时才会发挥作用。我认为,无论是 Brownlee 还是我自己,其实都不特别需要 AI;换个角度说,我们并没有那么害怕 AI。
而我们与 AI 的联系恰恰在于:我们原本就不需要它。媒体行业天然允许个人独立创作文字和视频内容,并借助互联网进行传播。至少对于 Brownlee 来说,他甚至可以凭借个人影响力,直接终结一家融资 2.3 亿美元创业公司的市场前景。
但有多少行业并不像媒体行业这样?有多少行业仍然需要一个团队来实现某个人的想法?又有多少产品和服务之所以没有诞生,并不是因为没人能想到它们,而是因为缺乏资源、团队以及协同能力,最终无法真正落地?
这才是 AI 改变世界的真正路径,而不仅仅是客服降本增效或其他那些显而易见的低垂果实。随着大型语言模型理解复杂指令、执行复杂任务的能力不断增强,并且能够在必要时调用确定性计算系统,一个“主权个体”所能调动的生产力也将随之放大。
互联网消除了媒体行业复杂成本结构存在的必要性,也摧毁了这些成本结构原本构成的竞争壁垒;而 AI 有可能对更多行业复制这一过程。
有趣的是,两年后回头再看,我会发现自己其实早在这一轮范式转变发生之前就已经写过相关判断。但即便如此,当它真正到来时,我依然感到震撼。
这正是功能完备的 Agent 真正重要的原因。你可以提前看到它的到来,却仍然会在它出现时感到惊讶。而且,按照 AI 领域一贯的规律来说:今天的 Agent,已经是它未来表现最差的时候。
然而,对主动性的影响才是最深远的变化。没错,使用 Agent 仍然需要主动性,而且具备这种主动性的人,数量大概率远少于聊天机器人的普通用户。
当然,你完全可以合理推测,未来聊天机器人本身也会成为 Agent 的管理者。但更关键的一点在于:当 Agent 将人类从模型管理中解放出来后,一个人就能够同时控制多个 Agent。
从算力需求的角度——以及进一步延伸到经济影响的角度——来看,这意味着并不需要大量具备主动性的人群,就足以推动海量算力被持续调用,并创造出真正具有经济价值的产品。换句话说,Agent 的崛起不仅意味着算力需求将迎来爆发式增长,也意味着这种需求的出现不再依赖于人类社会的大规模普及。AI 仍然需要主动性,但它不再需要那么多人具备主动性,就足以产生深远影响。
企业经济学驱动力
最近,随着 MacBook Neo 的发布,许多关注 Apple 的媒体都抓住了 Asus CFO Nick Wu 在公司最新财报电话会上对这款 599 美元电脑的评价——他称其为“对整个市场的一次冲击”。不过,同样值得关注的是,Wu 如何试图淡化 Neo 对市场可能产生的影响:
实际上,我们在去年下半年就已经听说 MacBook Neo 即将开始出货,所以内部提前做了一些准备。不过产品正式发布后,我们发现它的配置还是存在一些限制。例如内存无法升级,而且只有 8GB 内存,这可能会限制某些应用场景。所以我认为 Apple 对这款产品的定位更多还是内容消费。它与主流笔记本电脑的使用场景存在一定差异,因为从这个角度来看,Neo 更像是一台平板电脑,而平板电脑主要用于内容消费。
考虑到 Neo 处理器本身的强大性能,以及 Mac OS 在 8GB 内存下依然能够流畅运行——这在很大程度上得益于 Apple 对软硬件的深度整合——这种说法多少有些搪塞的意味。但与此同时,Wu 也点中了一个事实:大多数消费者的主要需求确实是内容消费。
这也是为什么你最喜欢的生产力软件最终总会转向企业市场。真正愿意为生产力付费的是企业,因为企业才是在为员工买单,并希望员工变得更高效的一方。
同样的逻辑也适用于 AI。至少在短期内,AI 最具吸引力的消费级应用,依然是 Google 和 Meta 的广告业务,而广告本身就建立在内容消费之上。
从这个角度看,OpenAI 认为自己能够把大量普通消费者转化为订阅用户,从一开始就不太现实。这也是为什么广告模式不可或缺;但与此同时,广告模式本身也不足以支撑整个商业模式。
毫无疑问,大多数人并不愿意为 AI 付费;至于他们是否愿意频繁使用 AI,以至于广告模式能够跑通,目前仍有待观察。换句话说,Anthropic 专注企业市场的策略其实是正确的。企业已经反复证明,它们愿意为能够提升员工生产力的软件买单,而 AI 显然符合这一标准。但真正让企业高管兴奋的,并不仅仅是 AI 可以减少岗位,而是 AI 能够通过减少岗位,让整个组织变得更加高效。
一直以来,即便是在大型企业中,真正推动公司前进、创造关键价值的人其实也只是少数。但这些人的影响力必须通过一个庞大的组织体系来释放,而这个体系由大量员工组成:有些人在加速进程,有些人在拖慢进程。
这个体系确实让大规模影响成为可能,但也伴随着巨大的协同成本。
而 Agent 将明显更加偏向于“纯粹加速”。这会让那些真正创造价值的人产生更大的影响力。我能够理解这样一种观点:最优秀的公司会利用 AI 去创造更多价值,而不仅仅是节省成本。但对于大型组织来说,更现实的情况是,AI 的积极影响未必体现在“消灭岗位”上,而是体现在“替换岗位”上——用 Agent 替代那些难以管理、难以激励的人类组织零件。
Agent 不仅会执行命令,而且会不知疲倦、持续不断地工作,直到任务完成为止。
这只会让“我们并不处于泡沫之中”这一论点变得更有说服力:
第一,LLM 的所有弱点都在被指数级增长的算力逐步解决
第二,推动 AI 需求爆发所需要的“高效使用 AI 的人”的数量正在减少
第三,Agent 带来的经济回报不仅体现在利润端,也体现在收入端
在这样的背景下,几乎所有 hyperscaler 都在强调算力需求远超供给,而几乎所有 hyperscaler 又都在面对资本市场质疑的同时,不断宣布远超预期的资本开支计划,这难道还值得惊讶吗?这也是为什么,未来那一波被归因于 AI 的裁员潮,不应该被简单视为企业借 AI 之名修正疫情时期过度招聘的问题,或者借机调整经历多轮收缩后依然偏高的薪酬体系。当然,这些因素确实存在。
但与此同时,也值得思考一个问题:企业之所以变得臃肿,是因为长期以来,扩大规模的唯一办法就是增加人手。而组织协同成本与员工规模不断扩大带来的负面影响,究竟会在什么时候超过新增员工创造的边际价值,其实很难判断。
通常只有当企业已经远远越过那个临界点之后,才会意识到自己已经过度扩张。
而一旦越过,再想回头就非常困难。AI 不仅给了企业一个削减冗余组织的理由,同时也将“最佳组织规模”大幅推向更小的员工数量。越来越多企业未来不仅会反思:在 AI 出现之前,我们是不是招太多人了?它们还会开始思考:在 AI 时代,我们是不是依然招太多人了?最具前瞻性、也最具未来适应性的做法,很可能不是少裁员,而是多裁员。
因为企业会希望,留下来的人被迫通过 Agent 重建组织规模和生产能力。毕竟,如果他们不这么做,那些从创立第一天起就建立在 AI 基础上的竞争对手,很快就会追上来。
这些公司拥有更低的成本结构,同时还拥有会随着时间持续增强的能力优势。
这种局面很有可能变得相当残酷。我并不是在倡导这种结果,而是在分析为什么它大概率会发生。经济层面的驱动力几乎不可抗拒。而这种驱动力最终会持续推高对更多算力的需求,进一步证明这并不是一场泡沫。
Agent 与 AI 价值链
另一个重要的泡沫问题,在于 Anthropic 和 OpenAI 的天价估值。即便这一切都是真的,如果模型最终变成大宗商品,那还有利润可赚吗?
Horace Dediu 在 Asymco 提出了这个问题,并进一步猜测 Apple 是否正在执行“企业史上最聪明的一步棋”:
Apple 的赌注之所以显得高明,是因为 AI 模型商品化的速度比任何人预期都快。软件和硬件天然都会走向商品化。真正的护城河来自整合能力和分发能力。DeepSeek 用 600 万美元训练出了一个能够匹敌价值 1 亿美元系统的模型。如今,80% 正在融资的创业公司都在使用开源模型。这些公司花费数千亿美元建设的护城河正在消失。
Apple 比任何人都更早意识到这一点。它没有自己训练 AI 模型,而是每年花约 10 亿美元授权 Google 的 Gemini。如果外包只需要 10 亿美元,为什么要花 1000 亿美元建工厂?如果明年出现更好的模型,Apple 直接更换供应商即可。Apple 并没有错过 AI 革命。它只是押注:最终的赢家不会是基础设施建设者,而是掌握客户关系的人。而在这个地球上,没有任何公司拥有比 Apple 更优质的客户群体。
我认为,在 LLM 的第一阶段范式中,上述观点几乎都站得住脚。很快,多个基础模型就已经足够满足大多数人的使用需求,例如做菜、基础医疗建议、心理陪伴或者聊天陪伴。与此同时,人们也有充分理由相信,这种能力水平的模型很快能够在本地设备上运行。事实上,当 Apple 自研模型未能成功发布时,我本人也曾认为,本地 AI 正是 Apple 的机会所在。然而,推理模型时代的到来,对本地推理逻辑造成了巨大冲击。
推理模型不仅因为生成大量 Token 而需要极高的计算速度,同时还需要指数级增长的内存容量,以支撑越来越大的上下文窗口。而这恰恰是本地模型最大的瓶颈。Apple 的芯片非常优秀,其统一内存架构也使得设备端推理能力比其他厂商更具优势。但在可预见的未来,能够与云端模型竞争的高性能推理模型运行在本地设备上的可能性几乎不存在。
真正可能对 Dediu 观点形成致命打击的,其实是 Agent。前面提到过,Opus 4.5 真正惊艳的地方并不是模型本身,而是 Claude Code 的 Harness 发生了变化,从而让整个系统突然变得极其有用。这意味着:模型性能并不是唯一重要的因素。模型与 Harness 的整合能力,才是真正实现 Agent 差异化竞争的关键。
这一点对于理解未来 AI 产业结构和利润流向至关重要。因为利润总是从价值链中模块化、可商品化的部分流出,而流向那些高度整合、具备差异化优势的部分。Apple 本身就是最经典的案例。它的硬件之所以没有商品化,是因为硬件与软件深度整合。因此 Apple 能够长期维持更高售价,并获取 PC 和智能手机行业绝大部分利润。
由此推导,如果 Agent 需要模型与 Harness 的深度整合,那么构建这种整合能力的公司——尤其是 Anthropic 和 OpenAI——未来的盈利能力可能远超人们在去年年底时的预期。反过来说,那些押注模型商品化的公司,未来可能会越来越难推出有竞争力的产品。
在这一趋势上,Microsoft 就像煤矿里的金丝雀。Microsoft 曾经把自己定位为一体化 AI 提供商。公司曾在财报电话会上高调宣称,与 OpenAI 的深度整合将帮助其构建可持续差异化的基础设施优势。但一个月后,OpenAI 几乎陷入危机,Microsoft 随即转向。
此后它越来越强调模型是商品,并提出 Core AI 战略——围绕模型建设基础设施,而模型本身则是可替换、对客户透明的。
然而到了上周,Microsoft 公布了自己应对 AI 减少席位数影响的方案——而这恰恰是其基于席位收费商业模式面临的最大挑战。Microsoft 计划推出新的企业套餐 E7。
价格达到每用户每月 99 美元,是此前旗舰产品 E5 的两倍。这是一次巨大的涨价。而要证明这种涨价合理,Microsoft 必须提供真正能够提升生产力的 AI 产品。因此,他们随新套餐一起发布了 Copilot Cowork。
如果“Cowork”这个名字听起来熟悉,那是因为它本质上就是 Claude Cowork 的企业版。Claude Cowork 是 Anthropic 今年早些时候推出的 Claude Code 图形化版本。当然,Microsoft 的实现方式存在重要差异。例如它运行在云端,并基于企业内部数据运行,同时继承企业已有的权限管理和访问控制体系。
但关键在于:Copilot Cowork 与 Copilot 聊天机器人不同,它并不是模型无关的。Cowork 是一个 Agent。而 Agent 同时需要模型和 Harness。这两者是深度整合的整体,而不是可以自由替换的模块。其影响非常深远。
至少目前来看,Microsoft 实际上是在承认:如果想做出企业愿意付费的 Agent 产品,就必须放弃自己此前强调的“模型无关”战略。而这进一步说明,模型可能并不会成为商品。因为 Agent 需要的远远不只是模型本身。这也让人不得不重新审视 Apple 的选择。Apple 只是授权使用 Gemini,并试图通过新版 Siri 自行构建 Harness。
但如果连 Microsoft 都认为这条路无法做出足够有竞争力的产品,那么 Apple 又做了什么,能够让人相信它可以做得更好?当然,Apple 也许仍然拥有一个优势。正如 Dediu 最后提到的那样:消费者可能根本没有那么在意 Agent。如果事实如此,那么“足够好”对于 Apple 来说就已经足够。而 Microsoft 面对真正关心 Agent 能力的企业客户,则不得不接受与 Anthropic 分享更多利润空间的现实。
不过,对本文而言,更重要的一点是:如果 Agent 正在让 Anthropic 和 OpenAI 成为 AI 价值链中的核心整合节点,那么关于这些公司估值过高、或者其他企业为它们建设数据中心而投入巨额资本开支缺乏合理性的“泡沫论”,很可能并不成立。
长按 & 扫码
获取更多报告
免费产品试用

现在微信的推送机制改了,后台很多读者反馈说看不到更新,有时候还需要点到公众号主页才能看到更新的文章,大家可以点击公众号主页右上角“...”设为星标。我们每周二三五日下午四点半会准时发文。有感兴趣的问题也都欢迎直接联系我们或者在文末留言,期待和各位的交流。
【更多内容,点击下方关注】
* * *
关于久谦资本
成立于2009年,服务于关注新兴领域的企业与一线投资机构;我们相信科学与技术能够改变专业服务;希望带给市场多一分理性、少一分似是而非;我们认为与众不同的研究与分析,是我们荣誉的唯一来源。
夜雨聆风