高盛:AI需要开始变现了

👆点击蓝字,关注我们
高盛:AI该收钱了
高盛表示,随着token消耗量的跳跃式增长,每token的算力成本下降速度,已经超过了token定价的降幅,这种相对变化的剪刀差收窄,在未来3到12个月内,可能会让超大规模云厂商和大模型的毛利率来到拐点。也让智能体AI,把整个AI行业从成本叙事,推向到了利润叙事。
我们先来看高盛说的这把剪刀。在AI周期的第一阶段,投资者把算力和token都当成成本驱动因素。比如更多的使用就意味着更多的推理负载、更多的加速器、更多的电力,最后都会落到资本开支上。但高盛的数据表明,这套逻辑正在反转。怎么反转的?主流大模型的token定价,已经从此前每年大约40%的降幅趋于稳定,部分情况下甚至小幅回升。而英伟达、AMD、谷歌TPU以及亚马逊Trainium这些芯片驱动的每token成本,仍然在以每年60%到70%的速度持续下降。这两条曲线一条基本走平,一条在快速向下,中间那个剪刀差利润空间就会被放大。也就是说,只要token的售价稳定在成本线以上,智能体AI每多用一份,就多增加一份边际利润。
那么这种利润扩张能持续吗?高盛指出,智能体AI可能形成一个自我强化的飞轮:每token成本越低,就越能催生更复杂、更长链条的代理;这些代理通过更长的上下文、更多的推理循环、更多的验证和持续监控,又会反过来消耗更多token;token使用量上去了,AI基础设施的经济性又被改善,而这个改善又会反过来再支撑模型质量和分发能力的持续投入。
这个飞轮把市场此前的悲观预期,也就是越使用AI越投资AI越看不到回报这个叙事,给大大削弱了。
那token的需求增量到底从哪里来呢?一边是消费端,一边是企业端。咱们先说消费端。
高盛把消费端的AI代理分成两类。一类是”按需主动型”,比如OpenAI的Operator、Claude Code这种浏览器端代理,这类是由用户主动发起任务,代理自己规划、执行、返回结果。另一类是”常驻被动型”,也就是7乘24小时在后台运行的助手,包括监控你的邮箱、管理你的日程、处理你的数字生活等等。
这两类的token消耗量可能要差出了两个数量级。一次普通的聊天会话大概消耗1000个token,嵌入式的Copilot每天5000多个,而常驻型代理每天的token消耗量,可以轻松超过10万个Token。
高盛据此预计,到2030年,每日AI查询量会从2025年的大约50亿次,增长到大约230亿次。其中最多30%会流向搜索、购物、旅行、邮件和个人生产力领域的代理。传统搜索引擎的份额会从68%降到36%,大模型原生应用的份额则从12%提升到31%。仅消费端这一块,到2030年就会让全球token消耗量翻12倍,每月新增大约60千万亿个token。
不过更大的乘数来自企业端。高盛预计,企业端AI代理到2030年会推动全球token消耗量增长24倍,到2040年会进一步扩大到55倍。届时,企业端工作负载会占到全球token总使用量的70%以上。
为什么企业端的token强度比消费端高这么多?因为企业代理的工作流要求它们做更复杂、更精确的操作,比如监控任务、检索上下文、推理异常、验证输出,再叠加多模态输入,token消耗自然就上去了。
对于当前的投资逻辑,高盛的结论是:超大规模云厂商利润率的改善,会让当前高企的基础设施投资更具可持续性。换句话说,如果毛利率拐点真的来了,市场对AI资本开支回报的核心疑虑,就有了一个可以兑现的答案。
最后看一下软件和服务这一块。高盛认为更低的token成本,会让软件厂商更容易把代理嵌入现有产品,而不显著影响毛利率。同时也让定价模式发生变化,比如软件不再只是按席位数收费,而是可以围绕成果、生产力或者消耗量来定价。这意味着软件总市场被扩大了。对IT服务公司,随着代理把AI消费从独立工具转向企业级、高集成度的工作流改造,对集成、治理和托管编排的需求会大幅提升。
不过也提示了一个风险点:并非所有的AI工作负载都能保证实现正向利润拐点。对于商品化程度较高的纯文本聊天机器人,竞争仍然可能迫使token定价的下降速度快于算力成本,这个剪刀差也会被磨平甚至倒挂。
Jason认为,Anthropic 3月的ARR是300亿美元,最新的数字已经到了440亿。一家刚刚成立几年的公司,光这一项业务的年度收入,很有可能落到500到600亿美元区间。再算上OpenAI的话,两大模型公司的总收入可能已经过了千亿。这个数字放在整个美股都是一览众山小的存在,而且这才仅仅几年,未来的空间还有很大。
同时,一季度三大云厂的AI业务也在超预期,AWS加速到28%、谷歌云加速到63%、Azure保持在40%。三大云无论是绝对体量还是相对增速,现在看都很扎实。
模型在变现,云在变现,这两点就大大削弱了市场对AI变现的担忧,也增强了一些对云厂商资本开支的容忍度。也因此,我们美投团队对于今年整个AI的观点都变得更加乐观了。要想知道具体的原因,欢迎移步到我们团队的另一个频道,美投讲美股中看刚过去周末发布的视频。
那既然资本开支多了,市场容忍度也高了,钱流去哪里了呢?在我们另一个频道的视频中也说到,现在的逻辑,就是会吸引资金流去更确定的半导体板块,也正是因为这种确定和乐观,让4月后的半导体疯了般上涨。Jason这里就不单拎出来个股说了,个股有个股的特殊因素,我们来看看费城半导体指数SOX,它在过去的五周里上涨了46%。按过去30年来看,当前SOX比标普的相对表现,这怎么形容呢,是2000年互联网泡沫极值的将近两倍。这是明显的过热,也是不可持续的过热。所以它短期出现回调,甚至出现5%到10%的均值回归都有可能。当然了,仅就当前这个阶段而言,短期回调也是倒车接人的好机会,为什么?因为杰文斯悖论,就是高盛在本篇研报所说的,技术让单位资源更便宜,结果不是省钱不买技术、不买芯片,而是更便宜的单位成本会催生出更多的应用、需求、和token消耗量,最终反而会带动更多的芯片需求。

因此我认为,半导体短期回调的概率不低,但就我能看到的未来12个月而言,这种回调更多的是投资过热风险,而不是基本面或者行业层面的拐点风险。除非碰到更大的危机,市场才会有一个像样的重置。那么这个危机会是什么呢?我觉得有两种可能:一种是信贷周期的反转,另一个信号,就是今年三巨头的IPO。接着,我们就对这两点继续聊聊。


往期推荐
|
|||
|
|||
|
|||
|
联系我们
想在订阅美投Pro前了解具体服务内容?可邮件我们了解详情:info@jdbinvesting.com

https://www.jdbinvesting.com/
夜雨聆风