AI推理算力正在接棒训练算力,投资逻辑要换一张表
过去两年,AI 投资最容易理解的一条线是训练算力。
谁要训更大的模型,谁就要买更多 GPU;谁有更多 GPU,谁就可能做出更强模型;谁能供 GPU、做先进制程、做封装、做光模块、做数据中心,谁就站在 AI 基建链条上。
这条逻辑仍然成立。
但它已经不够了。
最近几周的 AI 热点有一个共同变化:Google 把 AI Search 和 Agent 推到搜索、购物、开发者工具里;Anthropic 收购 Stainless 补 SDK 和 MCP 连接层;Qwen Code 这类编程 Agent 在做后台任务、并行探索和工具调用;NVIDIA 最新财报也把 Agentic AI、AI factories 和 Data Center 拆得更细。
这些事情放在一起,说明 AI 的重心正在从“训练出一个更强模型”,转向“让模型在真实世界里高频执行任务”。
前者主要消耗训练算力。
后者会持续消耗推理算力。
对投资者来说,这意味着观察表要换。
01 ┃ 训练算力是造发动机,推理算力是每天跑车
训练和推理,很多人容易混在一起。
简单说,训练是把模型造出来,推理是模型每次被调用时产生答案、执行任务、生成图片、写代码、做搜索、操作工具。
训练像造发动机。
推理像每天开车。
造发动机当然重要,但如果这辆车未来每天被数亿人开、每次开车还要导航、听音乐、自动驾驶、避障、和其他系统通信,那长期消耗更可怕的,可能不是造发动机那一次,而是后面每一天的使用。
AI 也是这样。
当 ChatGPT 只是少数人尝鲜时,推理成本还只是产品成本的一部分。
当 AI 搜索进入十亿级月活,当 Agent 开始替企业写代码、查资料、整理合同、生成报告、操作 SaaS,当手机、PC、汽车、机器人都开始本地或云端调用模型,推理算力就变成一条持续消耗的基础设施。
所以今天看 AI 投资,不能只问“谁又训练了一个大模型”。
更要问:
谁的模型被高频调用?
调用发生在哪些场景?
每次调用的成本能不能下降?
下降以后,会不会反过来刺激更多使用?
这才是推理算力的飞轮。
训练算力决定模型上限,推理算力决定 AI 能不能被高频使用。
训练算力决定模型上限,推理算力决定 AI 能不能被高频使用。
02 ┃ NVIDIA 财报里最值得看的,不只是收入新高
NVIDIA 5 月 20 日发布的 FY2027 Q1 财报很夸张:季度收入 816 亿美元,同比增 85%;Data Center 收入 752 亿美元,同比增 92%。
这些数字已经足够亮眼。
但对 AI 投资观察来说,更关键的是它怎么重新描述自己的业务。
NVIDIA 提到,未来会用 Data Center 和 Edge Computing 两大平台来反映增长驱动,并在 Data Center 里拆出 Hyperscale 和 ACIE。ACIE 包括 AI Clouds、Industrial、Enterprise 等更分散的 AI 工厂需求。
这说明什么?
AI 基建不再只是超大云厂商训练大模型。
它正在进入更多行业、更多企业、更多国家级或区域级数据中心。换句话说,AI 算力的需求来源正在从“少数大模型训练项目”,扩散到“更多行业的持续推理与执行”。
还有一个数据也值得看:在旧口径下,Data Center compute 收入 604 亿美元,networking 收入 148 亿美元,后者同比增 199%。
为什么网络增长这么快?
因为 AI 不只是买芯片。大规模推理、Agent 工作流、多模态生成、分布式存储、跨节点通信,都要求更强的数据中心网络。
投资者如果只盯 GPU,容易漏掉后面的链条:网络、光模块、交换机、存储、液冷、电力、调度软件、推理优化框架。
推理算力时代,卖铲人的队伍会变长。
03 ┃ AI 搜索和 Agent,会把推理调用频次推高
Google Search I/O 2026 里披露,AI Mode 已经超过 10 亿月活,查询量按季度翻倍。
这个信号非常重要。
传统搜索的成本结构和 AI 搜索不一样。传统搜索主要是索引、排序、广告匹配。AI 搜索需要生成答案、做多步推理、引用来源,未来还可能调用购物、日历、地图、邮件、表格、第三方工具。
如果一个用户一天搜 20 次,其中越来越多变成 AI Mode,每一次都要模型参与,推理消耗就会变成搜索商业化的核心变量。
Agent 更是如此。
一个普通问答可能只调用一次模型。
一个 Agent 任务可能要拆成十几步:理解目标、查资料、调用工具、读取文件、生成计划、执行动作、检查结果、重试、总结。
如果它还要操作浏览器、写代码、跑测试、生成图片、整理表格,背后的模型调用次数会继续增加。
所以,推理算力不是一个抽象概念。
它会直接出现在产品体验里:
响应慢不慢?
能不能低成本多试几次?
能不能给普通用户开放更长上下文?
能不能支撑企业员工每天用?
能不能让 Agent 跑一小时而不是五分钟?
当 AI 产品从“偶尔问一下”变成“工作流常驻”,推理算力就会从成本项变成产品能力的一部分。
推理侧扩张会把压力传导到 GPU、网络、存储、电力、液冷和调度软件。
推理侧扩张会把压力传导到 GPU、网络、存储、电力、液冷和调度软件。
04 ┃ 推理侧的投资观察,要看四个指标
如果把推理算力作为主线,投资观察不能只看热度。
我会看四个指标。
第一,调用频次。
一个 AI 产品有没有从尝鲜变成日用?AI 搜索、AI 编程、AI 客服、AI 办公、AI 设计,真正重要的是用户是否高频回来。
第二,单位成本。
每次调用成本能不能下降?推理优化、模型蒸馏、缓存、批处理、专用推理芯片、低延迟网络,都会影响商业化。
第三,任务复杂度。
只是生成一句话,还是能完成多步任务?任务越复杂,推理次数越多,对基础设施要求越高。
第四,付费意愿。
企业是否愿意为推理结果付费?用户是否愿意为更快、更准、更长上下文、更高并发付费?如果没有付费意愿,再高调用量也可能只是成本黑洞。
这四个指标要一起看。
只有调用频次,没有付费,可能烧钱。
只有付费意愿,没有低成本,利润率会被吞掉。
只有任务复杂度,没有稳定性,企业不敢上线。
只有成本下降,没有真实场景,也只是技术进步,未必能转成投资回报。
05 ┃ 谁可能受益?不要只看最显眼的名字
推理算力扩张,最显眼的受益者当然是 GPU 和云厂商。
但如果只看这一层,容易把产业链看窄。
更完整的链条至少包括:
GPU / 加速卡:负责核心计算。
先进制程与封装:决定芯片供给和性能边界。
HBM、存储与高速互连:决定数据能不能喂得上。
光模块、交换机、网络设备:决定集群和数据中心之间能不能低延迟协作。
液冷、电力、UPS、配电:决定 AI 工厂能不能稳定运行。
推理框架、调度系统、缓存系统:决定同样的硬件能跑出多少有效吞吐。
企业工作流软件:决定算力有没有真实需求入口。
这里面最容易被忽略的是软件调度和推理优化。
训练时代,市场容易相信“堆更多卡”。
推理时代,问题会变成“同样的卡能不能服务更多用户、更多任务、更低延迟”。
这时,调度、缓存、模型路由、长上下文管理、边缘推理、混合云部署,都可能变成价值点。
这也是为什么 NVIDIA 在财报里提到 Dynamo 1.0 这类提升生成式和 Agentic 推理效率的软件。硬件公司也在越来越像系统公司。
06 ┃ 也要看到风险:推理需求不等于利润
推理算力是大趋势,但不能把大趋势直接翻译成确定收益。
这里至少有四个风险。
第一,价格下降可能很快。
如果推理模型越来越便宜,单位收入可能被压缩。对用户是好事,对部分供应商未必是好事。
第二,竞争会从硬件卷到系统。
算力、云、模型、应用、调度软件之间会互相挤利润。谁有定价权,还要看生态位置。
第三,企业落地慢于预期。
Agent 很火,但企业上线要过权限、合规、数据、责任边界。演示很快,采购很慢,这是常态。
第四,资本开支可能提前透支。
如果大家都按最高需求建 AI 数据中心,一旦应用收入跟不上,某些环节会出现供需错配。
所以,我不建议把“推理算力接棒训练算力”理解成所有算力公司都值得买。
更稳的理解是:观察 AI 产业链时,要从训练中心视角,扩展到高频推理、低成本服务和真实任务入口。
07 ┃ 普通投资者可以怎么跟踪
如果不做短线交易,只做中长期观察,可以建立一张简单清单。
看云厂商:AI 收入是否持续增长?资本开支有没有对应收入?毛利率有没有压力?
看芯片公司:数据中心收入、网络收入、推理软件生态、客户结构是否变化?
看应用公司:AI 功能是否真的提高留存、付费和客单价,而不是只增加成本?
看企业软件:Agent 是否进入真实流程,比如代码、客服、销售、财务、法务、研发,而不是停留在聊天框。
看基础设施二线环节:液冷、电力、光模块、存储、PCB、封装、调度软件有没有订单和利润兑现。
看风险:估值是否已经把三年后的乐观预期一次性打满。
投资最怕的是把技术趋势当成买入理由。
技术趋势只是起点。
真正该问的是:谁能把趋势变成收入,谁能把收入变成利润,谁能在竞争中保住利润。
投资观察要从“谁发布了模型”转向“谁在真实业务里持续消耗算力”。
投资观察要从“谁发布了模型”转向“谁在真实业务里持续消耗算力”。
08 ┃ 最后的判断
AI 产业的第一阶段,市场看训练。
谁有大模型,谁有 GPU,谁能把参数和榜单往上推,谁就有故事。
第二阶段,市场会越来越看推理。
谁能让 AI 每天被使用,谁能让每次使用成本下降,谁能让 Agent 进入真实工作流,谁能让推理变成稳定收入,谁才更接近长期价值。
这也是 AI 投资逻辑最需要更新的地方。
不要只看模型发布会。
要看调用量。
不要只看训练集群。
要看推理成本。
不要只看 GPU。
要看网络、存储、电力、液冷、调度和应用入口。
不要只看“AI 很强”。
要看“AI 有没有被高频、付费、可持续地使用”。
AI 推理算力正在接棒训练算力。
但它不是一句口号。
它是一张新的产业链观察表,也是一道更难的投资纪律题。
本文不构成任何投资建议。文中提到的公司、行业与数据仅用于产业观察。投资有风险,决策需基于个人风险承受能力和独立研究。
参考资料:
• NVIDIA FY2027 Q1 Financial Results:https://investor.nvidia.com/news/press-release-details/2026/NVIDIA-Announces-Financial-Results-for-First-Quarter-Fiscal-2027/default.aspx
• Google Search I/O 2026 updates:https://blog.google/products-and-platforms/products/search/search-io-2026/
• Google I/O 2026 announcements:https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/
• Anthropic acquires Stainless:https://www.anthropic.com/news/anthropic-acquires-stainless
夜雨聆风