AI推理算力正在接棒训练算力,投资逻辑要换一张表

AI推理算力正在接棒训练算力，投资逻辑要换一张表

过去两年，AI 投资最容易理解的一条线是训练算力。

谁要训更大的模型，谁就要买更多 GPU；谁有更多 GPU，谁就可能做出更强模型；谁能供 GPU、做先进制程、做封装、做光模块、做数据中心，谁就站在 AI 基建链条上。

这条逻辑仍然成立。

但它已经不够了。

最近几周的 AI 热点有一个共同变化：Google 把 AI Search 和 Agent 推到搜索、购物、开发者工具里；Anthropic 收购 Stainless 补 SDK 和 MCP 连接层；Qwen Code 这类编程 Agent 在做后台任务、并行探索和工具调用；NVIDIA 最新财报也把 Agentic AI、AI factories 和 Data Center 拆得更细。

这些事情放在一起，说明 AI 的重心正在从“训练出一个更强模型”，转向“让模型在真实世界里高频执行任务”。

前者主要消耗训练算力。

后者会持续消耗推理算力。

对投资者来说，这意味着观察表要换。

01 ┃ 训练算力是造发动机，推理算力是每天跑车

训练和推理，很多人容易混在一起。

简单说，训练是把模型造出来，推理是模型每次被调用时产生答案、执行任务、生成图片、写代码、做搜索、操作工具。

训练像造发动机。

推理像每天开车。

造发动机当然重要，但如果这辆车未来每天被数亿人开、每次开车还要导航、听音乐、自动驾驶、避障、和其他系统通信，那长期消耗更可怕的，可能不是造发动机那一次，而是后面每一天的使用。

AI 也是这样。

当 ChatGPT 只是少数人尝鲜时，推理成本还只是产品成本的一部分。

当 AI 搜索进入十亿级月活，当 Agent 开始替企业写代码、查资料、整理合同、生成报告、操作 SaaS，当手机、PC、汽车、机器人都开始本地或云端调用模型，推理算力就变成一条持续消耗的基础设施。

所以今天看 AI 投资，不能只问“谁又训练了一个大模型”。

更要问：

谁的模型被高频调用？

调用发生在哪些场景？

每次调用的成本能不能下降？

下降以后，会不会反过来刺激更多使用？

这才是推理算力的飞轮。

训练算力决定模型上限，推理算力决定 AI 能不能被高频使用。

训练算力决定模型上限，推理算力决定 AI 能不能被高频使用。

02 ┃ NVIDIA 财报里最值得看的，不只是收入新高

NVIDIA 5 月 20 日发布的 FY2027 Q1 财报很夸张：季度收入 816 亿美元，同比增 85%；Data Center 收入 752 亿美元，同比增 92%。

这些数字已经足够亮眼。

但对 AI 投资观察来说，更关键的是它怎么重新描述自己的业务。

NVIDIA 提到，未来会用 Data Center 和 Edge Computing 两大平台来反映增长驱动，并在 Data Center 里拆出 Hyperscale 和 ACIE。ACIE 包括 AI Clouds、Industrial、Enterprise 等更分散的 AI 工厂需求。

这说明什么？

AI 基建不再只是超大云厂商训练大模型。

它正在进入更多行业、更多企业、更多国家级或区域级数据中心。换句话说，AI 算力的需求来源正在从“少数大模型训练项目”，扩散到“更多行业的持续推理与执行”。

还有一个数据也值得看：在旧口径下，Data Center compute 收入 604 亿美元，networking 收入 148 亿美元，后者同比增 199%。

为什么网络增长这么快？

因为 AI 不只是买芯片。大规模推理、Agent 工作流、多模态生成、分布式存储、跨节点通信，都要求更强的数据中心网络。

投资者如果只盯 GPU，容易漏掉后面的链条：网络、光模块、交换机、存储、液冷、电力、调度软件、推理优化框架。

推理算力时代，卖铲人的队伍会变长。

03 ┃ AI 搜索和 Agent，会把推理调用频次推高

Google Search I/O 2026 里披露，AI Mode 已经超过 10 亿月活，查询量按季度翻倍。

这个信号非常重要。

传统搜索的成本结构和 AI 搜索不一样。传统搜索主要是索引、排序、广告匹配。AI 搜索需要生成答案、做多步推理、引用来源，未来还可能调用购物、日历、地图、邮件、表格、第三方工具。

如果一个用户一天搜 20 次，其中越来越多变成 AI Mode，每一次都要模型参与，推理消耗就会变成搜索商业化的核心变量。

Agent 更是如此。

一个普通问答可能只调用一次模型。

一个 Agent 任务可能要拆成十几步：理解目标、查资料、调用工具、读取文件、生成计划、执行动作、检查结果、重试、总结。

如果它还要操作浏览器、写代码、跑测试、生成图片、整理表格，背后的模型调用次数会继续增加。

所以，推理算力不是一个抽象概念。

它会直接出现在产品体验里：

响应慢不慢？

能不能低成本多试几次？

能不能给普通用户开放更长上下文？

能不能支撑企业员工每天用？

能不能让 Agent 跑一小时而不是五分钟？

当 AI 产品从“偶尔问一下”变成“工作流常驻”，推理算力就会从成本项变成产品能力的一部分。

推理侧扩张会把压力传导到 GPU、网络、存储、电力、液冷和调度软件。

推理侧扩张会把压力传导到 GPU、网络、存储、电力、液冷和调度软件。

04 ┃ 推理侧的投资观察，要看四个指标

如果把推理算力作为主线，投资观察不能只看热度。

我会看四个指标。

第一，调用频次。

一个 AI 产品有没有从尝鲜变成日用？AI 搜索、AI 编程、AI 客服、AI 办公、AI 设计，真正重要的是用户是否高频回来。

第二，单位成本。

每次调用成本能不能下降？推理优化、模型蒸馏、缓存、批处理、专用推理芯片、低延迟网络，都会影响商业化。

第三，任务复杂度。

只是生成一句话，还是能完成多步任务？任务越复杂，推理次数越多，对基础设施要求越高。

第四，付费意愿。

企业是否愿意为推理结果付费？用户是否愿意为更快、更准、更长上下文、更高并发付费？如果没有付费意愿，再高调用量也可能只是成本黑洞。

这四个指标要一起看。

只有调用频次，没有付费，可能烧钱。

只有付费意愿，没有低成本，利润率会被吞掉。

只有任务复杂度，没有稳定性，企业不敢上线。

只有成本下降，没有真实场景，也只是技术进步，未必能转成投资回报。

05 ┃ 谁可能受益？不要只看最显眼的名字

推理算力扩张，最显眼的受益者当然是 GPU 和云厂商。

但如果只看这一层，容易把产业链看窄。

更完整的链条至少包括：

GPU / 加速卡：负责核心计算。

先进制程与封装：决定芯片供给和性能边界。

HBM、存储与高速互连：决定数据能不能喂得上。

光模块、交换机、网络设备：决定集群和数据中心之间能不能低延迟协作。

液冷、电力、UPS、配电：决定 AI 工厂能不能稳定运行。

推理框架、调度系统、缓存系统：决定同样的硬件能跑出多少有效吞吐。

企业工作流软件：决定算力有没有真实需求入口。

这里面最容易被忽略的是软件调度和推理优化。

训练时代，市场容易相信“堆更多卡”。

推理时代，问题会变成“同样的卡能不能服务更多用户、更多任务、更低延迟”。

这时，调度、缓存、模型路由、长上下文管理、边缘推理、混合云部署，都可能变成价值点。

这也是为什么 NVIDIA 在财报里提到 Dynamo 1.0 这类提升生成式和 Agentic 推理效率的软件。硬件公司也在越来越像系统公司。

06 ┃ 也要看到风险：推理需求不等于利润

推理算力是大趋势，但不能把大趋势直接翻译成确定收益。

这里至少有四个风险。

第一，价格下降可能很快。

如果推理模型越来越便宜，单位收入可能被压缩。对用户是好事，对部分供应商未必是好事。

第二，竞争会从硬件卷到系统。

算力、云、模型、应用、调度软件之间会互相挤利润。谁有定价权，还要看生态位置。

第三，企业落地慢于预期。

Agent 很火，但企业上线要过权限、合规、数据、责任边界。演示很快，采购很慢，这是常态。

第四，资本开支可能提前透支。

如果大家都按最高需求建 AI 数据中心，一旦应用收入跟不上，某些环节会出现供需错配。

所以，我不建议把“推理算力接棒训练算力”理解成所有算力公司都值得买。

更稳的理解是：观察 AI 产业链时，要从训练中心视角，扩展到高频推理、低成本服务和真实任务入口。

07 ┃ 普通投资者可以怎么跟踪

如果不做短线交易，只做中长期观察，可以建立一张简单清单。

看云厂商：AI 收入是否持续增长？资本开支有没有对应收入？毛利率有没有压力？

看芯片公司：数据中心收入、网络收入、推理软件生态、客户结构是否变化？

看应用公司：AI 功能是否真的提高留存、付费和客单价，而不是只增加成本？

看企业软件：Agent 是否进入真实流程，比如代码、客服、销售、财务、法务、研发，而不是停留在聊天框。

看基础设施二线环节：液冷、电力、光模块、存储、PCB、封装、调度软件有没有订单和利润兑现。

看风险：估值是否已经把三年后的乐观预期一次性打满。

投资最怕的是把技术趋势当成买入理由。

技术趋势只是起点。

真正该问的是：谁能把趋势变成收入，谁能把收入变成利润，谁能在竞争中保住利润。

投资观察要从“谁发布了模型”转向“谁在真实业务里持续消耗算力”。

投资观察要从“谁发布了模型”转向“谁在真实业务里持续消耗算力”。

08 ┃ 最后的判断

AI 产业的第一阶段，市场看训练。

谁有大模型，谁有 GPU，谁能把参数和榜单往上推，谁就有故事。

第二阶段，市场会越来越看推理。

谁能让 AI 每天被使用，谁能让每次使用成本下降，谁能让 Agent 进入真实工作流，谁能让推理变成稳定收入，谁才更接近长期价值。

这也是 AI 投资逻辑最需要更新的地方。

不要只看模型发布会。

要看调用量。

不要只看训练集群。

要看推理成本。

不要只看 GPU。

要看网络、存储、电力、液冷、调度和应用入口。

不要只看“AI 很强”。

要看“AI 有没有被高频、付费、可持续地使用”。

AI 推理算力正在接棒训练算力。

但它不是一句口号。

它是一张新的产业链观察表，也是一道更难的投资纪律题。

本文不构成任何投资建议。文中提到的公司、行业与数据仅用于产业观察。投资有风险，决策需基于个人风险承受能力和独立研究。

参考资料：

• NVIDIA FY2027 Q1 Financial Results：https://investor.nvidia.com/news/press-release-details/2026/NVIDIA-Announces-Financial-Results-for-First-Quarter-Fiscal-2027/default.aspx

• Google Search I/O 2026 updates：https://blog.google/products-and-platforms/products/search/search-io-2026/

• Google I/O 2026 announcements：https://blog.google/innovation-and-ai/technology/ai/google-io-2026-all-our-announcements/

• Anthropic acquires Stainless：https://www.anthropic.com/news/anthropic-acquires-stainless