
一、背景:什么是“全量推理时代”
2026年4月11日,百度副总裁石清华在智能电动汽车发展高层论坛上抛出一个核心判断:AI算力的重心正在完成从训练侧到推理侧的历史性迁移。
这句话意味着什么?
过去几年的主旋律:训练
2022-2025年,AI行业的主战场是大模型训练。所有人都在卷:
更大的参数规模 更多的训练数据 更强的预训练能力
这场竞赛的门槛极高——千亿参数模型的训练需要上万张GPU卡,只有大厂和顶级独角兽才能参与。
现在转折点来了:推理
石清华给出了几个关键数据:
- 2026年,推理带来的算力增量占比已达三分之二,未来将突破80%
- 到2028年,汽车领域推理算力占总算力需求的比例将升至73%
- 2023年这一数字仅为约三分之一
也就是说,推理需求正在爆发式增长,而训练的增长正在放缓。
二、趋势分析:为什么推理时代来了
1. 三大推力正在加速这一转变
推力一:企业内部智能化
企业的AI应用正在从“试点”走向“全量部署”。过去AI只在特定场景使用,现在研发、制造、营销全链条都在用AI。这意味着:
- 推理请求量暴增
:每个员工的每个工作环节都可能产生AI推理请求 - 使用频次提高
:从“偶尔用”变成“天天用” - 响应速度要求更高
:实时交互场景越来越多
推力二:氛围编程(Vibe Coding)成为主流
2026年,用自然语言描述需求、AI自动生成代码已成为主流开发方式。开发方式的变革带来:
- 代码生成推理需求爆发
:每次代码补全、每次代码审查都是推理 - 开发门槛大幅降低
:更多非程序员进入AI开发领域 - 推理调用频次提升
:开发过程中的“人机对话”频次远超传统开发
推力三:智能座舱成为推理前沿阵地
智能座舱是离用户最近的AI场景:
实时生成的个性化交互界面 多模态感知与推理 语音助手、导航推荐、娱乐内容生成
这些场景的共同特点是:必须实时响应,不能等。
2. 数据印证趋势
石清华还透露了一组数据:
- 2026年4月初,全球AI大模型总调用量达27万亿Token,环比增长18.9%
- 其中中国AI大模型周调用量达12.96万亿Token,环比增幅超30%
30%的周环比增长意味着什么?按照这个速度,一个月后调用量就会翻倍。
三、核心洞察:这是一个商业模式的根本转变
石清华提到了一个行业悖论,特别值得深思:
座舱AI推理的费用会随用户使用量持续走高——按照传统固定成本逻辑,就会陷入“功能越受欢迎、企业亏损越多”的尴尬处境。
这个悖论揭示了一个根本问题:
传统模式:硬件思维
传统车企的逻辑是硬件BOM成本:
零部件成本固定 装车后没有额外费用 销量越大,成本摊薄越多
AI时代:订阅思维
AI推理的成本结构完全不同:
- 每次推理都要付费
- 使用量越多,成本越高
- 如果继续收“一次性费用”,功能越受欢迎企业越亏
这意味着什么?
企业必须转变认知,将算力视为支撑用户体验和业务流的核心生产资源,通过产品服务升级和商业模式创新,让用户为“智能价值”付费。
这不是车企的问题,这是所有AI产品的共同挑战。
四、对创业者的启示:推理时代的创业机会
机会一:推理优化服务
痛点:推理成本高、延迟大、效率低
机会:
模型压缩与加速 边缘推理部署 推理引擎优化 国产算力适配
案例参考:本期早报中提到的阿里云平头哥“真武”PPU、百度昆仑芯M100都在做推理芯片的国产替代,这说明推理硬件层面存在明确的商业机会。
机会二:端侧AI应用
痛点:隐私顾虑、网络依赖、云端成本
机会:
本地化AI助手 离线场景AI应用 端侧推理框架 端云协同方案
案例参考:本期早报中联想推出的AI主机新品类,瞄准“超级个体”,支持本地计算与云端推理并行,这正是端侧AI需求的体现。
机会三:AI应用层(推理层的SaaS)
痛点:企业不知道怎么用AI、不知道怎么省钱用AI
机会:
行业垂直AI应用 AI工作流自动化 推理用量管理与计费 AI效能分析与优化
关键转变:从“卖AI能力”转向“帮用户更好地使用AI能力”。推理时代的成功者不是让用户用更多AI,而是让用户用得更值。
机会四:商业模式创新
痛点:传统订阅制无法覆盖AI推理的边际成本
机会:
用量计费模式 效果付费模式 AI价值分成模式 混合订阅+用量模式
核心思路:找到一种让“用户用得越多、企业赚得越多”的商业模式,而不是陷入“越受欢迎越亏”的陷阱。
五、行动建议
对于AI创业者
立即行动:
- 评估你的产品结构
:训练占比多少?推理占比多少?推理成本占收入比例是多少? - 测试用量计费
:在你的产品中实验基于推理用量的计费模式 - 寻找推理优化点
:有没有可能通过模型压缩、缓存等方式降低推理成本?
中期规划:
- 建立推理能力壁垒
:推理优化能力将成为AI公司的核心竞争力 - 布局端侧场景
:端侧推理是下一个大趋势,提前卡位 - 设计新型商业模式
:超越“订阅制”,探索“效果付费”等新模式
对于企业决策者
立即行动:
- 盘点AI推理成本
:你们的AI应用每月推理成本是多少?增长趋势如何? - 评估国产替代
:百度、地平线等国产芯片是否已经可以满足需求? - 建立AI治理机制
:如何让AI投入产出可衡量?
中期规划:
- 搭建AI中台
:统一管理推理资源,避免重复投入 - 培养AI产品思维
:从“AI能做什么”到“AI怎么帮用户省钱/赚钱” - 探索新商业模式
:让用户为AI价值付费,而不是为AI工具付费
六、总结
百度石清华提出的“全量推理时代”,不只是一个技术趋势判断,更是一个商业信号:
- 训练时代的机会窗口正在关闭
,通用大模型的竞争格局已基本成型 - 推理时代的序幕刚刚拉开
,应用层、工具层、商业模式层都有大量机会 - 核心竞争要素正在转移
,从“模型能力”转向“推理效率”和“商业模式”
对于创业者来说,这可能是继“移动互联网之后最大的机会窗口”——不是因为AI更热了,而是因为AI正在从“技术竞赛”转向“商业落地”。
行动窗口期:现在到2028年。
今日早餐送到,如果您还想获取哪方面信息,可以留言给我!

END

来都来了,点个在看再走吧~~~

夜雨聆风