AI推理产业链深度推演:从芯片到平台,从估值到终局

一、价格战的终局

事件

2026年5月22日，DeepSeek宣布V4-Pro的2.5折限时优惠到期后不再恢复原价，永久定为原价的1/4。

核心判断

这不是"促销延续"，而是定价策略的质变。DeepSeek确认了"这个价格我扛得住，而且不打算回头"。

工程支撑： - V4单Token推理算力消耗降至V3.2的27% - KV cache显存占用仅为原来的10% - 1.6万亿参数的Pro模型，输出价6元/百万Tokens，与上一代V3.2持平

行业分化：同一时间线上，豆包开启收费、智谱部分产品涨价超400%、腾讯云AI算力上调5%——能扛住低价的玩家往下压，扛不住的往回撤。

与竞争对手的价格差： - DeepSeek Pro输出价：$0.87/百万Tokens - 智谱GLM-5.1：$4.4/百万Tokens（5倍） - Kimi K2.6：$4.0/百万Tokens（4.6倍） - 西方对手：1/32

深层驱动

融资弹药
：传融500亿元人民币，腾讯和阿里在接触，估值或超200亿美元
开源生态护城河
：低价+开源=开发者锁定，OpenRouter上V4调用量在降价后创新高
竞争绞杀
：永久低价把竞争对手逼到墙角，跟价亏损，不跟价流失客户
国产算力适配
：预计下半年昇腾950超节点批量上市后，Pro价格还会再降

关键信号：大模型行业从"卷能力"进入"卷成本"阶段。谁先跑通国产算力适配，谁就有持续降本的空间。

二、算力基座

昇腾950系列：两颗芯片，两种场景


维度	950PR（Q1 2026已上市）	950DT（Q4 2026）
定位	推理Prefill + 推荐业务	推理Decode + 训练
自研HBM	HiBL 1.0（128GB，1.6TB/s，低成本）	HiZQ 2.0（144GB，4TB/s，高性能）
FP8算力	1 PFLOPS	1 PFLOPS
FP4算力	2 PFLOPS	2 PFLOPS
互联带宽	2TB/s（比910C提升2.5倍）	2TB/s
产品形态	Atlas 350加速卡	液冷超节点 + 风冷850E

DeepSeek V4在950上的实测性能

V4-Pro 单卡Decode吞吐：约4700 TPS（8K输入）
V4-Flash 单卡Decode吞吐：约1600 TPS
Pro时延约20ms，Flash约10ms
1024卡超节点总算力：FP8下 1 EFLOPS

三年路线图


芯片	时间	FP8	FP4	互联	关键增量
950PR	2026 Q1	1P	2P	2TB/s	新增FP8/MXFP8/HiF8
950DT	2026 Q4	1P	2P	2TB/s	高带宽内存解锁Decode+训练
960	2027 Q4	2P	4P	翻倍	新增HiF4（华为自研4bit）
970	2028 Q4	4P	8P	4TB/s	全面翻倍

超节点规模演进： - 950（2026 Q4）：1024卡首商用，1 EFLOPS - 960（2027 Q4）：15488卡，30 EFLOPS，训练性能比950提升3倍 - 960 SuperCluster（2027 Q4）：百万卡集群，FP8下2 ZFLOPS

关键判断：从950到960到970，算力一年翻倍。如果DeepSeek持续跟进适配，API价格不是"降一次"，而是每年都有再降的空间。

三、超节点

六大技术节点

超节点远不是"把卡插上去就行"，本质上是一个系统工程：

1. 全对等互联架构（最核心） - 打破冯诺依曼架构，所有NPU、CPU、内存处于同等地位 - 华为自研统一总线协议，从芯片到机柜到跨机柜一以贯之 - ScaleUp层：384卡全互联，卡间带宽2.8T，纳秒级时延 - 任正非比喻：西方是"百衲衣"（不同协议打补丁），华为是统一协议

2. 光通信互联 - 384卡超节点用了3,168根光纤 + 6,912个400G光模块 - 全光交换（OCS）：用MEMS微镜芯片做光路切换，省电信号转换

3. 弹性内存存储（EMS） - 内存池化，算力和显存解绑 - 首Token时延最高降80%，部分场景吞吐提升100%

4. 液冷散热 - 冷板式液冷为主方案，384超节点功耗是英伟达NVL72的4.1倍 - 中国路线：用功耗换性能

5. 智能运维 - "1-3-10"标准：1分钟感知、3分钟定界、10分钟恢复 - 故障感知率从40%提升至90%

6. 朝推夜训调度 - 白天推理、晚上训练，算力利用率提升30%+

供应链全景


层级	环节	核心供应商
芯片层	代工	中芯国际
	封装基板	兴森科技（份额70%）
	先进封装	长电科技、通富微电
互联层	PCIe交换芯片	万通发展
	MEMS-OCS芯片	赛微电子
	光模块	华工科技（份额40-50%）、光迅科技
	高速连接器	华丰科技
整机层	服务器	华鲲振宇（出货量28%）、拓维信息
	总经销	神州数码
液冷层	系统集成	申菱环境（份额≈50%）
	冷板+CDU	川润股份

关键判断：光模块是弹性最大的环节，液冷是确定性增量（每套超节点液冷价值量是传统服务器的5-10倍），OCS全光交换是950新增的技术变量。

四、光通信与光计算

核心矛盾

光"传"天下无敌，光"算"有三道坎。


维度	电子	光子
传播速度	光速的千分之一	光速
传输能耗	因电阻产热，高	几乎无损耗
相互作用	强（互相控制）	弱（无法"开关"另一束光）
存储	容易	极难（纳秒级保留）
逻辑运算	天然适配	困难

三大根本瓶颈

瓶颈1：光无法存储。 光子停不下来，保留时间纳秒级。光计算天生适合推理（一次算完输出），不适合训练（需要反复更新权重）。

瓶颈2：光子之间不"说话"。 无法做逻辑控制。传统光子芯片在做非线性运算时必须转回电信号（OEO），这种反复转换把速度优势消耗殆尽。

瓶颈3：集成规模撑不起来。 光元器件尺寸远大于晶体管，且对相位误差极度敏感。

正在发生的突破


路线	代表	突破
全光计算	上海交大LightGen（2026.2，Science）	百万级光子神经元，端到端全光生成，速度能效比A100高2个数量级
激子-极化子	宾夕法尼亚大学（2026.5，PRL）	混合光物质粒子，首次实现全光信号切换，单次能耗仅4飞焦耳
光电融合	每刻深思、曦智科技、Lightmatter	光做线性运算+电做非线性控制，最务实路线

关键判断：光计算不会取代电子计算，而是形成"光传输+光加速+电控制"的混合架构。三步走：光的连结（现在）→ 光的运算（5-10年）→ 光的量子（10年+）。

五、光电融合推理加速器

2028年商用假设


指标	当前GPU（2026）	光电融合加速器（2028预期）	提升
系统能效	基准1x	100x+	两个数量级
单位推理成本	基准1x	1/10	—
延迟	毫秒级	纳秒级	1000x
HBM依赖	高	低（参数固化在超表面）	—
制程要求	3-5nm	22nm CMOS可用	降维打击

对六类玩家的冲击


玩家	影响
模型厂商	利大于弊。推理成本再降，利润空间增大。但当Token趋近零，"按Token计费"的商业模式可能瓦解
GPU厂商	结构性冲击。推理专用卡市场被分流，但训练卡短期不受影响
数据中心	成本结构重构。从"电力密集型"转向"通信密集型"
光计算公司	从"概念股"变"业绩股"
云服务商	基础设施范式转换，2029+可能自研光电融合芯片
AI应用层	最大受益者。Token成本降10倍，以前不经济的场景全部激活

Token价格推演


时间	GPT-4级推理成本/百万Token	驱动因素
2022底	$20	GPT-4首发
2026初	$0.40	四因素复合，1000x下降
2027	$0.10	Blackwell/Rubin + MoE
2028	$0.01–0.02	光电融合加速器商用
2029+	<$0.005	规模化+良率提升

核心影响不是"让AI更快"，而是"重新定义算力的成本函数"——当推理成本再降一个数量级，AI从"工具"变成"环境"。

六、Token消耗的S曲线

现状：指数爆炸


时间	中国日均Token调用量	倍数
2024年初	1,000亿	基准
2025年底	100万亿	1,000x （两年）
2026年3月	140万亿	再+40%（3个月）
豆包一家	120万亿/日	单产品驱动

机构预测


年份	全球（万亿/年）	增速	中国（万亿/年）	增速
2026	65,000–72,000	+900-1,000%	12,000–14,000	+1,100-1,300%
2027	280,000–320,000	+330-350%	50,000–58,000	+320-380%
2030	—	—	~3,900,000（摩根系）	5年370x

三个引擎、三个拐点

Token增长由三个发动机驱动，各有其拐点：

引擎1：用户渗透 - 2026 Q1：~4.4亿AI月活（中国），覆盖40%网民 - 拐点：约2028-2029年，渗透率达80%+，增速从指数转对数

引擎2：使用深度 - 从"偶尔问问"到"事事都用"，单用户Token消耗从3万/日→100万+/日 - 拐点：约2030-2032年，最能用AI的场景都用上了，边际效用递减

引擎3：机器自治 - AI调用AI，7×24运行，无需人在场 - 拐点：约2032-2035年，由"有多少事情值得用AI推理"决定

天花板测算


因子	上限逻辑	量级估算
替代人工认知	全球脑力劳动者的总认知量	约1,800万万亿tokens/年
填补"没人做但值得想"的任务	Token成本 vs 任务价值	替代因子的3-5倍
并行冗余/迭代	边际收益递减	替代因子的2-3倍

合成天花板：替代因子的6-9倍 ≈ 1万-1.6万万亿tokens/年。当前约7万万亿/年，有150-200倍空间。

互联网参照系


互联网流量	Token消耗	共同驱动力
1992-2000：拨号→宽带，58% CAGR	2023-2025：用户从0到4.4亿	基础设施就绪
2005-2012：流媒体爆发	2025-2027：Agent+多模态爆发	杀手应用出现
2013-2017：4G+短视频	2027-2029：端侧AI+实时AI	设备/场景迁移
2018-2023：CAGR降至20-30%	2030+：增速放缓	S曲线顶部

关键区别：互联网流量的S曲线清晰（用户×人均消耗有上限），Token的S曲线更模糊——机器自治场景的上限难以预测。

七、平台之争

分析框架

Token消耗量 = 用户规模 × 人均调用频次 × 单次调用Token数

当前格局（2026 Q1）


产品	月活	类型	关键数据
微信	14.32亿	超级App	ClawBot上线，小程序AI化推进中
豆包	3.45亿	AI原生App	日均120万亿tokens
千问（全端）	3亿+	AI原生App	同比暴涨42倍，深度打通阿里生态
元宝	1.14亿	AI原生App	已能总结微信聊天记录
DeepSeek	1.27亿	AI原生App	OpenRouter调用量暴增
IMA	1,300万	AI知识库工作台	4.2亿知识库文件

场景差异：Token消耗量级


场景	单次Token消耗	对比
简单问答	100–500	基准 1x
长文档总结	5,000–20,000	40x
知识库RAG	10,000–50,000	100x
Agent多步任务	50,000–500,000	1,000x
企业工作流自动化	100,000–1,000,000	2,000x

一个IMA用户每天处理10份长文档+跑Agent工作流，Token消耗可能是一个豆包闲聊用户的50-100倍。

终局判断：微信+IMA协同体

推演路径：

现在：微信14亿用户中 <5% 深度使用AI     ↓ 2027：ClawBot/小程序AI化，渗透率→15-20%     ↓  （3亿人 × 日均10次调用 = 30亿次/日） 2028：IMA知识库能力深度嵌入微信生态     ↓  （办公人群的Agent工作流自动运行） 2029+：微信成为AI调用的"操作系统"     ↓ 终局：微信生态贡献全中国30-40%的Token消耗

第二极：阿里千问+钉钉+淘宝——优势在交易场景的AI化。

豆包虽然月活最高（3.45亿），但场景偏C端娱乐，单次Token消耗低，且已开始收费压制增长。Token总量可能大，但增速和结构不如微信生态。

价值上移规律

成本趋近于零     ↓ 模型商品化（谁便宜用谁）     ↓ 价值向平台层集中     ↓ 平台竞争的核心变成：谁拥有用户关系、数据、生态     ↓ 互联网巨头的AI版图重新划分

4G时代，带宽便宜了，赚钱的不是华为中兴（基础设施），而是微信抖音（平台）。AI时代同理：Token便宜了，赚钱的是让用户消耗最多Token的平台。

八、估值框架

六巨头当前估值（2026年5月）


公司	估值	关键数据
Anthropic	$9,000亿	年化营收~$450亿，已准备IPO
OpenAI	$8,520亿	刚融$1,220亿，年算力投入$500亿
xAI	$2,300亿	E轮$200亿，X平台月活6亿
智谱	~$640亿	港股上市，年营收7.24亿RMB
DeepSeek	~$450-515亿	首轮融资$500亿RMB
Kimi	~$200亿	D轮$20亿

DCF框架参数

全球Token天花板：~1.5万万亿tokens/年（2035-2040到达） 平均推理单价：$0.50/百万tokens（远期混价） AI总TAM：$2-3.5万亿/年（2035） Top 6市占率：67% 六家总营收：$2万亿/年（中值） 净利率：12%（10-15%中值） 六家总利润：$240亿/年 终端P/E：15x 六家终端总市值：$3.6万亿 折回2026（15%，9年）：$1.02万亿

终局份额与合理现值


公司	营收份额	净利率	终端市值	2026合理现值	当前估值	偏离
OpenAI	20%	14%	$1,140B	$240-400B	$852B	贵2-3.5x
Anthropic	16%	12%	$690B	$150-250B	$900B	贵3.5-6x
xAI	12%	13%	$560B	$110-200B	$230B	偏贵
DeepSeek	13%	10%	$436B	$90-170B	$50B	低估
智谱	9%	13%	$390B	$70-140B	$64B	合理偏低
Kimi	6%	10%	$173B	$30-65B	$20B	低估

场景分析：OpenAI的$852B需要什么条件？


场景	概率	OpenAI合理现值
赢家通吃（1家吃掉60%利润）	10%	$600-800B
双寡头（2家分60%利润）	20%	$300-450B
寡头竞争（5-6家分70%利润）	50%	$200-320B
百家争鸣	20%	$100-180B

概率加权合理值：$240-370B。$852B需要五个假设全部成立，联合概率不到5%。

中美估值差距：四个折价因素

17倍的估值差距（DeepSeek $50B vs OpenAI $852B），四个折价因素：

市场割裂
：中国模型主要服务中国（全球TAM的20%）
资本成本
：国内折现率更高
平台属性差异
：OpenAI有ChatGPT，DeepSeek在建设
叙事差价
：美元资本市场对AI的溢价远高于人民币/HKD

剔除不合理的折价，中美公司合理估值差距应在3-5倍，而非17倍。

九、赢家通吃

赢家通吃的必要条件


条件	苹果	AI模型公司
强网络效应	✅	⚠️ 弱（更多用户≠模型显著变好）
高转换成本	✅✅（iMessage/iCloud/App/硬件）	❌（API密钥一换即可，零迁移成本）
边际成本趋零	✅	✅（但被开源瓦解）
独特硬件体验	✅	❌（没有硬件层）
封闭生态系统	✅	❌（无法"封闭"API）
政治保护	✅（华为被制裁）	❌（不可能每家公司都有这种运气）

科技史检验

互联网没有真正意义上的全球赢家通吃： - 搜索：Google（全球）vs Baidu（中国）vs Naver（韩国）→ 地理分割 - 社交：Meta（美欧）vs 微信（中国）vs Line（日本）→ 地理分割 - 电商：Amazon（美国38%）vs 阿里（中国）vs Shopee（东南亚）→ 地理分割 - 出行：Uber、DiDi、Grab、Ola → 各自为王

苹果是特例，不可复刻的理由： - 硬件+系统+App Store+iCloud+品牌+政治运气的六重护城河 - AI模型公司一个都不占 - 而且：连苹果都差点被华为追上，靠政治打压才稳住江山

AI的自然状态

AI行业的自然状态就是寡头竞争。赢家通吃在理论上就不成立。

DeepSeek通过开源+极致低价，正在加速瓦解"赢家通吃"的可能性——它不是在割自己的肉，是在拆别人的台。

十、关键推论

1. 价格战不可逆

DeepSeek的永久降价不是促销，是定价范式转变。当光电融合加速器2028年商用+昇腾960/970连续迭代，成本还没到底。

2. 算力主权化加速

昇腾三年路线图（950→960→970）的"一年一代翻倍"节奏，意味着中国AI算力从"能不能用"进入"够不够便宜"的新阶段。国产HBM（HiBL/HiZQ）是关键变量。

3. Token拐点尚未到来

用户渗透+Agent驱动，至少还有3年高速增长。第一个拐点约在2028-2029年（渗透率见顶），第二个约在2030-2032年（使用深度边际递减）。

4. 价值从模型层向平台层转移

当Token趋近零成本，模型变成自来水，平台层才是利润高地。微信生态（微信+IMA+元宝+ClawBot）是最有可能统治中国Token消耗的协同体。

5. 美国AI估值隐含"赢家通吃"假设——站不住脚

OpenAI $852B和Anthropic $900B的估值，定价的是"唯一的公司"而非"好公司"。寡头竞争（5-6家分70%利润，本报告基准场景）下，这两家合理值在$150-400B区间。

6. 中国AI公司被结构性低估

DeepSeek $50B × 合理值$90-170B → 有80-240%空间。叙事差价终将收窄。

7. 行业终局：寡头竞争 + 平台收税

模型层5-6家寡头瓜分全球50-70%份额，利润薄（10-15%净利率），平台层赚取超额利润。谁能同时拥有"最强的模型"和"最深的用户入口"，谁就是终局赢家。

待观察变量


变量	确定性	影响
昇腾960/970能否如期交付	中	决定DeepSeek价格能否继续下探
光电融合加速器能否2028年商用	中低	推理成本再降一个数量级的关键
微信AI化渗透率	中	决定中国Token消耗的最大变量
DeepSeek能否建成平台生态	低	决定其估值能否从"API公司"升级为"平台型公司"
中美AI监管政策的走向	低	可能重塑地理分割的边界
OpenAI IPO定价	中	如果定价在$400B以下，将直接证伪当前$852B估值

本文档基于2026年5月23日的一次与腾讯ima copilot （deepseek v4 pro)的深度战略对话整理。所有估值均为基于公开信息的推演框架，不构成投资建议。核心观点：AI产业的终局是寡头竞争，而非赢家通吃——这一判断对整个投资定价体系具有根本性的重置意义。