一、价格战的终局
事件
2026年5月22日,DeepSeek宣布V4-Pro的2.5折限时优惠到期后不再恢复原价,永久定为原价的1/4。
核心判断
这不是"促销延续",而是定价策略的质变。DeepSeek确认了"这个价格我扛得住,而且不打算回头"。
工程支撑: - V4单Token推理算力消耗降至V3.2的27% - KV cache显存占用仅为原来的10% - 1.6万亿参数的Pro模型,输出价6元/百万Tokens,与上一代V3.2持平
行业分化:同一时间线上,豆包开启收费、智谱部分产品涨价超400%、腾讯云AI算力上调5%——能扛住低价的玩家往下压,扛不住的往回撤。
与竞争对手的价格差: - DeepSeek Pro输出价:$0.87/百万Tokens - 智谱GLM-5.1:$4.4/百万Tokens(5倍) - Kimi K2.6:$4.0/百万Tokens(4.6倍) - 西方对手:1/32
深层驱动
- 融资弹药
:传融500亿元人民币,腾讯和阿里在接触,估值或超200亿美元 - 开源生态护城河
:低价+开源=开发者锁定,OpenRouter上V4调用量在降价后创新高 - 竞争绞杀
:永久低价把竞争对手逼到墙角,跟价亏损,不跟价流失客户 - 国产算力适配
:预计下半年昇腾950超节点批量上市后,Pro价格还会再降
关键信号:大模型行业从"卷能力"进入"卷成本"阶段。谁先跑通国产算力适配,谁就有持续降本的空间。
二、算力基座
昇腾950系列:两颗芯片,两种场景
DeepSeek V4在950上的实测性能
V4-Pro 单卡Decode吞吐:约4700 TPS(8K输入) V4-Flash 单卡Decode吞吐:约1600 TPS Pro时延约20ms,Flash约10ms 1024卡超节点总算力:FP8下 1 EFLOPS
三年路线图
| 960 | 2P | 4P | |||
| 970 | 4P | 8P |
超节点规模演进: - 950(2026 Q4):1024卡首商用,1 EFLOPS - 960(2027 Q4):15488卡,30 EFLOPS,训练性能比950提升3倍 - 960 SuperCluster(2027 Q4):百万卡集群,FP8下2 ZFLOPS
关键判断:从950到960到970,算力一年翻倍。如果DeepSeek持续跟进适配,API价格不是"降一次",而是每年都有再降的空间。
三、超节点
六大技术节点
超节点远不是"把卡插上去就行",本质上是一个系统工程:
1. 全对等互联架构(最核心) - 打破冯诺依曼架构,所有NPU、CPU、内存处于同等地位 - 华为自研统一总线协议,从芯片到机柜到跨机柜一以贯之 - ScaleUp层:384卡全互联,卡间带宽2.8T,纳秒级时延 - 任正非比喻:西方是"百衲衣"(不同协议打补丁),华为是统一协议
2. 光通信互联 - 384卡超节点用了3,168根光纤 + 6,912个400G光模块 - 全光交换(OCS):用MEMS微镜芯片做光路切换,省电信号转换
3. 弹性内存存储(EMS) - 内存池化,算力和显存解绑 - 首Token时延最高降80%,部分场景吞吐提升100%
4. 液冷散热 - 冷板式液冷为主方案,384超节点功耗是英伟达NVL72的4.1倍 - 中国路线:用功耗换性能
5. 智能运维 - "1-3-10"标准:1分钟感知、3分钟定界、10分钟恢复 - 故障感知率从40%提升至90%
6. 朝推夜训调度 - 白天推理、晚上训练,算力利用率提升30%+
供应链全景
关键判断:光模块是弹性最大的环节,液冷是确定性增量(每套超节点液冷价值量是传统服务器的5-10倍),OCS全光交换是950新增的技术变量。
四、光通信与光计算
核心矛盾
光"传"天下无敌,光"算"有三道坎。
| 光速 | ||
| 几乎无损耗 | ||
| 强(互相控制) | 弱(无法"开关"另一束光) | |
| 容易 | 极难(纳秒级保留) | |
| 天然适配 |
三大根本瓶颈
瓶颈1:光无法存储。 光子停不下来,保留时间纳秒级。光计算天生适合推理(一次算完输出),不适合训练(需要反复更新权重)。
瓶颈2:光子之间不"说话"。 无法做逻辑控制。传统光子芯片在做非线性运算时必须转回电信号(OEO),这种反复转换把速度优势消耗殆尽。
瓶颈3:集成规模撑不起来。 光元器件尺寸远大于晶体管,且对相位误差极度敏感。
正在发生的突破
关键判断:光计算不会取代电子计算,而是形成"光传输+光加速+电控制"的混合架构。三步走:光的连结(现在)→ 光的运算(5-10年)→ 光的量子(10年+)。
五、光电融合推理加速器
2028年商用假设
| 100x+ | |||
| 1/10 | |||
| 纳秒级 | |||
| 低(参数固化在超表面) | |||
| 22nm CMOS可用 |
对六类玩家的冲击
| 模型厂商 | |
| GPU厂商 | |
| 数据中心 | |
| 光计算公司 | |
| 云服务商 | |
| AI应用层 | 最大受益者 |
Token价格推演
| 2028 | $0.01–0.02 | 光电融合加速器商用 |
核心影响不是"让AI更快",而是"重新定义算力的成本函数"——当推理成本再降一个数量级,AI从"工具"变成"环境"。
六、Token消耗的S曲线
现状:指数爆炸
| 1,000x | ||
机构预测
三个引擎、三个拐点
Token增长由三个发动机驱动,各有其拐点:
引擎1:用户渗透 - 2026 Q1:~4.4亿AI月活(中国),覆盖40%网民 - 拐点:约2028-2029年,渗透率达80%+,增速从指数转对数
引擎2:使用深度 - 从"偶尔问问"到"事事都用",单用户Token消耗从3万/日→100万+/日 - 拐点:约2030-2032年,最能用AI的场景都用上了,边际效用递减
引擎3:机器自治 - AI调用AI,7×24运行,无需人在场 - 拐点:约2032-2035年,由"有多少事情值得用AI推理"决定
天花板测算
| 替代人工认知 | ||
| 填补"没人做但值得想"的任务 | ||
| 并行冗余/迭代 |
合成天花板:替代因子的6-9倍 ≈ 1万-1.6万万亿tokens/年。当前约7万万亿/年,有150-200倍空间。
互联网参照系
关键区别:互联网流量的S曲线清晰(用户×人均消耗有上限),Token的S曲线更模糊——机器自治场景的上限难以预测。
七、平台之争
分析框架
Token消耗量 = 用户规模 × 人均调用频次 × 单次调用Token数
当前格局(2026 Q1)
| 14.32亿 | |||
场景差异:Token消耗量级
| 40x | ||
| 100x | ||
| 1,000x | ||
| 2,000x |
一个IMA用户每天处理10份长文档+跑Agent工作流,Token消耗可能是一个豆包闲聊用户的50-100倍。
终局判断:微信+IMA协同体
推演路径:
现在:微信14亿用户中 <5% 深度使用AI ↓ 2027:ClawBot/小程序AI化,渗透率→15-20% ↓ (3亿人 × 日均10次调用 = 30亿次/日) 2028:IMA知识库能力深度嵌入微信生态 ↓ (办公人群的Agent工作流自动运行) 2029+:微信成为AI调用的"操作系统" ↓ 终局:微信生态贡献全中国30-40%的Token消耗 第二极:阿里千问+钉钉+淘宝——优势在交易场景的AI化。
豆包虽然月活最高(3.45亿),但场景偏C端娱乐,单次Token消耗低,且已开始收费压制增长。Token总量可能大,但增速和结构不如微信生态。
价值上移规律
成本趋近于零 ↓ 模型商品化(谁便宜用谁) ↓ 价值向平台层集中 ↓ 平台竞争的核心变成:谁拥有用户关系、数据、生态 ↓ 互联网巨头的AI版图重新划分 4G时代,带宽便宜了,赚钱的不是华为中兴(基础设施),而是微信抖音(平台)。AI时代同理:Token便宜了,赚钱的是让用户消耗最多Token的平台。
八、估值框架
六巨头当前估值(2026年5月)
| $9,000亿 | ||
| $8,520亿 | ||
| $2,300亿 | ||
| ~$640亿 | ||
| ~$450-515亿 | ||
| ~$200亿 |
DCF框架参数
全球Token天花板:~1.5万万亿tokens/年(2035-2040到达) 平均推理单价:$0.50/百万tokens(远期混价) AI总TAM:$2-3.5万亿/年(2035) Top 6市占率:67% 六家总营收:$2万亿/年(中值) 净利率:12%(10-15%中值) 六家总利润:$240亿/年 终端P/E:15x 六家终端总市值:$3.6万亿 折回2026(15%,9年):$1.02万亿 终局份额与合理现值
| 2026合理现值 | 当前估值 | |||||
|---|---|---|---|---|---|---|
| $240-400B | 贵2-3.5x | |||||
| $150-250B | 贵3.5-6x | |||||
| $110-200B | ||||||
| $90-170B | 低估 | |||||
| $70-140B | ||||||
| $30-65B |
场景分析:OpenAI的$852B需要什么条件?
| 寡头竞争(5-6家分70%利润) | 50% | $200-320B |
概率加权合理值:$240-370B。$852B需要五个假设全部成立,联合概率不到5%。
中美估值差距:四个折价因素
17倍的估值差距(DeepSeek $50B vs OpenAI $852B),四个折价因素:
- 市场割裂
:中国模型主要服务中国(全球TAM的20%) - 资本成本
:国内折现率更高 - 平台属性差异
:OpenAI有ChatGPT,DeepSeek在建设 - 叙事差价
:美元资本市场对AI的溢价远高于人民币/HKD
剔除不合理的折价,中美公司合理估值差距应在3-5倍,而非17倍。
九、赢家通吃
赢家通吃的必要条件
科技史检验
互联网没有真正意义上的全球赢家通吃: - 搜索:Google(全球)vs Baidu(中国)vs Naver(韩国)→ 地理分割 - 社交:Meta(美欧)vs 微信(中国)vs Line(日本)→ 地理分割 - 电商:Amazon(美国38%)vs 阿里(中国)vs Shopee(东南亚)→ 地理分割 - 出行:Uber、DiDi、Grab、Ola → 各自为王
苹果是特例,不可复刻的理由: - 硬件+系统+App Store+iCloud+品牌+政治运气的六重护城河 - AI模型公司一个都不占 - 而且:连苹果都差点被华为追上,靠政治打压才稳住江山
AI的自然状态
AI行业的自然状态就是寡头竞争。赢家通吃在理论上就不成立。
DeepSeek通过开源+极致低价,正在加速瓦解"赢家通吃"的可能性——它不是在割自己的肉,是在拆别人的台。
十、关键推论
1. 价格战不可逆
DeepSeek的永久降价不是促销,是定价范式转变。当光电融合加速器2028年商用+昇腾960/970连续迭代,成本还没到底。
2. 算力主权化加速
昇腾三年路线图(950→960→970)的"一年一代翻倍"节奏,意味着中国AI算力从"能不能用"进入"够不够便宜"的新阶段。国产HBM(HiBL/HiZQ)是关键变量。
3. Token拐点尚未到来
用户渗透+Agent驱动,至少还有3年高速增长。第一个拐点约在2028-2029年(渗透率见顶),第二个约在2030-2032年(使用深度边际递减)。
4. 价值从模型层向平台层转移
当Token趋近零成本,模型变成自来水,平台层才是利润高地。微信生态(微信+IMA+元宝+ClawBot)是最有可能统治中国Token消耗的协同体。
5. 美国AI估值隐含"赢家通吃"假设——站不住脚
OpenAI $852B和Anthropic $900B的估值,定价的是"唯一的公司"而非"好公司"。寡头竞争(5-6家分70%利润,本报告基准场景)下,这两家合理值在$150-400B区间。
6. 中国AI公司被结构性低估
DeepSeek $50B × 合理值$90-170B → 有80-240%空间。叙事差价终将收窄。
7. 行业终局:寡头竞争 + 平台收税
模型层5-6家寡头瓜分全球50-70%份额,利润薄(10-15%净利率),平台层赚取超额利润。谁能同时拥有"最强的模型"和"最深的用户入口",谁就是终局赢家。
待观察变量
本文档基于2026年5月23日的一次与腾讯ima copilot (deepseek v4 pro)的深度战略对话整理。所有估值均为基于公开信息的推演框架,不构成投资建议。核心观点:AI产业的终局是寡头竞争,而非赢家通吃——这一判断对整个投资定价体系具有根本性的重置意义。
夜雨聆风