AI大模型五月变局:DeepSeek永久降价碾压行业,Anthropic估值破万亿反超Open

一边是DeepSeek官宣V4-Pro输出价格永久降至6元/百万Token，直接将行业价格战推向"不可逆"深渊；另一边是Anthropic ARR飙升至450亿美元、估值突破1万亿美元，反超OpenAI成为全球最具价值的AI公司。AI大模型，正在从"烧钱竞赛"走向"商业价值"的分水岭。

---

5月，DeepSeek通过官方渠道宣布：将原V4-Pro模型的"限时优惠"转为永久定价——

输出价格
：永久降至 6元/百万Token（约为GPT-4o同规格的1/50）
缓存输入价格
：降至 0.025元/百万Token
输入价格
：同样大幅下调，具体价格参见官网

这不是一次普通的促销，而是DeepSeek向全行业发出的"宣战书"：推理成本可以被压到极致，而且我们做到了，还不准备涨回来。

DeepSeek的降价底气来自哪里？核心在于技术优化。据公开技术资料，DeepSeek V4-Pro采用了全新的MoE（混合专家）架构和KV Cache复用技术，使得推理成本相比传统Dense模型降低了两个数量级。当竞争对手还在靠"堆GPU"降成本的时候，DeepSeek已经靠"改架构"把成本打下来了。

对行业的影响：

价格战进入"不可逆"阶段。OpenAI、Anthropic、谷歌等巨头，要么跟进降价（牺牲利润），要么坚守高价（失去市场份额）。无论哪种选择，都意味着过去的"高溢价大模型"商业模式正在走向终结。

---

就在DeepSeek打价格战的同时，另一边的Anthropic却在"高端市场"大杀四方。

2026年5月，Anthropic公布了一组惊人数据：

ARR（年度经常性收入）
：从90亿美元飙升至 450亿美元，增幅高达5倍
估值
：突破 1万亿美元，正式超越OpenAI，成为全球最具价值的AI公司
Claude模型
：在企业市场的占有率持续攀升，尤其是代码生成（Claude Code）领域

Anthropic的逆袭，验证了AI商业化的一条核心逻辑：价格战是流量入口，企业级服务才是利润中心。

DeepSeek用低价吸引开发者，但真正愿意为企业客户买单的，依然是Anthropic和OpenAI。Anthropic选择聚焦coding、法律、金融等高价值场景，用差异化能力建立壁垒，而不是卷入价格战。

更值得关注的是，Andrej Karpathy（前特斯拉AI总监、OpenAI创始成员）在5月宣布加入Anthropic，这一"人才转会"事件在AI圈引发巨大震动，也被视为Anthropic技术实力的重要背书。

---

5月AI圈的另一个重大技术转向，来自具身智能（Embodied AI）领域。

传统具身智能主流方案是VLA（Vision-Language-Action）模型——即让大模型同时处理视觉输入、语言指令，并输出动作指令。但VLA在物理交互中存在明显短板：预测不够精准、泛化能力弱、计算开销大。

2026年5月，英伟达科学家Jim Fan联合复旦大学等机构，提出了全新的WAM（World Action Model，世界动作模型）范式，并发布了该领域的首篇综述论文。

WAM的核心思路是：联合预测未来状态 + 生成动作，而不是像VLA那样直接映射"感知→动作"。这种方式更符合物理世界的因果逻辑，在复杂操作任务中的成功率显著提升。

与此同时，西湖大学等团队提出的HiF-VLA（运动中心世界动作模型）被CVPR 2026接收，在长程任务评测中成功率超越现有最佳方法。代码已开源。

这些进展意味着：具身智能的技术路线可能正在发生重大转向，而中国企业（复旦、西湖大学、极佳视界等）在这条新赛道上，并没有落后欧美。

---

5月的AI大模型格局中，中国力量的表现同样亮眼。

学术层面：中国人民大学联合华为，提出了MP-MoE新架构，解决了MoE（混合专家）模型中长期存在的"回音室效应"（专家之间缺乏互补性，导致模型能力瓶颈）。该成果被ICML 2026接收，训练开销仅增3%，推理零额外成本，多任务性能提升1-3个百分点。这是中国在AI基础架构领域的又一重要突破。

产业层面：宁德时代豪掷105亿元布局AI算力，投资世纪互联、中恒电气，并拟参投DeepSeek首轮融资。作为全球最大的动力电池企业，宁德时代的大手笔入局，标志着AI算力正在成为"新基建"，连传统制造业巨头都要抢滩登陆。

应用层面：阿里云在2026阿里云峰会上发布了企业级Agent平台JVS Crew，采用"手脑分离架构"，已在多个行业落地。这标志着中国大模型企业正在从"追赶参数规模"转向"深耕行业落地"。

---

在技术突破和商业化的喧嚣之外，AI安全议题也在5月获得更多关注。

Anthropic发布的Claude Mythos Preview安全测试报告显示：在30天的联合测试中，Claude协助50家企业发现了超过10,000个高危安全漏洞，并成功拦截了150万美元的电信诈骗，准确率达90.6%。

这份报告的意义在于：AI不仅可以"生成内容"，还可以"发现漏洞"——AI正在成为网络安全防御的重要力量。与此同时，AI模型自身的安全性（如提示注入、记忆投毒等攻击面）也成为研究热点。

---

2026年5月的AI大模型市场，呈现出一个极为清晰的"分水岭"特征：

技术层面：基础模型能力仍在快速提升，但竞争焦点已从"参数规模"转向"推理能力、智能体、具身智能"等更深维度。中国企业在学术研究和产业落地两个方向都在加速追赶。

商业层面：价格战不可逆，但企业级市场仍是利润高地。Anthropic的估值逆袭证明，"高端化"是一条可行路线，并非所有玩家都要卷入价格战。

格局层面：DeepSeek用低价打破垄断，Anthropic用高端化建立壁垒，OpenAI面临前所未有的竞争压力。全球AI大模型市场，正在从"一家独大"走向"多元竞争"。

对于中国AI产业而言，2026年5月是一个值得记住的月份——我们在技术、商业、应用三个维度，都拿出了世界级的表现。