一边是DeepSeek官宣V4-Pro输出价格永久降至6元/百万Token,直接将行业价格战推向"不可逆"深渊;另一边是Anthropic ARR飙升至450亿美元、估值突破1万亿美元,反超OpenAI成为全球最具价值的AI公司。AI大模型,正在从"烧钱竞赛"走向"商业价值"的分水岭。
---
5月,DeepSeek通过官方渠道宣布:将原V4-Pro模型的"限时优惠"转为永久定价——
- 输出价格
:永久降至 6元/百万Token(约为GPT-4o同规格的1/50) - 缓存输入价格
:降至 0.025元/百万Token - 输入价格
:同样大幅下调,具体价格参见官网
这不是一次普通的促销,而是DeepSeek向全行业发出的"宣战书":推理成本可以被压到极致,而且我们做到了,还不准备涨回来。
DeepSeek的降价底气来自哪里?核心在于技术优化。据公开技术资料,DeepSeek V4-Pro采用了全新的MoE(混合专家)架构和KV Cache复用技术,使得推理成本相比传统Dense模型降低了两个数量级。当竞争对手还在靠"堆GPU"降成本的时候,DeepSeek已经靠"改架构"把成本打下来了。

对行业的影响:
价格战进入"不可逆"阶段。OpenAI、Anthropic、谷歌等巨头,要么跟进降价(牺牲利润),要么坚守高价(失去市场份额)。无论哪种选择,都意味着过去的"高溢价大模型"商业模式正在走向终结。
---
就在DeepSeek打价格战的同时,另一边的Anthropic却在"高端市场"大杀四方。
2026年5月,Anthropic公布了一组惊人数据:
- ARR(年度经常性收入)
:从90亿美元飙升至 450亿美元,增幅高达5倍 - 估值
:突破 1万亿美元,正式超越OpenAI,成为全球最具价值的AI公司 - Claude模型
:在企业市场的占有率持续攀升,尤其是代码生成(Claude Code)领域
Anthropic的逆袭,验证了AI商业化的一条核心逻辑:价格战是流量入口,企业级服务才是利润中心。

DeepSeek用低价吸引开发者,但真正愿意为企业客户买单的,依然是Anthropic和OpenAI。Anthropic选择聚焦coding、法律、金融等高价值场景,用差异化能力建立壁垒,而不是卷入价格战。
更值得关注的是,Andrej Karpathy(前特斯拉AI总监、OpenAI创始成员)在5月宣布加入Anthropic,这一"人才转会"事件在AI圈引发巨大震动,也被视为Anthropic技术实力的重要背书。
---
5月AI圈的另一个重大技术转向,来自具身智能(Embodied AI)领域。
传统具身智能主流方案是VLA(Vision-Language-Action)模型——即让大模型同时处理视觉输入、语言指令,并输出动作指令。但VLA在物理交互中存在明显短板:预测不够精准、泛化能力弱、计算开销大。

2026年5月,英伟达科学家Jim Fan联合复旦大学等机构,提出了全新的WAM(World Action Model,世界动作模型)范式,并发布了该领域的首篇综述论文。
WAM的核心思路是:联合预测未来状态 + 生成动作,而不是像VLA那样直接映射"感知→动作"。这种方式更符合物理世界的因果逻辑,在复杂操作任务中的成功率显著提升。
与此同时,西湖大学等团队提出的HiF-VLA(运动中心世界动作模型)被CVPR 2026接收,在长程任务评测中成功率超越现有最佳方法。代码已开源。

这些进展意味着:具身智能的技术路线可能正在发生重大转向,而中国企业(复旦、西湖大学、极佳视界等)在这条新赛道上,并没有落后欧美。
---
5月的AI大模型格局中,中国力量的表现同样亮眼。
学术层面:中国人民大学联合华为,提出了MP-MoE新架构,解决了MoE(混合专家)模型中长期存在的"回音室效应"(专家之间缺乏互补性,导致模型能力瓶颈)。该成果被ICML 2026接收,训练开销仅增3%,推理零额外成本,多任务性能提升1-3个百分点。这是中国在AI基础架构领域的又一重要突破。
产业层面:宁德时代豪掷105亿元布局AI算力,投资世纪互联、中恒电气,并拟参投DeepSeek首轮融资。作为全球最大的动力电池企业,宁德时代的大手笔入局,标志着AI算力正在成为"新基建",连传统制造业巨头都要抢滩登陆。

应用层面:阿里云在2026阿里云峰会上发布了企业级Agent平台JVS Crew,采用"手脑分离架构",已在多个行业落地。这标志着中国大模型企业正在从"追赶参数规模"转向"深耕行业落地"。
---
在技术突破和商业化的喧嚣之外,AI安全议题也在5月获得更多关注。
Anthropic发布的Claude Mythos Preview安全测试报告显示:在30天的联合测试中,Claude协助50家企业发现了超过10,000个高危安全漏洞,并成功拦截了150万美元的电信诈骗,准确率达90.6%。
这份报告的意义在于:AI不仅可以"生成内容",还可以"发现漏洞"——AI正在成为网络安全防御的重要力量。与此同时,AI模型自身的安全性(如提示注入、记忆投毒等攻击面)也成为研究热点。

---
2026年5月的AI大模型市场,呈现出一个极为清晰的"分水岭"特征:
技术层面:基础模型能力仍在快速提升,但竞争焦点已从"参数规模"转向"推理能力、智能体、具身智能"等更深维度。中国企业在学术研究和产业落地两个方向都在加速追赶。
商业层面:价格战不可逆,但企业级市场仍是利润高地。Anthropic的估值逆袭证明,"高端化"是一条可行路线,并非所有玩家都要卷入价格战。
格局层面:DeepSeek用低价打破垄断,Anthropic用高端化建立壁垒,OpenAI面临前所未有的竞争压力。全球AI大模型市场,正在从"一家独大"走向"多元竞争"。

对于中国AI产业而言,2026年5月是一个值得记住的月份——我们在技术、商业、应用三个维度,都拿出了世界级的表现。
夜雨聆风