复盘近期行业事件,看懂 AI 发展新趋势

这半年AI圈的大事，如果只看新闻标题，很容易觉得“又有一堆模型发布了，跟我没关系”。但如果你把这些事件串成一条线，会发现一个清晰的趋势正在重塑我们使用AI的方式。今天我带你复盘三个关键事件，以及它们背后藏着的“新规则”。

事件一：DeepSeek-V4开源 + 永久降价 —— “成本优先”成为行业新共识

4月24日，DeepSeek低调发布了V4并同步开源。百万上下文、强化Agent能力、与华为昇腾等国产芯片深度适配——技术指标很亮眼，但更值得关注的是它随后的一系列操作。

5月中下旬，DeepSeek突然宣布永久降价，将V4-Pro的API输入价格打到0.025元/百万Tokens（命中缓存时）。紧接着，小米MiMo跟进，宣布最高降价99%。

这两件事放在一起看，释放了一个非常明确的信号：大模型厂商的竞争，已经从“技术秀肌肉”进入了“成本拼刺刀”阶段。

为什么？因为头部模型的能力差距已经缩小到大多数用户感知不出来的程度。你花三倍的价钱去追那3%的准确率提升，在90%的业务场景里都不划算。于是，厂商开始拼命压缩推理成本和训练成本——DeepSeek能做到永久低价，靠的不是补贴，而是模型架构效率提升和国产算力平台的深度适配。

事件二：文心5.1 “6%成本” —— 效率优化才是真护城河

5月上旬，文心大模型5.1发布。技术报告里那句“仅用了业界同等规模模型约6%的预训练成本”，是我今年看到的最有杀伤力的一句话。

6%是什么概念？别人花100万训练出来的能力，你花6万就做到了。这不是“省预算”，这是“换赛道”。

文心5.1的背后，是一整套训练效率的极致优化。从数据配比到并行策略，从模型架构到硬件调度，每一步都在抠细节。而这种“抠细节”的能力，正在成为大模型厂商真正的护城河——因为参数可以堆，数据可以买，但“用更少的钱训出更好的模型”是硬功夫。

对开发者来说，这件事的意义在于：以后你调用的模型，可能会越来越便宜，而且效果不降反升。因为厂商之间的“效率内卷”，最终受益的是终端用户。

把以上事件放到一起，你会看到一个很有意思的局面：

DeepSeek降了，而且是永久低价

小米降了，而且是断崖式降价

文心走的是“训得便宜”路线，API价格没怎么动但能力提升了

通义、Kimi、智谱各有各的价格体系和优势场景

对于开发者来说，这其实是一个“甜蜜的烦恼”：

甜蜜的是，整体成本确实在降。以前跑一个AI应用每月花几万，现在可能几千就够了。烦恼的是，你很难同时吃到所有降价的“红利”。

现在有一个“把各家降价红利一次性吃满”的办法：用一个聚合平台，把所有模型都接进去。

我们的[器灵模型广场]，做的就是这件事。它把Qwen、DeepSeek、Kimi、GLM、MiniMax等所有主流国产大模型，不仅全部聚合成一套统一的API，价格还比官方便宜一半！

这意味着什么？

第一，你不用自己写适配代码。一个Key调所有模型，换模型只需要改一个参数名。DeepSeek降价了？直接在代码里把model改成deepseek-v4-pro，三秒钟切过去。

第二，价格比官方还便宜。器灵通过规模采购，拿到了比官方更低的折扣。我对比过——同样调用DeepSeek-V4-Pro，通过器灵的价格大约是官方的一半。而且目前完全免费，你可以在不花一分钱的情况下，把各家降价模型都试一遍。

第三，智能路由帮你自动省钱。你可以在器灵后台配置规则：简单任务走最便宜的模型，复杂任务走能力最强的模型，长文本走Kimi，代码走DeepSeek。所有请求自动分发，你的业务代码一行都不用改。

从DeepSeek开源降价，到文心“6%成本”，再到小米跟进——这些事件拼出的趋势已经很清楚了：大模型正在从“稀缺品”变成“水电煤”，而“怎么用最便宜的成本组合多个模型”，正在成为新的核心竞争力。

与其每天追新闻、手动对比各家价格、写一堆适配代码，不如直接用一个聚合平台，把所有便宜都“打包”带走。

去搜公众号[器灵模型广场]，注册免费，你可以先把你项目里现有的一个模型调用，换成通过器灵来调。十分钟后你就会发现——原来用上所有便宜模型，真的可以这么简单。