AI 大模型变天了:Claude 登顶,中国模型碾压全球

前几天刷推特，看到一条评论让我愣了半秒："2026 年 6 月，AI 的天变了。"

不是因为某家公司发了个新模型——这种事每周都有。而是三件事在同一周集中发生：Claude 把 GPT 从王座上拉下来了，中国大模型的全球调用量连续四周碾压美国，苹果终于把 Siri 做成了真正的 AI 助手。

单看每一条都不算炸裂。但放一起看，你会发现一个被大多数人忽视的信号——

· · ·

Claude 超了 GPT：不是更大，而是更"老实"

5 月底，Anthropic 发布了 Claude Opus 4.8。这个版本最让人意外的不是跑分，而是它变"老实"了。

怎么说呢？以前你问 AI 一个它不确定的问题，它大概率会一本正经地编个答案。Opus 4.8 不一样——它会主动告诉你："这个地方我不太确定，你最好再查一下。"

在代码审查任务中，Opus 4.8 漏看代码缺陷的概率，只有前代的四分之一。

更关键的是价格。新增的"快速模式"比上一代旗舰便宜 3 倍，速度快 2.5 倍。这意味着把 Opus 当日常工具用，第一次在成本上说得过去了。

在 Artificial Analysis 排行榜上，Opus 4.8 直接把 GPT-5.5 拉下第一。但 Anthropic 自己说得很清楚——这代的核心不是"更强"，而是"更可托付"。

你愿意让一个 AI 帮你写代码、做法律分析、跑自动化流程，前提是它得靠谱。Opus 4.8 的方向，就是从"能干活"变成"能放心让它干活"。

▲ 神经网络数据流：AI 从工具走向基础设施的隐喻

· · ·

28.9 万亿 Token：中国模型碾压式登顶

同一周，OpenRouter 公布了一组数据，让很多人坐不住了。

全球 AI 大模型的周调用量达到了 28.9 万亿 Token，连续五周上涨。其中，中国大模型的调用量是美国的近两倍。

不是一倍，是近两倍。中国 9.2 万亿，美国 4.9 万亿。

DeepSeek-V4-Flash 单周调用量 3.43 万亿 Token，全球第一。这个数字，比整个美国市场加起来还多。

凭什么是 DeepSeek？答案就一个字：便宜。

DeepSeek-V4-Pro 的定价，大约是 GPT-5.5 的十分之一。缓存命中时，每百万 Token 只要 2 分钱人民币。对，你没看错——2 分钱。

这不是亏本赚吆喝。DeepSeek 今年 5 月正式宣布，之前 2.5 折的限时优惠直接变成常态化定价。也就是说，低价不是促销，而是新常态。

全球调用量前九名里，DeepSeek 一家占了三个席位（V4-Flash、V4-Pro、V3.2）。多型号矩阵，覆盖不同价格带——这打法，像极了当年小米用红米+小米+MIX 三条线打手机市场。

▲ 精密电路：中国模型厂商正在重新定义 AI 的成本结构

· · ·

MiniMax M3：五分之一的价格，同级别的能力

如果说 DeepSeek 是用"极致低价"抢市场，那 MiniMax 走的是另一条路——用五分之一的价格，做到同级别的能力。

6 月 1 日，MiniMax 发布了 M3 模型。这个模型集齐了"前沿三件套"：百万级超长上下文、原生多模态、编程能力。综合性能对标 Claude Sonnet，但定价只有它的五分之一。

数据更有说服力——MiniMax 的年化收入已经翻倍到 3 亿美元以上，企业用户超过 100 万。摩根士丹利的报告预测，头部中国模型厂商的 ARR 到 2026 年底可能达到 10-15 亿美元。

过去大家以为大模型公司都在烧钱。但 MiniMax 用实际数据证明：便宜好用，也能赚到钱。

有意思的是，摩根士丹利还指出：中国头部模型的词元消耗份额，从去年 4 月的 5% 一路飙升到今年 3 月的 32%。短短一年，从"可以忽略"变成"举足轻重"。

· · ·

苹果下场：Siri AI + Gemini，AI 竞争进入操作系统层

如果说 Claude 和 DeepSeek 是"模型层"的竞争，那苹果的加入，直接把战火烧到了"操作系统层"。

WWDC 2026 上，苹果发布了全新的 Siri AI。不再是以前那个只会设闹钟的语音助手——它能跨 App 操作、读懂屏幕内容、上网搜索实时信息，甚至能根据你拍的食物照片自动算卡路里。

背后用的是 Google Gemini 模型。苹果选了一个很"苹果"的做法：自己不做大模型，但把最好的模型整合进自己的生态里。

同时，Xcode 27 也集成了 AI 编码能力，支持调用 Claude 和 Gemini。开发者在写代码时，可以直接让 AI 帮忙——而且是苹果原生支持的那种，不需要装第三方插件。

当苹果开始认真做 AI，意味着这项技术不再是极客的玩具，而是要进入十亿人的口袋了。

不过有一个细节值得注意：Siri AI 初期不支持中国大陆和欧盟。原因你懂的——数据合规和监管。但这个"缺席"本身也说明：AI 的全球化，远没有技术本身那么简单。

· · ·

放在一起看：三个被忽视的真相

这三件事，每一件都有人单独报道过。但放在一起看，真相就不一样了。

真相一：AI 竞争的主战场，正在从"谁更强"变成"谁更便宜好用"。Claude 赢了 GPT-5.5，靠的不是参数更大，而是更诚实、更可靠、更便宜。DeepSeek 称霸全球调用量，靠的也不是技术碾压，而是极致性价比。MiniMax 用五分之一的价格做到同级性能。大模型正在变成"水电煤"——好不好用，比牛不牛更重要。

真相二：中国模型不是在追赶，而是在重新定义游戏规则。全球调用量前五名，中国占了四席。这不是靠补贴砸出来的——DeepSeek 的低价策略已经常态化，MiniMax 的企业用户在半年内翻了四倍。当美国公司还在卷"更强的模型"时，中国公司已经在卷"更低的价格+更广的覆盖"。

真相三：AI 正在从"聊天工具"变成"基础设施"。苹果把 AI 嵌入了操作系统，Anthropic 在推"动态工作流"让 AI 自动拆解和执行复杂任务，DeepSeek 的模型被全球开发者嵌入各种应用。AI 不再是你"打开一个 App 聊天"的东西，而是像电力一样，渗透到每一个软件、每一个流程里。

▲ Xcode 27 集成 AI 编码能力，开发者的工作方式正在被改变

· · ·

普通人该怎么看这件事？

说了这么多宏观的，跟你有什么关系？

❶ 别再纠结"用哪个模型最好"。这个月的冠军下个月可能就换了。重要的是选一个靠谱的、性价比高的，然后把时间花在怎么用好它上。

❷ 关注"Agent"这个方向。无论是 Anthropic 的动态工作流、苹果的跨 App 操作，还是 DeepSeek 的工具调用能力，所有厂商都在往同一个方向走——让 AI 不只是回答问题，而是帮你做事。

❸ 价格战对你来说是好事。DeepSeek 2 分钱百万 Token、MiniMax 五分之一的价格、Claude 快速模式降了三倍——这些都不是新闻里的数字，而是你明天用 AI 的成本。越来越便宜，越来越强大，这是确定的趋势。

· · ·

回到开头那条评论："2026 年 6 月，AI 的天变了。"

变的不是某一个模型的能力，而是整个游戏的规则。从"谁最强"到"谁最实用"，从"聊天玩具"到"基础设施"，从"美国独大"到"中美两极"——这些变化，正在同时发生。

大多数人还没意识到，但你已经看到了。

· · ·

❶ 你最近在用哪个 AI 模型？体验怎么样？评论区聊聊 ❷ 觉得这篇文章有用？点个"赞"和"在看"，让更多人看到 ❸ 转发给一个还在纠结"用 ChatGPT 还是 Claude"的朋友