前几天刷推特,看到一条评论让我愣了半秒:"2026 年 6 月,AI 的天变了。"
不是因为某家公司发了个新模型——这种事每周都有。而是三件事在同一周集中发生:Claude 把 GPT 从王座上拉下来了,中国大模型的全球调用量连续四周碾压美国,苹果终于把 Siri 做成了真正的 AI 助手。
单看每一条都不算炸裂。但放一起看,你会发现一个被大多数人忽视的信号——
· · ·
Claude 超了 GPT:不是更大,而是更"老实"
5 月底,Anthropic 发布了 Claude Opus 4.8。这个版本最让人意外的不是跑分,而是它变"老实"了。
怎么说呢?以前你问 AI 一个它不确定的问题,它大概率会一本正经地编个答案。Opus 4.8 不一样——它会主动告诉你:"这个地方我不太确定,你最好再查一下。"
在代码审查任务中,Opus 4.8 漏看代码缺陷的概率,只有前代的四分之一。
更关键的是价格。新增的"快速模式"比上一代旗舰便宜 3 倍,速度快 2.5 倍。这意味着把 Opus 当日常工具用,第一次在成本上说得过去了。
在 Artificial Analysis 排行榜上,Opus 4.8 直接把 GPT-5.5 拉下第一。但 Anthropic 自己说得很清楚——这代的核心不是"更强",而是"更可托付"。
你愿意让一个 AI 帮你写代码、做法律分析、跑自动化流程,前提是它得靠谱。Opus 4.8 的方向,就是从"能干活"变成"能放心让它干活"。

▲ 神经网络数据流:AI 从工具走向基础设施的隐喻
· · ·
28.9 万亿 Token:中国模型碾压式登顶
同一周,OpenRouter 公布了一组数据,让很多人坐不住了。
全球 AI 大模型的周调用量达到了 28.9 万亿 Token,连续五周上涨。其中,中国大模型的调用量是美国的近两倍。
不是一倍,是近两倍。中国 9.2 万亿,美国 4.9 万亿。
DeepSeek-V4-Flash 单周调用量 3.43 万亿 Token,全球第一。这个数字,比整个美国市场加起来还多。
凭什么是 DeepSeek?答案就一个字:便宜。
DeepSeek-V4-Pro 的定价,大约是 GPT-5.5 的十分之一。缓存命中时,每百万 Token 只要 2 分钱人民币。对,你没看错——2 分钱。
这不是亏本赚吆喝。DeepSeek 今年 5 月正式宣布,之前 2.5 折的限时优惠直接变成常态化定价。也就是说,低价不是促销,而是新常态。
全球调用量前九名里,DeepSeek 一家占了三个席位(V4-Flash、V4-Pro、V3.2)。多型号矩阵,覆盖不同价格带——这打法,像极了当年小米用红米+小米+MIX 三条线打手机市场。

▲ 精密电路:中国模型厂商正在重新定义 AI 的成本结构
· · ·
MiniMax M3:五分之一的价格,同级别的能力
如果说 DeepSeek 是用"极致低价"抢市场,那 MiniMax 走的是另一条路——用五分之一的价格,做到同级别的能力。
6 月 1 日,MiniMax 发布了 M3 模型。这个模型集齐了"前沿三件套":百万级超长上下文、原生多模态、编程能力。综合性能对标 Claude Sonnet,但定价只有它的五分之一。
数据更有说服力——MiniMax 的年化收入已经翻倍到 3 亿美元以上,企业用户超过 100 万。摩根士丹利的报告预测,头部中国模型厂商的 ARR 到 2026 年底可能达到 10-15 亿美元。
过去大家以为大模型公司都在烧钱。但 MiniMax 用实际数据证明:便宜好用,也能赚到钱。
有意思的是,摩根士丹利还指出:中国头部模型的词元消耗份额,从去年 4 月的 5% 一路飙升到今年 3 月的 32%。短短一年,从"可以忽略"变成"举足轻重"。
· · ·
苹果下场:Siri AI + Gemini,AI 竞争进入操作系统层
如果说 Claude 和 DeepSeek 是"模型层"的竞争,那苹果的加入,直接把战火烧到了"操作系统层"。
WWDC 2026 上,苹果发布了全新的 Siri AI。不再是以前那个只会设闹钟的语音助手——它能跨 App 操作、读懂屏幕内容、上网搜索实时信息,甚至能根据你拍的食物照片自动算卡路里。
背后用的是 Google Gemini 模型。苹果选了一个很"苹果"的做法:自己不做大模型,但把最好的模型整合进自己的生态里。
同时,Xcode 27 也集成了 AI 编码能力,支持调用 Claude 和 Gemini。开发者在写代码时,可以直接让 AI 帮忙——而且是苹果原生支持的那种,不需要装第三方插件。
当苹果开始认真做 AI,意味着这项技术不再是极客的玩具,而是要进入十亿人的口袋了。
不过有一个细节值得注意:Siri AI 初期不支持中国大陆和欧盟。原因你懂的——数据合规和监管。但这个"缺席"本身也说明:AI 的全球化,远没有技术本身那么简单。
· · ·
放在一起看:三个被忽视的真相
这三件事,每一件都有人单独报道过。但放在一起看,真相就不一样了。
真相一:AI 竞争的主战场,正在从"谁更强"变成"谁更便宜好用"。Claude 赢了 GPT-5.5,靠的不是参数更大,而是更诚实、更可靠、更便宜。DeepSeek 称霸全球调用量,靠的也不是技术碾压,而是极致性价比。MiniMax 用五分之一的价格做到同级性能。大模型正在变成"水电煤"——好不好用,比牛不牛更重要。
真相二:中国模型不是在追赶,而是在重新定义游戏规则。全球调用量前五名,中国占了四席。这不是靠补贴砸出来的——DeepSeek 的低价策略已经常态化,MiniMax 的企业用户在半年内翻了四倍。当美国公司还在卷"更强的模型"时,中国公司已经在卷"更低的价格+更广的覆盖"。
真相三:AI 正在从"聊天工具"变成"基础设施"。苹果把 AI 嵌入了操作系统,Anthropic 在推"动态工作流"让 AI 自动拆解和执行复杂任务,DeepSeek 的模型被全球开发者嵌入各种应用。AI 不再是你"打开一个 App 聊天"的东西,而是像电力一样,渗透到每一个软件、每一个流程里。

▲ Xcode 27 集成 AI 编码能力,开发者的工作方式正在被改变
· · ·
普通人该怎么看这件事?
说了这么多宏观的,跟你有什么关系?
❶ 别再纠结"用哪个模型最好"。这个月的冠军下个月可能就换了。重要的是选一个靠谱的、性价比高的,然后把时间花在怎么用好它上。
❷ 关注"Agent"这个方向。无论是 Anthropic 的动态工作流、苹果的跨 App 操作,还是 DeepSeek 的工具调用能力,所有厂商都在往同一个方向走——让 AI 不只是回答问题,而是帮你做事。
❸ 价格战对你来说是好事。DeepSeek 2 分钱百万 Token、MiniMax 五分之一的价格、Claude 快速模式降了三倍——这些都不是新闻里的数字,而是你明天用 AI 的成本。越来越便宜,越来越强大,这是确定的趋势。
· · ·
回到开头那条评论:"2026 年 6 月,AI 的天变了。"
变的不是某一个模型的能力,而是整个游戏的规则。从"谁最强"到"谁最实用",从"聊天玩具"到"基础设施",从"美国独大"到"中美两极"——这些变化,正在同时发生。
大多数人还没意识到,但你已经看到了。
· · ·
❶ 你最近在用哪个 AI 模型?体验怎么样?评论区聊聊 ❷ 觉得这篇文章有用?点个"赞"和"在看",让更多人看到 ❸ 转发给一个还在纠结"用 ChatGPT 还是 Claude"的朋友
夜雨聆风