中国AI调用量反超美国-夜雨聆风

中国AI调用量反超美国

如果只给你看一张表，你会发现一件过去一年里所有人都在预测、但没人敢笃定的事已经发生了。

在全球最大的 AI 模型聚合平台 OpenRouter 上，2026 年 2 月 9 日到 15 日那一周，中国模型的调用量第一次超过美国模型。

4.12 万亿 对 2.94 万亿。

三周之后，中国模型一周的调用量飙到 5.16 万亿，三周涨了 127%。到了二、三月整体盘点，Top10 模型里，中国模型吃掉了 61% 的 Token 消耗。更夸张的是 Top5 里，中国模型占了四席，合计份额 85.7%。

这不是”赶上”，这是换位。

一、什么是 OpenRouter，为什么这个数字重要

简单说，OpenRouter 是一个 API 分发平台，开发者在上面可以随意切换调用全球几百个大模型。它有点像 AI 界的”携程”，不卖机票，卖 Token。

开发者为什么用 OpenRouter，逻辑很朴素：哪个模型便宜、好用、稳定，就调哪个。没有地缘滤镜，没有国别情怀，一切以效果和成本说话。

所以 OpenRouter 的调用量排行榜，是目前衡量大模型”谁真的被用起来”最硬的指标之一。它比发布会吹的参数、比 Benchmark 的榜单都更接近真实世界。

一个模型能在 OpenRouter 上冲到榜首，只有两种可能：

便宜得离谱
好用得离谱
最好是既便宜又好用

这次冲到榜首的那个模型，叫 MiniMax M2.5，2 月份一家公司就吃掉了 4.55 万亿 Token。紧跟在后面的，是月之暗面的 Kimi K2.5，4.02 万亿。

二、成本差距：17 倍到 20 倍

所有人第一反应都会问：凭什么？

答案的一半在价格表里。

模型	输入（$/M tokens）	输出（$/M tokens）
MiniMax M2.5	0.30	1.20
Claude Opus	5 ~ 25	5 ~ 25

贵 17 到 20 倍。

如果你是一个每天要烧掉几亿 Token 的 AI 产品团队，这个差距翻译成现金流，就是生与死。

过去大家安慰自己，美国模型贵，是因为贵得值。它更聪明、更不容易出错、更能处理复杂任务。这句话在 2024 年是对的，在 2025 年开始摇摆，到 2026 年 4 月，已经彻底不成立了。

三、智谱 GLM-5.1：第一次在核心榜单上反超

真正让硅谷坐不住的，是 4 月 8 日智谱发布的 GLM-5.1。

在 SWE-Bench Pro 这个业内公认最接近真实软件开发的基准测试上：

GLM-5.1：58.4 分

（全球第一）
GPT-5.4：57.7 分
Claude Opus 4.6：57.3 分

中国模型第一次在一个硬核代码基准上拿到了全球第一。

更关键的一个能力，叫长程任务。过去所有模型都有一个隐形天花板：让它连续工作超过一两个小时，就会开始丢上下文、重复回答、越写越乱。GLM-5.1 是目前唯一一个能稳定连续工作 8 小时的开源模型。

8 小时意味着什么？意味着你可以在下班前把一个完整的需求丢给它，第二天上班看结果，中间它自己会规划、会调试、会回退、会继续。这是从”AI 助手”到”AI 员工”的分界线。

GLM-5.1 还有个细节很能说明问题：字节跳动的编程助手 TRAE，和智谱做了 Day 0 同步接入。字节自己也有大模型，但他们的编程产品直接选择了外部的 GLM-5.1。这说明在内部测试里，GLM-5.1 至少在某些场景上，赢了字节自家的底座。

智谱同时把价格涨了 10%。能涨价，说明他们相信客户跑不掉。

四、为什么会反超：三股力量同时发力

这件事不是某一家公司的胜利，是一整条链在共振。

第一股力：极致成本

国内模型之间的价格战打了两年，惨烈到让海外看客都觉得不可持续。但结果是，整个中国 AI 生态把”每百万 Token”的成本压到了美国同行望尘莫及的位置。当一个模型能力接近、价格只有对方二十分之一，开发者不需要做任何政治判断，拿计算器就能决定迁移。

第二股力：开源策略

GLM-5.1 是开源的
Kimi K2.5 是开源的
Qwen3.6 是开源的
OpenAI 的 o 系列和 GPT-5 不是
Claude 不是

开源的意思是任何公司都可以私有化部署、可以微调、可以审计代码、可以在不可信网络里用。对于海外的中型企业来说，开源中国模型 + 自建推理，比闭源美国 API 更划算也更放心。

第三股力：规模红利

国内每天处理的 Token 数，已经涨到 140 万亿。这是什么概念？2024 年初，这个数字才 1000 亿。两年涨了 140 倍。

背后是豆包 2 月日活破亿、AI 短剧把制作成本从上百万压到 10 万人民币、钉钉里跑着上亿个企业 Agent。规模带来的不只是营收，还是反馈数据。模型越被用，越知道哪里该优化，这是一个正反馈。

五、资本层面也跟上来了

产业看表面，资本看预期。

2025 年三大厂 AI 资本支出：

阿里巴巴：1230 亿人民币

（直接把当年净利润打下来 66%）
腾讯：790 亿人民币
字节跳动：230 亿美元

这三家的投入加起来，已经逼近美国超大规模云厂商的水平。

上市节奏也在加速：

MiniMax

：2025 年营收 7900 万美元，同比增长 159%，海外收入占 70%
智谱

：营收 7.24 亿人民币，同比增长 132%
月之暗面

：传言以 100 亿美元估值准备冲香港 IPO

这些公司共同点是：仍然在巨亏，但收入曲线陡峭。资本市场愿意给他们估值，是因为相信”反超 OpenRouter”不是一次偶然，而是一个可持续的位置。

六、真正值得警惕的几个问题

把话说完整，也要说说不该乐观的部分。

调用量 ≠ 利润

。OpenRouter 上中国模型跑得猛，相当一部分是海外开发者在低价试用。一旦价格战结束或者某家公司撑不下去涨价，用户迁移成本其实很低。
基础设施还在卡脖子

。国内 AI 训练对高端 GPU 的依赖并没有消失，只是分散到了云端租用、海外结点、以及国产替代的艰难爬坡里。阿里 4 月 8 日发布基于真武芯片的数据中心是个信号，但距离成熟还远。
英文世界的信息战没开始打

。中国模型在 OpenRouter 上赢了 Token，但在开发者社区的心智里还没赢。Reddit、HackerNews、Twitter 上讨论最多的仍然是 GPT、Claude、Gemini。一个模型要成为”默认选项”，还需要大量的英文生态建设。

七、给开发者的一点实操建议

如果你是在做 AI 产品的人，这波信号值得你做一件事：

今晚就去 OpenRouter 开个号，把同一个业务 Prompt 挨个打到 MiniMax M2.5、Kimi K2.5、GLM-5.1 上跑一遍。

不需要全面替换，先拿成本最高的那部分调用做试点。很可能你会发现，月账单可以直接砍掉一个数量级，而效果没什么差别。

如果你在做长程 Agent，重点看 GLM-5.1。8 小时连续工作这件事，对工作流类产品是降维打击。
如果你是企业决策者，这是一个好时机重新审视你的 AI 供应商策略。把所有蛋放在一两个美国闭源模型上，已经不再是最优解。

八、一个时代结束的方式

很多时候，一个时代的结束不是靠一场发布会、一篇爆文宣告的，而是悄悄发生在后台数据里。

2026 年 2 月 15 日，OpenRouter 后台跑过去的那 4.12 万亿对 2.94 万亿，可能就是那个时刻。

没有庆祝，没有新闻联播，只有一批海外开发者的 API Key 悄悄换了供应商。

这大概也是 AI 时代最真实的一种胜负规则：谁能让用户愿意掏钱、愿意留下，谁就在赢。

至于面子，反超这件事本身，就够了。

参考来源

Chinese AI models overtake U.S. rivals in global token usage — CGTN
Chinese AI Models Hit 61% Market Share On OpenRouter — Dataconomy
OpenRouter State of AI 2025
全球最强开源模型来了，智谱发布旗舰 GLM-5.1 — 21 世纪经济报道
中国 AI 领域最新动态 — 财富中文网