美国AI仍领先,但差距正在缩小

一、一句话，炸翻了整个AI圈

2026年5月14日，Anthropic发布了一份名为《2028：全球AI领导力的两种情景》的政策报告。

这份报告里，有一句话让整个行业都安静了。

原话是这么说的：

"US frontier systems are estimated to be at least several months ahead of the top models from PRC AI labs."

翻译过来就是：美国前沿系统估计比中国AI实验室的顶级模型至少领先"几个月"。

"几个月"。

不是"几年"，不是"代差"，甚至不是"显著领先"，就是"几个月"。

如果你关注AI行业足够久，你会知道这句话的分量。两年前，美国AI圈对中国模型的普遍态度是"follower"，是"抄袭者"，是"不可同日而语"。

现在，Anthropic——这家由OpenAI前核心成员创立、被认为是美国AI"安全派"旗帜的公司——亲口说出了"几个月"。

这不是谦虚，这是警告。

二、数据不会说谎：OpenRouter上的"无声投票"

Anthropic为什么突然"急了"？答案藏在OpenRouter的数据里。

OpenRouter是一个AI模型聚合平台，开发者可以在上面调用各种大模型API。它的独特价值在于：它记录了多少Token被哪些模型消耗了——这是全球开发者"用脚投票"的最真实数据。

2024年底，中国AI模型在OpenRouter上的调用量占比是多少？

1.2%。

基本可以忽略不计。那时候，行业共识是：闭源模型（OpenAI、Anthropic、Google）主导一切，中国模型"能看不能用"。

然后，事情开始变了。

2025年中，DeepSeek R1发布，开源潮兴起。中国模型在OpenRouter的占比爬到了13%，峰值接近30%。

2026年5月，最新的数据是：

超过60%。

是的，一年半的时间，从1.2%到60%+。中国AI模型在OpenRouter上的调用量，已经超过了所有美国模型的总和。

具体数字更有冲击力

看一组2026年5月11-17日这一周的数据（来源：每日经济新闻，基于OpenRouter数据）：

地区	周调用量（Token）	环比变化
中国	7.693万亿	基本持平
美国	4.24万亿	+12.77%
全球总计	26.9万亿	+4.7%

中国AI大模型的周调用量，已经是美国的1.81倍。

而且，这已经是连续三周稳居全球首位了。

周榜上的名字，你可能已经很熟悉了

OpenRouter每周都会发布调用量排行榜。2026年5月的榜单上，排名前三的是：

腾讯 Hy3 preview (free) —— 2.68万亿Token
Kimi K2.6 —— 1.61万亿Token
DeepSeek-V4-Flash —— 新入榜

后面还有DeepSeek-V3.2、智谱GLM-5.1等等。

这些名字有两个共同点：

都是中国模型
都是最近三个月内发布的

换句话说，中国AI模型不是"突然崛起"的，它们是在三个月内集中爆发的。

三、9倍：一场静悄悄的成本革命

数据说完了，再说钱。

AI模型的调用是按Token计费的。你往模型里塞多少词，它吐出来多少词，加起来算钱。

在这个游戏规则下，中国模型做了一个很"不讲武德"的事情：

它们把价格打到了地板价。

来看一组对比（数据来源：OpenRouter价格数据 + aistackchoice.com）：

模型	价格（每百万Token）	相对Claude性价比
Claude 3.7 Sonnet	$1.963	1x（基准）
Claude Sonnet 4	$1.937	1x
DeepSeek V3（0324）	$0.394	约5x性价比
Gemini 2.0 Flash	$0.147	约13x性价比
Qwen2-7B-Instruct	$0.052	约38x性价比

关键结论来了：

完成相同的工作负载，Claude的成本是 cheapest Chinese alternative 的9倍。

9倍。

这不是"稍微贵一点"，这是一个在用奢侈品，一个在用成本价。

四、模型的估值

2026年5月20日，CNBC发了一篇报道，标题很直接：

"Cheap AI could derail OpenAI and Anthropic's IPOs" （廉价AI可能破坏OpenAI和Anthropic的IPO计划）

这篇文章的逻辑很简单：

中国模型成本低 → 开发者开始迁移
OpenAI和Anthropic的市场份额受压
资本市场对"AI垄断溢价"的信心动摇
IPO估值下调，甚至推迟

现在，这个叙事被两件事同时冲击了：

中国模型在OpenRouter拿下60%份额（市场份额在流失）
Anthropic自己承认"只领先几个月"（技术护城河没那么深）

五、Anthropic的2028焦虑：两条路，一个选择

回到Anthropic那份报告。

"几个月"那句话，只是报告的引言。报告的核心，是在推演2028年的两种情景。

情景一：美国守住领先

条件：

收紧出口管制
阻断蒸馏攻击（distillation attack）
推动盟友采用美国AI

结果：

美国保持12-24个月领先
美国制定AI规则

情景二：中美并驾齐驱

条件：

政策漏洞没有堵住
中国接近前沿

结果：

中美AI能力持平
政府影响AI规则制定

六、为什么是现在？三个模型的"三月突击"

Anthropic为什么在2026年5月"突然"着急了？

一个很重要的背景是：2026年3月到4月，中国AI实验室来了一次"集中爆发"。

三款旗舰模型，几乎同时发布：

模型	发布时间	核心特点	定位
DeepSeek V4/V3.2	2026-04-24	LiveCodeBench第一（93.50分），数学推理强	代码+推理
Kimi K2.6	2026-04-20	长文本处理，角色扮演场景强	长上下文+创作
GLM-5.1 （智谱）	2026-03-27	工具调用能力强，企业场景适配好	工具调用+企业级

这三款模型有一个共同点：它们不是在"追赶"，它们是在"对标"。

DeepSeek V4在代码能力上直接对标Claude 3.7 Sonnet；Kimi K2.6在长文本处理上甚至超过了GPT-5的某些版本；GLM-5.1在企业场景的工具调用能力上，已经和Anthropic的企业API打了个平手。

更重要的是，这三款模型发布之后，OpenRouter上的中国模型调用量直接起飞了。

1.2% → 60%，这条曲线最陡峭的部分，就是2026年3-4月。

Anthropic的报告，5月14日发布。

时间线对得上。

七、AI竞争的本质：不是"谁的模型强"，是"谁用得起"

说了这么多数据和报告，我想说的是一个更本质的问题。

过去几年，AI竞争的叙述一直是"军备竞赛"：谁的模型参数多，谁的算力强，谁的数据多，谁就赢。

但这个叙述，正在被OpenRouter的数据改写。

AI竞争的本质，正在从"谁的模型强"，变成"谁用得起、用得好"。

这是一个很微妙但很致命的转变。

"模型强"是一个技术叙事，它适合讲故事、适合融资、适合说服政策制定者。

"用得起、用得好"是一个商业叙事，它适合开发者、适合企业客户、适合市场份额。

中国AI模型正在赢得后一个叙事。

一个值得注意的使用场景变化

OpenRouter的数据还显示了一个很有意思的趋势：AI模型的使用场景正在发生结构性变化。

场景	2025年初占比	2026年最新占比	驱动因素
编程	~11%	>50%	长上下文+代码能力
角色扮演	~60%	~40%	被编程场景挤压
推理/数学	<5%	~10%	推理模型崛起

编程场景的爆发，意味着什么？

意味着AI模型正在从"玩具"变成"工具"。

角色扮演（聊天、陪聊、虚拟伴侣）是一个很赚钱的赛道，但它不是一个"刚需"赛道。编程是刚需。企业愿意为编程助手付钱，因为它真的能替代人力。

中国模型在编程场景上的突破（DeepSeek V4的LiveCodeBench 93.50分），是它们能够拿下OpenRouter 60%份额的核心驱动力。

八、写在最后：几个月之后呢？

Anthropic说"几个月"。

这个判断，有人觉得保守了，有人觉得客气了。

但我觉得，最重要的是这句话背后的信号：

美国AI行业，已经不再把"领先优势"当成理所当然了。

这份报告，表面上是写给政策制定者看的，实际上是在给整个行业敲警钟：

如果你还觉得"美国AI永远领先中国两年"，那你可能会错过这场竞争最精彩的部分。

OpenRouter的60%，是开发者用Token投出来的票。

它们投的不是一个模型，是一种预期：

中国AI，可能比所有人想象的都要快。