一、一句话,炸翻了整个AI圈
2026年5月14日,Anthropic发布了一份名为《2028:全球AI领导力的两种情景》的政策报告。
这份报告里,有一句话让整个行业都安静了。
原话是这么说的:
"US frontier systems are estimated to be at least several months ahead of the top models from PRC AI labs."
翻译过来就是:美国前沿系统估计比中国AI实验室的顶级模型至少领先"几个月"。
"几个月"。
不是"几年",不是"代差",甚至不是"显著领先",就是"几个月"。
如果你关注AI行业足够久,你会知道这句话的分量。两年前,美国AI圈对中国模型的普遍态度是"follower",是"抄袭者",是"不可同日而语"。
现在,Anthropic——这家由OpenAI前核心成员创立、被认为是美国AI"安全派"旗帜的公司——亲口说出了"几个月"。
这不是谦虚,这是警告。
二、数据不会说谎:OpenRouter上的"无声投票"
Anthropic为什么突然"急了"?答案藏在OpenRouter的数据里。
OpenRouter是一个AI模型聚合平台,开发者可以在上面调用各种大模型API。它的独特价值在于:它记录了多少Token被哪些模型消耗了——这是全球开发者"用脚投票"的最真实数据。
2024年底,中国AI模型在OpenRouter上的调用量占比是多少?
1.2%。
基本可以忽略不计。那时候,行业共识是:闭源模型(OpenAI、Anthropic、Google)主导一切,中国模型"能看不能用"。
然后,事情开始变了。
2025年中,DeepSeek R1发布,开源潮兴起。中国模型在OpenRouter的占比爬到了13%,峰值接近30%。
2026年5月,最新的数据是:
超过60%。
是的,一年半的时间,从1.2%到60%+。中国AI模型在OpenRouter上的调用量,已经超过了所有美国模型的总和。
具体数字更有冲击力
看一组2026年5月11-17日这一周的数据(来源:每日经济新闻,基于OpenRouter数据):
中国AI大模型的周调用量,已经是美国的1.81倍。
而且,这已经是连续三周稳居全球首位了。
周榜上的名字,你可能已经很熟悉了
OpenRouter每周都会发布调用量排行榜。2026年5月的榜单上,排名前三的是:
腾讯 Hy3 preview (free) —— 2.68万亿Token Kimi K2.6 —— 1.61万亿Token DeepSeek-V4-Flash —— 新入榜
后面还有DeepSeek-V3.2、智谱GLM-5.1等等。
这些名字有两个共同点:
都是中国模型 都是最近三个月内发布的
换句话说,中国AI模型不是"突然崛起"的,它们是在三个月内集中爆发的。
三、9倍:一场静悄悄的成本革命
数据说完了,再说钱。
AI模型的调用是按Token计费的。你往模型里塞多少词,它吐出来多少词,加起来算钱。
在这个游戏规则下,中国模型做了一个很"不讲武德"的事情:
它们把价格打到了地板价。
来看一组对比(数据来源:OpenRouter价格数据 + aistackchoice.com):
| 约38x性价比 |
关键结论来了:
完成相同的工作负载,Claude的成本是 cheapest Chinese alternative 的9倍。
9倍。
这不是"稍微贵一点",这是一个在用奢侈品,一个在用成本价。
四、模型的估值
2026年5月20日,CNBC发了一篇报道,标题很直接:
"Cheap AI could derail OpenAI and Anthropic's IPOs" (廉价AI可能破坏OpenAI和Anthropic的IPO计划)
这篇文章的逻辑很简单:
中国模型成本低 → 开发者开始迁移 OpenAI和Anthropic的市场份额受压 资本市场对"AI垄断溢价"的信心动摇 IPO估值下调,甚至推迟
现在,这个叙事被两件事同时冲击了:
中国模型在OpenRouter拿下60%份额(市场份额在流失) Anthropic自己承认"只领先几个月"(技术护城河没那么深)
五、Anthropic的2028焦虑:两条路,一个选择
回到Anthropic那份报告。
"几个月"那句话,只是报告的引言。报告的核心,是在推演2028年的两种情景。
情景一:美国守住领先
条件:
收紧出口管制 阻断蒸馏攻击(distillation attack) 推动盟友采用美国AI
结果:
美国保持12-24个月领先 美国制定AI规则
情景二:中美并驾齐驱
条件:
政策漏洞没有堵住 中国接近前沿
结果:
中美AI能力持平 政府影响AI规则制定
六、为什么是现在?三个模型的"三月突击"
Anthropic为什么在2026年5月"突然"着急了?
一个很重要的背景是:2026年3月到4月,中国AI实验室来了一次"集中爆发"。
三款旗舰模型,几乎同时发布:
| DeepSeek V4/V3.2 | |||
| Kimi K2.6 | |||
| GLM-5.1 |
这三款模型有一个共同点:它们不是在"追赶",它们是在"对标"。
DeepSeek V4在代码能力上直接对标Claude 3.7 Sonnet;Kimi K2.6在长文本处理上甚至超过了GPT-5的某些版本;GLM-5.1在企业场景的工具调用能力上,已经和Anthropic的企业API打了个平手。
更重要的是,这三款模型发布之后,OpenRouter上的中国模型调用量直接起飞了。
1.2% → 60%,这条曲线最陡峭的部分,就是2026年3-4月。
Anthropic的报告,5月14日发布。
时间线对得上。
七、AI竞争的本质:不是"谁的模型强",是"谁用得起"
说了这么多数据和报告,我想说的是一个更本质的问题。
过去几年,AI竞争的叙述一直是"军备竞赛":谁的模型参数多,谁的算力强,谁的数据多,谁就赢。
但这个叙述,正在被OpenRouter的数据改写。
AI竞争的本质,正在从"谁的模型强",变成"谁用得起、用得好"。
这是一个很微妙但很致命的转变。
"模型强"是一个技术叙事,它适合讲故事、适合融资、适合说服政策制定者。
"用得起、用得好"是一个商业叙事,它适合开发者、适合企业客户、适合市场份额。
中国AI模型正在赢得后一个叙事。
一个值得注意的使用场景变化
OpenRouter的数据还显示了一个很有意思的趋势:AI模型的使用场景正在发生结构性变化。
| >50% | |||
编程场景的爆发,意味着什么?
意味着AI模型正在从"玩具"变成"工具"。
角色扮演(聊天、陪聊、虚拟伴侣)是一个很赚钱的赛道,但它不是一个"刚需"赛道。编程是刚需。企业愿意为编程助手付钱,因为它真的能替代人力。
中国模型在编程场景上的突破(DeepSeek V4的LiveCodeBench 93.50分),是它们能够拿下OpenRouter 60%份额的核心驱动力。
八、写在最后:几个月之后呢?
Anthropic说"几个月"。
这个判断,有人觉得保守了,有人觉得客气了。
但我觉得,最重要的是这句话背后的信号:
美国AI行业,已经不再把"领先优势"当成理所当然了。
这份报告,表面上是写给政策制定者看的,实际上是在给整个行业敲警钟:
如果你还觉得"美国AI永远领先中国两年",那你可能会错过这场竞争最精彩的部分。
OpenRouter的60%,是开发者用Token投出来的票。
它们投的不是一个模型,是一种预期:
中国AI,可能比所有人想象的都要快。
夜雨聆风