
哈喽,大家!我是星河。
端午一过就到了6月下旬,这个月的魔幻程度超出了我的预期。
6月9日,Anthropic发布Claude Fable 5——发布会惊艳全场,基准测试碾压群雄,开发者社区一片欢呼,"地表最强AI"的帽子稳稳戴上。
6月12日,美国商务部工业与安全局(BIS)一纸命令,全球关停。理由是亚马逊的研究人员发现了一种"越狱"方法,可以绕过Fable 5的安全护栏。政府以国家安全为由,要求Anthropic立即切断所有外籍人士的访问——包括美国境内的外籍员工。
72小时。从"最强AI"到"谁都不能用"。
造这个模型的公司,连自己的外籍员工都被锁在了门外。Anthropic公开发声明:我们不同意,漏洞被夸大了。但执行了。因为你不执行,政府执行。
然后是十天的反复横跳。Anthropic高管多次飞华盛顿谈判。6月17日,Anthropic国际事务负责人在首尔放话:“我们非常有信心,模型将在未来几天内恢复。” 6月18日,美国国会两党议员联名致信商务部,质疑这道禁令的法律依据——用出口管制法来限制API访问?历史上没有先例。
但到我写这篇文章的时候,Fable 5和Mythos 5仍然处于全球关停状态。
说"几天内恢复"的人说了快一周了。没人知道明天会不会开,后天会不会又关。
这就是把最锋利的剑交给别人的代价——你连它什么时候会被收回去都不知道。
全球开发者慌了。但很多人没注意到——就在Fable 5倒下的同一周,一个来自清华的中国模型,正在悄悄接手它留下的真空。
1. 中国正在经历又一次AI时刻
6月21-22日,两家媒体在同一天聚焦中国AI,这本身就是一个信号。
《经济学人》的标题直接宣告——“China is having another AI moment”(中国正在经历又一次AI时刻)。文章的核心判断:美国对中国的AI领先优势,可能已经是一年多以来最小的。
《纽约时报》DealBook的标题更直白——“Is China Closing the A.I. Gap Faster Than Expected?”(中国是否比预期更快地缩小了AI差距?)
上一次被国际媒体这样定调是什么时候?2025年1月,DeepSeek R1发布——美国科技股应声暴跌,美国朝野震动,"AI行业的斯普特尼克时刻"这个词第一次出现在主流媒体上。
18个月后,这个叙事又来了。
只不过这一次,故事的主角从DeepSeek换成了智谱的GLM-5.2。
2. 从"模仿者"到"规则制定者"
先看硬数据。
GLM-5.2在Terminal-Bench 2.1上拿81.0分,Claude Opus 4.8是85.0,GPT-5.5是84.0。差距从以前的"断崖式"缩到了个位数。在SWE-bench Pro(真实代码修复)上,GLM-5.2的62.1分直接超过GPT-5.5。
但让硅谷真正坐不住的,是另一个测试。
Gizmochina的报道给出了一个令人震撼的对比:在跨平台创意编码和网页设计的基准测试中,GLM-5.2击败了Claude Fable 5,拿下第一名。
配备100万token上下文窗口。价格约百万输入、1.40/百万token输入、4.40输出——而Fable 5是10/50。
Business Insider深度拆解这个模型的文章里,一位曾任职于Meta、Google DeepMind和Microsoft的副总裁级别高管给出了这样的评价:
“First open model that passes the bar as a daily driver.” (第一个达到日常主力使用标准的开源模型。)
这不是一句客套话。这是行业里最了解对手能力的人,对一个中国开源模型给出的背书。
从模仿者到规则制定者——这个转变,就发生在这一个基准测试里。
GLM-5.2发布当天,智谱股价暴涨33%——而它的多数基准测试并没超过Opus 4.8。
这说明什么?
市场不再只为"最强"买单。市场在为"可获取的最强开源替代品"定价。
因为所有人都在算同一笔账:如果明天美国政府一纸命令关掉你的Claude访问,你的业务还能转吗?
G7峰会上,法国总统Macron推动了一个"可信伙伴"机制,要求美国共享AI模型。TechCrunch的总结一针见血:
“世界领袖想要美国的AI,但他们不想让美国有能力随时关掉它。”
这句话不只是说给国家元首的——是说给每个开发者的。
3. 半年前差距肉眼可见,现在我得仔细对比才能察觉
说说我自己的体感。
半年前,我的Agent体系底层主要跑在Claude上。那时候GLM-4和Claude的差距肉眼可见——复杂推理断线、长上下文偶尔"失忆"、代码生成的细节明显粗糙。
但从GLM-5到5.2,迭代速度把我打醒了。
同样是"让Agent自己拆解步骤、调用工具、交叉验证"这条流水线——半年前用Claude Code跑确实更丝滑。现在换GLM-5.2跑同样的任务,差距已经小到我得仔细对比才能察觉。
体感很直接。Claude的Coding Plan年费和GLM的年费,比例大约是10:1。当能力跨过"够用"那条线,价格差16倍就成了决定性因素。
这跟手机市场一模一样——苹果确实更好,但安卓把性价比打到极致之后,市场份额就是另一回事了。
AI编程正在经历自己的"安卓时刻"。
4. 5G → 芯片 → AI:同一把刀,换了三次靶子
但这不只是性价比的问题。这背后有一个更大的棋局。
这个剧本我们已经看过两遍了。
2019年,华为被列入实体清单。5G技术领先全球的结果,是被美国用半导体供应链一刀切断。"小院高墙"战略就此成型——既然技术上追不上,就用供应链卡死你。
然后是AI芯片。NVIDIA的H100、H200对华出口管制,算力被精准锁定。黄仁勋自己都说过:“中国AI芯片需求不会因制裁消失,只会催生替代品。”
2026年6月,刀又升级了。管制的对象从芯片(硬件)变成了模型(软件)。BIS第一次把一个商用AI模型的API访问列为出口管制物。
规律已经很清楚了——
5G被卡 → 芯片被卡 → 模型被卡。
同一个逻辑:当某个技术变成基础设施,掌握基础设施的一方就会把它武器化。
石油时代,谁控制了油管,谁就控制了地缘政治。
AI时代,谁控制了模型API,谁就控制了数字主权。
当AI成为新时代的石油,"关阀门"的权力比AI本身更可怕。
5. 但这一次,关不住
芯片可以被管制——工厂搬不走,光刻机无法复制。但AI模型是数字,可以下载、复制、分发。
智谱AI在Claude被禁的同一周,以MIT许可证把GLM-5.2完整权重往Hugging Face上一放,附了一句:
“前沿智能不应只属于少数人,也不应被少数规则随时收回。”
6. 中国AI的挑战者群像
讲真,GLM-5.2在开放推理和战略规划上,跟Claude和GPT还有差距。《经济学人》自己也指出了——中国模型可能存在"应试优化",私有测试里的差距比公开基准大。它强在编程和Agent工作流,不是全面碾压。
但放眼全局,中国AI已经形成了三个层级的挑战者群像。
芯片层,华为硬扛。 被列入实体清单六年,华为靠自研麒麟和昇腾硬是绕过了封锁。NVIDIA的H100对华管制,结果逼出了一整条国产算力替代链。
模型层,DeepSeek破壁。 2025年1月,DeepSeek R1发布,被国际媒体称为"AI行业的斯普特尼克时刻"。它的训练成本,只有同类美式模型的零头。美国科技股应声暴跌。
开源层,智谱卡位。 GLM-5.2用纯MIT许可证发布完整权重——给全球开发者一个"不会被关停"的选项。然后在创意编码测试里干翻Fable 5,坐上第一。
数据会说话。2024年底,中国开源模型在全球的份额只有1.2%。到2026年初,飙到了近30%。Hugging Face上,阿里Qwen系列的下载量已经超过Meta的Llama——美国开源旗舰,输给了中国开源旗舰。
18个月,中国AI走完了美国三年的路。
这些挑战者不需要在每个维度都超越美国。
它们只需要让"关阀门"的成本足够高,高到没人敢轻易动手。
这就是开源的终极意义——不只是技术选择,更是权力制衡。
2019年华为被卡脖子,很多人觉得中国科技要完。结果华为靠自研芯片交出了答案。
2025年DeepSeek发布,美国科技股应声暴跌。18个月后,《经济学人》说中美AI差距已是一年来最小。
2026年Claude被禁,很多人觉得美国AI霸权不可撼动。结果智谱用一份MIT许可证给出了另一种可能——然后在创意编码基准上赢了被禁的那个模型。
霸权的剧本一直在升级。但挑战者也一直在出现。
5G那一仗,华为扛过来了。
芯片那一仗,还在打。
AI这一仗,中国不再是单纯的追随者——而是棋盘上另一个执棋者。
当你的AI基础设施可以被一个电话关停,你有Plan B吗?
别等到被锁在门外那天,才想这个问题。
你怎么看?欢迎在评论区聊聊你的观察——这场AI霸权的牌局,你觉得下一张会是什么?
夜雨聆风