月省970美元!老外连夜卸载Claude Code,这款中国AI凭什么?

3000美元变100美元，一个中国AI模型让老外连夜卸载Claude Code

最近AI圈有个事儿，炸得老外连夜卸载Claude Code，论坛里全是“别用Claude了”的帖子。

不是因为别的，是因为一个中国AI模型，用不到三十分之一的成本，干翻了全球最强的编程AI。

3000美元变100美元，发生了什么？

先讲个真事儿。

一个叫Beau Johnson的开发者，本来每个月要付1000美元用Claude Opus 4.6搞编程。上个月换了GLM-5.1，账单直接从1000砍到30美元。

他做了什么操作？啥也没做。就是把后台模型从Claude换成了GLM-5.1，体验一模一样，钱省了97%。

另一个AI开发者toli更较真，直接拿GLM-5.1和Opus 4.6跑了113个编程任务。结论：体感完全一样。

注意，GLM-5.1给的是Claude Code三倍的用量，价格只有后者的三分之一。

三倍用量，三分之一价格。数学好的人已经算出来了——每块钱能买到的东西，差了9倍。

难怪toli直接在推特上说：“这是绝对的杀手级产品”。

海外网友已经开始吹起“弃用Claude Max”的风。Reddit、GitHub、Hacker News上到处是老外在问：“是不是该换GLM-5.1了？”

要知道，Claude Opus 4.6在过去几个月里一直是全球最强的公开AI编码模型，是无数程序员心目中的天花板。这个天花板，被一个中国开源模型给捅破了。

为什么说它不只是“追上”，而是“超越”？

你可能会想：又是一个AI刷榜的故事。

但GLM-5.1干的，不是刷分，是改规则。

先看硬数据——SWE-bench Pro基准测试。这个测试不是刷题，是真刀真枪：让AI在真实GitHub仓库里找Bug、修Bug，是衡量AI能不能胜任专业软件开发的“试金石”。

GLM-5.1拿了58.4分，全球第一。超过了Claude Opus 4.6（57.3分）、GPT-5.4（57.7分）、谷歌Gemini 3.1 Pro（54.2分）。

更狠的是，智谱还顺便把模型开源了。Anthropic藏着掖着不放出来的能力，GLM-5.1直接免费送。HuggingFace的CEO亲自站台，在X上说：SWE-Bench Pro里性能最强的模型开源了。

但GLM-5.1最让人服气的，不是跑分，而是干实事。

它有一个能力，以前的AI没有：能连续干活8小时。

以前的AI编程助手是问答式——你问一句，它答一句。GLM-5.1不一样。你给它一个需求，它自己规划、自己写代码、自己编译、自己修Bug、自己测试、自己优化。撞墙了换策略，出错了自己修。

举个实测例子：它花了14个小时，把一个CUDA内核优化从2.6倍加速比推到了35.7倍。人类资深工程师做这事儿，得几个月。

中间有个细节特别震撼：AI发现用高层框架性能到顶了，居然主动放弃，转向底层C++硬核重写。这是人类专家才有的判断力。

换句话说，以前你用的是“工具”，现在你有了一个能跟你并肩作战的同事。

这不是实验室里跑出来的数据，这是硅谷正在发生的现实

硅谷不是没人试，是试了之后在用脚投票。

知名播客主持人PeterYang在X上爆了个料：硅谷企业正在大量采用中国开源大模型。

说几个名字：Cursor的Composer 2用的是Kimi K2.5，Shopify换到Qwen一年省500万美元，就连Airbnb的CEO都公开夸Qwen。

更炸的是，Cognition的SWE-1.6被怀疑就是基于智谱GLM微调的。

图灵奖得主、AI教父Yann LeCun在这条爆料底下只回了一句话：“当然如此。”

硅谷网友自己都绷不住了：“硅谷花了两年把AI说得像登月一样，现在半个技术栈基本上就是‘披着中国开源模型的外衣’。”

全球开源模型第一、综合排名全球第三，LMArena平台上百万用户盲测出来的数据，由不得你不服。

最让人意外的一招：别人降价，它涨价

按理说，新产品上市，先降价抢市场对吧？

智谱不。

GLM-5.1发布同一天，OpenRouter数据显示智谱GLM再度提价10%。调价后，编程场景的Token价格已经接近Claude Sonnet 4.6的水平。

这是国产大模型第一次在核心场景和海外头部厂商价格对齐。

市场反应很有意思——不仅没跑，反而抢得更凶了。4月8日港股开盘，智谱股价一度涨近18%，触及925港元。

一年前国产大模型还在打价格战，动不动降价90%以上抢用户。现在GLM-5.1用实力证明了：好产品，配得上好价格。

还有一个细节，值得单独拿出来说

GLM-5.1的底子，是7440亿参数的MoE架构，每次推理只激活400多亿参数。

但比参数更重要的，是它怎么训练出来的。

全部基于华为昇腾芯片，没有一块英伟达。10万块华为昇腾910B，MindSpore框架，Layer级MoE绝对均衡，硬生生跑出了能和西方最前沿模型掰手腕的编码能力。

这意味着什么？从芯片到框架到模型，全链路自主可控的路子，第一次跑通了。

写在最后

GLM-5.1到底意味着什么？

它不是又一个刷榜的国产模型。它是第一个在软件工程这个硬核战场上，正面打败西方顶尖闭源模型的中国开源模型。

更关键的是，它把这件事变成了一个普惠的事情。

以前你要用最好的编程AI，得付高价，还被各种政策限制。现在最强的那一个，开源了，谁都能用。

国产AI第一、全球开源模型第一、首次超越Opus 4.6、连续工作8小时——这些热搜词背后，藏着一个更大的真相：
中国AI的“8小时工作制”已开启。

别人是回答问题，它是完成项目。当AI不再只是被动的工具，而是能独立思考和完成项目的工作伙伴，这场竞赛的规则已经被重写了。

这条路，比任何人预期的都要快。