3000美元变100美元,一个中国AI模型让老外连夜卸载Claude Code
最近AI圈有个事儿,炸得老外连夜卸载Claude Code,论坛里全是“别用Claude了”的帖子。
不是因为别的,是因为一个中国AI模型,用不到三十分之一的成本,干翻了全球最强的编程AI。
3000美元变100美元,发生了什么?
先讲个真事儿。
一个叫Beau Johnson的开发者,本来每个月要付1000美元用Claude Opus 4.6搞编程。上个月换了GLM-5.1,账单直接从1000砍到30美元。
他做了什么操作?啥也没做。就是把后台模型从Claude换成了GLM-5.1,体验一模一样,钱省了97%。
另一个AI开发者toli更较真,直接拿GLM-5.1和Opus 4.6跑了113个编程任务。结论:体感完全一样。
注意,GLM-5.1给的是Claude Code三倍的用量,价格只有后者的三分之一。
三倍用量,三分之一价格。数学好的人已经算出来了——每块钱能买到的东西,差了9倍。
难怪toli直接在推特上说:“这是绝对的杀手级产品”。
海外网友已经开始吹起“弃用Claude Max”的风。Reddit、GitHub、Hacker News上到处是老外在问:“是不是该换GLM-5.1了?”
要知道,Claude Opus 4.6在过去几个月里一直是全球最强的公开AI编码模型,是无数程序员心目中的天花板。这个天花板,被一个中国开源模型给捅破了。
为什么说它不只是“追上”,而是“超越”?
你可能会想:又是一个AI刷榜的故事。
但GLM-5.1干的,不是刷分,是改规则。
先看硬数据——SWE-bench Pro基准测试。这个测试不是刷题,是真刀真枪:让AI在真实GitHub仓库里找Bug、修Bug,是衡量AI能不能胜任专业软件开发的“试金石”。
GLM-5.1拿了58.4分,全球第一。超过了Claude Opus 4.6(57.3分)、GPT-5.4(57.7分)、谷歌Gemini 3.1 Pro(54.2分)。
更狠的是,智谱还顺便把模型开源了。Anthropic藏着掖着不放出来的能力,GLM-5.1直接免费送。HuggingFace的CEO亲自站台,在X上说:SWE-Bench Pro里性能最强的模型开源了。
但GLM-5.1最让人服气的,不是跑分,而是干实事。
它有一个能力,以前的AI没有:能连续干活8小时。
以前的AI编程助手是问答式——你问一句,它答一句。GLM-5.1不一样。你给它一个需求,它自己规划、自己写代码、自己编译、自己修Bug、自己测试、自己优化。撞墙了换策略,出错了自己修。
举个实测例子:它花了14个小时,把一个CUDA内核优化从2.6倍加速比推到了35.7倍。人类资深工程师做这事儿,得几个月。
中间有个细节特别震撼:AI发现用高层框架性能到顶了,居然主动放弃,转向底层C++硬核重写。这是人类专家才有的判断力。
换句话说,以前你用的是“工具”,现在你有了一个能跟你并肩作战的同事。
这不是实验室里跑出来的数据,这是硅谷正在发生的现实
硅谷不是没人试,是试了之后在用脚投票。
知名播客主持人PeterYang在X上爆了个料:硅谷企业正在大量采用中国开源大模型。
说几个名字:Cursor的Composer 2用的是Kimi K2.5,Shopify换到Qwen一年省500万美元,就连Airbnb的CEO都公开夸Qwen。
更炸的是,Cognition的SWE-1.6被怀疑就是基于智谱GLM微调的。
图灵奖得主、AI教父Yann LeCun在这条爆料底下只回了一句话:“当然如此。”
硅谷网友自己都绷不住了:“硅谷花了两年把AI说得像登月一样,现在半个技术栈基本上就是‘披着中国开源模型的外衣’。”
全球开源模型第一、综合排名全球第三,LMArena平台上百万用户盲测出来的数据,由不得你不服。
最让人意外的一招:别人降价,它涨价
按理说,新产品上市,先降价抢市场对吧?
智谱不。
GLM-5.1发布同一天,OpenRouter数据显示智谱GLM再度提价10%。调价后,编程场景的Token价格已经接近Claude Sonnet 4.6的水平。
这是国产大模型第一次在核心场景和海外头部厂商价格对齐。
市场反应很有意思——不仅没跑,反而抢得更凶了。4月8日港股开盘,智谱股价一度涨近18%,触及925港元。
一年前国产大模型还在打价格战,动不动降价90%以上抢用户。现在GLM-5.1用实力证明了:好产品,配得上好价格。
还有一个细节,值得单独拿出来说
GLM-5.1的底子,是7440亿参数的MoE架构,每次推理只激活400多亿参数。
但比参数更重要的,是它怎么训练出来的。
全部基于华为昇腾芯片,没有一块英伟达。10万块华为昇腾910B,MindSpore框架,Layer级MoE绝对均衡,硬生生跑出了能和西方最前沿模型掰手腕的编码能力。
这意味着什么?从芯片到框架到模型,全链路自主可控的路子,第一次跑通了。
写在最后
GLM-5.1到底意味着什么?
它不是又一个刷榜的国产模型。它是第一个在软件工程这个硬核战场上,正面打败西方顶尖闭源模型的中国开源模型。
更关键的是,它把这件事变成了一个普惠的事情。
以前你要用最好的编程AI,得付高价,还被各种政策限制。现在最强的那一个,开源了,谁都能用。
国产AI第一、全球开源模型第一、首次超越Opus 4.6、连续工作8小时——这些热搜词背后,藏着一个更大的真相:
中国AI的“8小时工作制”已开启。
别人是回答问题,它是完成项目。当AI不再只是被动的工具,而是能独立思考和完成项目的工作伙伴,这场竞赛的规则已经被重写了。
这条路,比任何人预期的都要快。
夜雨聆风