
【十字路口导读】6 月 13 日下午 5 点 21 分,智谱把新旗舰 GLM-5.2 推给了所有 GLM Coding Plan 用户,承诺下周在 MIT 协议下把模型权重彻底公开。同一天,大洋彼岸的 Claude Fable 5 因一道行政令全球下线。一家把最强模型收回保险柜,另一家把旗舰代码摊在桌上。1M 上下文、744B 参数、训练全程没用一片英伟达芯片——这是智谱四个月里的第三次旗舰升级,速度和定价策略却悄悄变了味。

智谱这次发布的节奏快得不正常。GLM-5 在今年 2 月 11 日发布,是国产 AI 公司里第一个公开的前沿级模型;3 月 GLM-5.1 接力,成为第一个在 SWE-Bench Pro 上击败所有闭源模型的开源模型;6 月 13 日,GLM-5.2 上线。算下来,四个月里换了三次旗舰,平均每四十多天一次大版本。
对比一下硅谷的节奏。OpenAI 的 GPT 系列从 GPT-4 到 GPT-5 用了两年多,Anthropic 的 Claude 从 Opus 4 到 Fable 5 也跨了多个季度。智谱把旗舰更新压到季度级别,背后是两条腿走路:一边是华为昇腾芯片的算力稳定供给,一边是把「长程任务」当成核心卖点反复打磨。
所谓长程任务,指的是让模型连续工作数小时、调用成百上千次工具而不跑偏的能力。GLM-5.1 官方说能独立跑满 8 小时,GLM-5.2 在此基础上加了两个思考档位:High 和 Max,写代码建议直接上 Max,让模型多想几步再动手。这个设计直接对标 Claude Code 里 effort 的分级思路。
这次升级最硬的一个数字是上下文。GLM-5.1 的窗口是 200K token,GLM-5.2 直接拉到 1M(一百万 token),整整五倍。一百万 token 大约能装下整个 Linux 内核源码,或者几十本长篇小说。对做大型代码重构、跨多文件改 bug 的人来说,这意味着不用再频繁裁剪上下文。
但真正的悬念不在数字本身,而在速度——下一节说。
独立测评机构 BridgeBench 在 GLM-5.2 上线当天就跑了测试,结论很直接:速度比 GLM-5.1 快 3 倍,在 BridgeBench 速度榜上排到第四。这是国产开源模型第一次在「快」这个维度上挤进全球前列。

速度对写代码的人来说不是噱头,是实实在在的钱。一个 agent 任务动辄调用上百次模型,每次推理慢一秒,整个会话就拖几分钟。智谱在 5 月已经发布了 GLM-5.1 高速版,输出速度做到 400 tokens/s,GLM-5.2 在这个基础上又往前蹿了一截。BridgeBench 的原话是「我们对这个飞跃非常惊讶」。
第三方开发者的实测也在印证。vibe coding 圈的 BridgeMind 创始人付费开了 Pro 计划,用 GLM-5.2 实测了三个项目:一个恐怖屋游戏、一个 3D 潜行游戏、一个 Remotion 营销视频,结论是速度表现非常亮眼。有国内用户用了两小时后反馈,某些指令比 Qwen 3.7 Max 更全面,代码输出质量上乘。
需要说明的是,目前还没有公开的 SWE-Bench Pro、LiveCodeBench 这类权威榜单成绩。智谱这次发布没带任何官方 benchmark,BridgeBench 是目前唯一可见的第三方数据。一个旗舰模型不带成绩单就上线,要么是底气十足,要么是想让市场先用脚投票。
能确定的是,「快」正在取代「聪明」,成为这一轮模型比拼的新主轴。
GLM-5.2 的开源承诺很彻底——下周权重放出来,MIT 协议,谁都能拿去改、去卖、去商用,不收一分钱授权费。MIT 是开源界最宽松的协议之一,比 Meta 给 Llama 的协议还松,这也是智谱一贯的路子:GLM-5、GLM-5.1、GLM-5.2 三代全 MIT。
但「模型免费」不等于「用模型免费」。想立刻上手 GLM-5.2,唯一通道是 GLM Coding Plan 订阅,而且价格悄悄涨了。Pro 计划现在每月约 65 美元,去年同期还不到 35 美元,将近翻倍。更关键的是智谱引入了分时段倍率:高峰期消耗乘 3、平峰乘 2,目前 6 月底前有促销降到 1 倍,促销一过,同样的任务算下来可能贵三倍。
这是国内模型厂商第一次大规模用「时段倍率」来管算力。云厂商的流量分时定价不新鲜,但放在按 token 计费的 AI 模型上,等于明告诉用户:算力是稀缺品,想稳定用就得错峰,或者加钱。对个人开发者影响不大,对把 GLM 接进自家产品、跑量生产的团队来说,这是一笔要重新算的账。
智谱还顺带把生态铺得很满。GLM-5.2 原生支持 Claude Code、Cursor、Cline、Trae、Kilo Code 等主流编码工具,配置文件里改一行环境变量就能切过去。这意味着习惯了 Claude Code 工作流的开发者,几乎零成本就能把底层模型换成 GLM-5.2——这恰恰是 Anthropic 这次被下线波及的那批用户。
开源免费做口碑,订阅加时段倍率做现金流,这套组合拳的下一个问题是:换来的用户能留住多少。
这次发布最值得咀嚼的不是参数,是话术。智谱在官宣里写了一句:「在一些前沿模型突然变得不可用的时刻,智谱选择相信另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。」话没点名,但谁都听得出来指的是谁。

6 月 13 日这天,Anthropic 的 Claude Fable 5 因美国行政令全球停服,智谱在同一天把旗舰开源。一个收回,一个放出,时间点卡得几乎是刻意为之。这不再是一次普通的产品迭代,而是一次借势的定位战——把自己摆在「开放、可用、不被规则随时收回」的那一边。
对普通读者来说,这场中美 AI 的反差正在变得具体。过去大家比的是谁的模型分更高,现在分出了两条路线:一条是闭源、强管控、靠行政令护城;另一条是开源、可自托管、训练链路连英伟达芯片都不依赖。智谱 GLM-5 系列从训练到部署全程用华为昇腾,零英伟达依赖,这条供应链自主性在当下地缘环境里是硬资产。
风险也很清楚。开源模型的可控性天然弱于闭源,MIT 协议下谁都能拿去改,安全责任无法像闭源那样由单一公司兜底。Fable 5 被禁的导火索恰恰是越狱风险,GLM-5.2 走完全相反的路,把权重交给所有人,等于把红队的活也分摊给了社区。这条路能不能走通,要看智谱自己的安全预案跟不跟得上扩散速度。
下周 API 和开源权重一放出,真正的考验才开始:当全世界都能免费拿到这个 744B 的旗舰,是会有更多人用它造东西,还是会有更多人拿它钻空子。智谱押的是前者。
本文由AI辅助创作,人工编辑全程主导选题、事实核查与编辑判断。

夜雨聆风