当最强 AI 被关进保险柜,也有人继续把模型摆上开源货架:GLM-5.2 与 Kimi K2.7 Code 解读

【☆】热点追踪 | 加更

先从这周的一条新闻讲起。

6 月 9 日，Anthropic（Claude 的公司）发布号称「地球最强」的新模型 Fable 5 和 Mythos 5。三天后，6 月 12 日下午，美国政府以「国家安全」为由，用一纸出口管制令把这两个模型「断网」。

禁令范围很宽：外国公民不能访问，连持 H-1B 签证、在美国为 Anthropic 工作、参与过模型开发的工程师，也不能再使用这两个模型。Anthropic 随后停掉了所有客户对 Fable 5 和 Mythos 5 的访问。

美国政府紧张的是 Mythos 的安全能力。官方透露，在「玻璃翼计划」这个受控项目里，Mythos 上线头几周就在重要软件里挖出超过 1 万个高危漏洞，还能在多个主流操作系统和浏览器里找到并利用零日漏洞。监管方担心这类能力被滥用。

美国把自家最强的 AI 锁进保险柜，只留给自己人。

同一周，中国两家公司照常把新模型放上货架。

同一周，两个国产模型照常开源

先把背景讲清楚，免得把这次开源读成临时反击。

月之暗面（Kimi）和智谱（GLM）本来就走开源路线。Kimi 的 K2 系列、GLM 的全系模型，都延续这个选择。所以这次两家接连开源，不是临时起意的「反击」，而是既定节奏。美国封杀 Fable 的新闻把两种路线摆到同一张桌上，差别一下子变得很清楚。

6 月 12 日，月之暗面发布并开源 Kimi K2.7 Code，一个专门练编程的模型。

6 月 13 日，智谱宣布 GLM-5.2 向全量用户开放，并预告下周以 MIT 协议开源。

美国把最强模型收进小圈子，中国厂商继续把模型放出来。两边差在长期路线，不只差在某个发布决定。智谱官方也把话说得很明白：前沿智能不应只属于少数人，也不应被少数规则随时收回。

接下来只看两个问题：Kimi K2.7 Code 到底强在哪，GLM-5.2 这次为什么值得关注。它们都围绕代码能力展开，但Kimi 主打效率，GLM 主打开放。

阅读时留个边界：Kimi 的数据来自官方公布，GLM-5.2 的部分性能还要等下周开源后让公开评测检验。

一、Kimi K2.7 Code：更会写代码，也更省 token

K2.7 Code 是专门练编程的模型，基于上一代 K2.6 构建。月之暗面说得很直接：非编程任务，还是推荐用能力更全面的 K2.6。它就是一个偏科生。

1. 少想一点，跑得更快

K2.7 Code 最值得看的升级，是它压住了推理模型的「过度思考」：简单问题不再绕出一大段思考过程，少花时间，也少烧 token。

官方给出的数据是：长程任务里，K2.7 Code 的思考 token 比 K2.6 少约 30%。它少转了几圈脑子，最后效果还更好。

用户能直接感到两件事：响应更快，账单更轻。模型不是想得越久越聪明，关键是把力气用在该想的地方。

2. 代码基准涨得很清楚

K2.7 Code 在几项代码基准上都比 K2.6 高，官方给出的幅度如下：

基准测试	提升幅度	考的是什么
Kimi Code Bench v2	+21.8%	代码能力
Program-Bench	+11%	程序编写
MLS Bench Lite	+31.5%	机器学习工程
Agent 自主执行类基准	约 +10%	多步自动化能力

前三项看代码写得好不好，最后一项 Agent 基准（包括 Kimi Claw 24/7 Bench、MCP Atlas 等）看模型能不能调用工具、分多步把任务做完。代码底子变强，智能体任务也跟着受益。

3. 价格不变，高速版要来了

价格保持 K2.6 档位：每百万 token 标准输入 6.5 元、输出 27 元；命中缓存的输入 1.3 元。能力涨了，价格没涨。

更吸引开发者的是 6 月 15 日上线的高速版：同一个模型，输出速度约为普通版 5-6 倍，常规编程场景约 180 Token/秒，短上下文可到 260 Token/秒。官方把它概括成“6 倍速度，仅需 2 倍价格”。

使用时记住一个限制：K2.7 Code 必须打开「思考模式」。Kimi API 和 Kimi Code 默认开启；你手动关掉后，API 会报错，Kimi Code 会回退到 K2.6。

二、GLM-5.2：重点是把能力放出来

GLM-5.2 的看点不在某个单项跑分，而在开放方式：智谱要把它给全量用户用，并按 MIT 协议开源。

补个背景：GLM 是智谱的大模型系列，主攻编程和长程智能体任务。它迭代很快：2 月 GLM-5、3 月 GLM-5.1、6 月 GLM-5.2，三个月三个版本。

1. 1M 上下文，重点是可用

智谱这次强调 GLM-5.2 支持 100 万 token（1M）超长上下文。很多模型能把长文本塞进去，真正难的是读完之后还记得住、调得出。

放到 AI 编程和智能体任务里，这个能力很实际：模型可以一次读更大的代码仓库、更长的需求文档和更复杂的任务链路。多文件修改、长程调试会少掉一些断片。

2. MIT 开源，企业能拿回自己服务器

GLM-5.2 延续 GLM-5 系列的 MIT 开源协议。模型权重下周发布后，开发者可以下载、部署、商用，也可以改。

企业最看重这一点。闭源模型（比如 Claude、GPT）只能调 API，数据要发出去；MIT 开源模型可以放进自家服务器，数据留在内网，模型也能按业务改。

3. 全量开放，分四个版本

6 月 13 日晚起，GLM-5.2 面向 GLM Coding Plan 全量用户开放，覆盖 Lite、Pro、Max 和团队版。API 和开源安排在下周。

性能部分先保守看。智谱称 GLM-5.2 是「迄今能力最强的开源模型」，长程任务继续领先；详细 benchmark 还没公布，要等开源后的公开评测。内测用户提到「体感和 Opus 4.5 差不多」，这只能当使用感受，不能当正式跑分。

可以拿上一代 GLM-5.1 作参照：744B 参数 MoE 架构，每次激活约 40B；SWE-bench Verified 77.8%，当时处在开源模型前列。它还完全基于国产华为昇腾芯片训练，在千亿级模型里很少见。GLM-5.2 是这条线上的继续迭代。

三、两个模型怎么选？

放在一起看，两个模型的定位差得很明显：

对比维度	Kimi K2.7 Code	GLM-5.2
定位	编程专用模型	编程/智能体通用基座
本次重点	效率：少想 30%、代码更强	开放：全量可用 + MIT 开源
上下文	跟 K2 系列体系一致	1M（官方强调“真正可用”）
是否开源	是（Hugging Face）	是（下周，MIT 协议）
非编程任务	官方推荐改用 K2.6	通用基座，涵盖面更广
适合谁	专注写代码的开发者	要本地部署/要改模型的团队

如果你天天写代码、看重速度和成本，K2.7 Code 值得先试；如果你要本地部署、数据不能外传，或者想在模型上二次开发，GLM-5.2 更合适。

四、这周的三个信号

1. 国产模型开始拼细节

早期大家抢「谁更强」，现在开始抢更具体的体验。Kimi 抠 token 效率和输出速度，GLM 抠开放程度和部署门槛。国产模型厂商已经不只堆参数，也在为真实开发流程补短板。

2. 开源仍是国产模型的关键牌

两个模型都继续开源。同一周，美国因为 Fable 5、Mythos 5 能力太强，封掉外国用户访问。国产模型则用「开源 + 低价」把门打开。开发者要的是可控性，开源模型能减少这种不确定性。

3. 专业化路线更清楚了

Kimi 单独拿出「编程专用」型号，非编程场景仍然推荐 K2.6。模型厂商也在承认一个现实：一个模型很难在所有场景都做到最好，针对场景做优化更有效。这一点和 Anthropic「Fable + Mythos」双模型思路可以放在一起看。

写在最后

这一周很像一张对照表：美国把自家最强 AI 收进保险柜，中国两家模型厂商继续把门打开。

美国有自己的现实顾虑，Mythos 的确能挖出大量高危漏洞。结果摆在眼前：一条路线走向管控，另一条路线继续开放。

对普通开发者和中小团队来说，开源的好处很实在：你不用担心哪天一纸命令断掉正在用的模型；你可以把模型放到自己的服务器，数据不出门；可选模型变多，价格也继续往下走。

回到模型选择：Kimi 拼效率，GLM 拼开放。跑分和官方宣传只能当参考，真正要看它们在你自己的任务里顺不顺手。GLM-5.2 的完整性能，还要等下周开源后的公开评测。

本期术语卡片

过度思考Overthinking

推理模型的一种常见毛病：简单问题也拉出很长的思考过程，拖慢速度，也多花 token。K2.7 Code 在长程任务里把思考 token 减少约 30%。

思考模式Thinking Mode

模型回答前先展开推理的一种模式，适合复杂任务。K2.7 Code 必须开启思考模式；关掉后，API 会报错，Kimi Code 会回退到旧模型。

1M 上下文1M Context Window

模型一次可读取 100 万 token（约几十万中文字）。难点不只是塞进去，而是读完后还能准确理解和调用，不「失忆」。

MIT 协议MIT License

MIT 是很宽松的开源许可证，开发者可以下载、修改、部署、商用。GLM-5.2 采用 MIT 协议后，企业可以把模型放进自家服务器，数据不出门。

关注「AI奇妙实验室」

每天一篇，陪你看懂 AI 新变化

【评论】你更看好哪条路线：拼效率的 Kimi，还是拼开放的 GLM？评论区聊聊。