【☆】热点追踪 | 加更
先从这周的一条新闻讲起。
6 月 9 日,Anthropic(Claude 的公司)发布号称「地球最强」的新模型 Fable 5 和 Mythos 5。三天后,6 月 12 日下午,美国政府以「国家安全」为由,用一纸出口管制令把这两个模型「断网」。
禁令范围很宽:外国公民不能访问,连持 H-1B 签证、在美国为 Anthropic 工作、参与过模型开发的工程师,也不能再使用这两个模型。Anthropic 随后停掉了所有客户对 Fable 5 和 Mythos 5 的访问。
美国政府紧张的是 Mythos 的安全能力。官方透露,在「玻璃翼计划」这个受控项目里,Mythos 上线头几周就在重要软件里挖出超过 1 万个高危漏洞,还能在多个主流操作系统和浏览器里找到并利用零日漏洞。监管方担心这类能力被滥用。
美国把自家最强的 AI 锁进保险柜,只留给自己人。
同一周,中国两家公司照常把新模型放上货架。
同一周,两个国产模型照常开源
先把背景讲清楚,免得把这次开源读成临时反击。
月之暗面(Kimi)和智谱(GLM)本来就走开源路线。Kimi 的 K2 系列、GLM 的全系模型,都延续这个选择。所以这次两家接连开源,不是临时起意的「反击」,而是既定节奏。美国封杀 Fable 的新闻把两种路线摆到同一张桌上,差别一下子变得很清楚。
6 月 12 日,月之暗面发布并开源 Kimi K2.7 Code,一个专门练编程的模型。
6 月 13 日,智谱宣布 GLM-5.2 向全量用户开放,并预告下周以 MIT 协议开源。
美国把最强模型收进小圈子,中国厂商继续把模型放出来。两边差在长期路线,不只差在某个发布决定。智谱官方也把话说得很明白:前沿智能不应只属于少数人,也不应被少数规则随时收回。
接下来只看两个问题:Kimi K2.7 Code 到底强在哪,GLM-5.2 这次为什么值得关注。它们都围绕代码能力展开,但Kimi 主打效率,GLM 主打开放。
阅读时留个边界:Kimi 的数据来自官方公布,GLM-5.2 的部分性能还要等下周开源后让公开评测检验。

一、Kimi K2.7 Code:更会写代码,也更省 token
K2.7 Code 是专门练编程的模型,基于上一代 K2.6 构建。月之暗面说得很直接:非编程任务,还是推荐用能力更全面的 K2.6。它就是一个偏科生。
1. 少想一点,跑得更快
K2.7 Code 最值得看的升级,是它压住了推理模型的「过度思考」:简单问题不再绕出一大段思考过程,少花时间,也少烧 token。
官方给出的数据是:长程任务里,K2.7 Code 的思考 token 比 K2.6 少约 30%。它少转了几圈脑子,最后效果还更好。
用户能直接感到两件事:响应更快,账单更轻。模型不是想得越久越聪明,关键是把力气用在该想的地方。

2. 代码基准涨得很清楚
K2.7 Code 在几项代码基准上都比 K2.6 高,官方给出的幅度如下:
基准测试 | 提升幅度 | 考的是什么 |
Kimi Code Bench v2 | +21.8% | 代码能力 |
Program-Bench | +11% | 程序编写 |
MLS Bench Lite | +31.5% | 机器学习工程 |
Agent 自主执行类基准 | 约 +10% | 多步自动化能力 |
前三项看代码写得好不好,最后一项 Agent 基准(包括 Kimi Claw 24/7 Bench、MCP Atlas 等)看模型能不能调用工具、分多步把任务做完。代码底子变强,智能体任务也跟着受益。
3. 价格不变,高速版要来了
价格保持 K2.6 档位:每百万 token 标准输入 6.5 元、输出 27 元;命中缓存的输入 1.3 元。能力涨了,价格没涨。
更吸引开发者的是 6 月 15 日上线的高速版:同一个模型,输出速度约为普通版 5-6 倍,常规编程场景约 180 Token/秒,短上下文可到 260 Token/秒。官方把它概括成“6 倍速度,仅需 2 倍价格”。
使用时记住一个限制:K2.7 Code 必须打开「思考模式」。Kimi API 和 Kimi Code 默认开启;你手动关掉后,API 会报错,Kimi Code 会回退到 K2.6。
二、GLM-5.2:重点是把能力放出来
GLM-5.2 的看点不在某个单项跑分,而在开放方式:智谱要把它给全量用户用,并按 MIT 协议开源。
补个背景:GLM 是智谱的大模型系列,主攻编程和长程智能体任务。它迭代很快:2 月 GLM-5、3 月 GLM-5.1、6 月 GLM-5.2,三个月三个版本。
1. 1M 上下文,重点是可用
智谱这次强调 GLM-5.2 支持 100 万 token(1M)超长上下文。很多模型能把长文本塞进去,真正难的是读完之后还记得住、调得出。
放到 AI 编程和智能体任务里,这个能力很实际:模型可以一次读更大的代码仓库、更长的需求文档和更复杂的任务链路。多文件修改、长程调试会少掉一些断片。
2. MIT 开源,企业能拿回自己服务器
GLM-5.2 延续 GLM-5 系列的 MIT 开源协议。模型权重下周发布后,开发者可以下载、部署、商用,也可以改。
企业最看重这一点。闭源模型(比如 Claude、GPT)只能调 API,数据要发出去;MIT 开源模型可以放进自家服务器,数据留在内网,模型也能按业务改。

3. 全量开放,分四个版本
6 月 13 日晚起,GLM-5.2 面向 GLM Coding Plan 全量用户开放,覆盖 Lite、Pro、Max 和团队版。API 和开源安排在下周。
性能部分先保守看。智谱称 GLM-5.2 是「迄今能力最强的开源模型」,长程任务继续领先;详细 benchmark 还没公布,要等开源后的公开评测。内测用户提到「体感和 Opus 4.5 差不多」,这只能当使用感受,不能当正式跑分。
可以拿上一代 GLM-5.1 作参照:744B 参数 MoE 架构,每次激活约 40B;SWE-bench Verified 77.8%,当时处在开源模型前列。它还完全基于国产华为昇腾芯片训练,在千亿级模型里很少见。GLM-5.2 是这条线上的继续迭代。
三、两个模型怎么选?
放在一起看,两个模型的定位差得很明显:
对比维度 | Kimi K2.7 Code | GLM-5.2 |
定位 | 编程专用模型 | 编程/智能体通用基座 |
本次重点 | 效率:少想 30%、代码更强 | 开放:全量可用 + MIT 开源 |
上下文 | 跟 K2 系列体系一致 | 1M(官方强调“真正可用”) |
是否开源 | 是(Hugging Face) | 是(下周,MIT 协议) |
非编程任务 | 官方推荐改用 K2.6 | 通用基座,涵盖面更广 |
适合谁 | 专注写代码的开发者 | 要本地部署/要改模型的团队 |
如果你天天写代码、看重速度和成本,K2.7 Code 值得先试;如果你要本地部署、数据不能外传,或者想在模型上二次开发,GLM-5.2 更合适。

四、这周的三个信号
1. 国产模型开始拼细节
早期大家抢「谁更强」,现在开始抢更具体的体验。Kimi 抠 token 效率和输出速度,GLM 抠开放程度和部署门槛。国产模型厂商已经不只堆参数,也在为真实开发流程补短板。
2. 开源仍是国产模型的关键牌
两个模型都继续开源。同一周,美国因为 Fable 5、Mythos 5 能力太强,封掉外国用户访问。国产模型则用「开源 + 低价」把门打开。开发者要的是可控性,开源模型能减少这种不确定性。
3. 专业化路线更清楚了
Kimi 单独拿出「编程专用」型号,非编程场景仍然推荐 K2.6。模型厂商也在承认一个现实:一个模型很难在所有场景都做到最好,针对场景做优化更有效。这一点和 Anthropic「Fable + Mythos」双模型思路可以放在一起看。

写在最后
这一周很像一张对照表:美国把自家最强 AI 收进保险柜,中国两家模型厂商继续把门打开。
美国有自己的现实顾虑,Mythos 的确能挖出大量高危漏洞。结果摆在眼前:一条路线走向管控,另一条路线继续开放。
对普通开发者和中小团队来说,开源的好处很实在:你不用担心哪天一纸命令断掉正在用的模型;你可以把模型放到自己的服务器,数据不出门;可选模型变多,价格也继续往下走。
回到模型选择:Kimi 拼效率,GLM 拼开放。跑分和官方宣传只能当参考,真正要看它们在你自己的任务里顺不顺手。GLM-5.2 的完整性能,还要等下周开源后的公开评测。
本期术语卡片
过度思考Overthinking 推理模型的一种常见毛病:简单问题也拉出很长的思考过程,拖慢速度,也多花 token。K2.7 Code 在长程任务里把思考 token 减少约 30%。 |
思考模式Thinking Mode 模型回答前先展开推理的一种模式,适合复杂任务。K2.7 Code 必须开启思考模式;关掉后,API 会报错,Kimi Code 会回退到旧模型。 |
1M 上下文1M Context Window 模型一次可读取 100 万 token(约几十万中文字)。难点不只是塞进去,而是读完后还能准确理解和调用,不「失忆」。 |
MIT 协议MIT License MIT 是很宽松的开源许可证,开发者可以下载、修改、部署、商用。GLM-5.2 采用 MIT 协议后,企业可以把模型放进自家服务器,数据不出门。 |
关注「AI奇妙实验室」 每天一篇,陪你看懂 AI 新变化 |
【评论】你更看好哪条路线:拼效率的 Kimi,还是拼开放的 GLM?评论区聊聊。 |
夜雨聆风