本期要点速览
本期聚焦
Fable 5 下线后,AI 编程领域并未停滞,反而出现多种替代与优化方案:国产智谱推出号称最强的 GLM-5.2 编程模型,计划下周以 MIT 协议开源;OpenRouter 推出 Fusion API,以半价即可实现接近 Fable 的智能水平;开源项目 /architect 则采用分工模式,让 Fable 负责审稿、Codex 执行编码,将 token 消耗减少 80%。整体来看,顶级模型下线倒逼行业重新思考模型使用策略,明确高成本模型与高性价比方案的适用场景。
来源:智谱公众号 · 6月13日
6 月 13 日傍晚,智谱正式发布 GLM-5.2,称其为"迄今能力最强的开源模型"。核心看点:1M 上下文真正可用(不是 PPT 宣传的那种)、在长程任务中保持领先、被智谱定位为国产最强 Coding 模型。当日起面向 GLM Coding Plan 全量用户开放(覆盖 Lite / Pro / Max / 团队版),API 下周上线,模型下周正式开源,遵循 MIT 协议。
住的关注:Fable 5 被锁在墙里的当口,一个 MIT 协议开源的国产 Coding 模型全量开放,时间点太巧了。不管 GLM-5.2 的实际编码能力最终到底排第几,它给出了一条路径:你不需要依赖任何一个特定模型。MIT 协议意味着可以部署、微调、商用,这是供应链弹性最底层的保障。
链接仅供索引:https://mp.weixin.qq.com/s/LDrbtLM0wiCTJorvd5GY9w
二、/architect 项目:让 Fable 只做审稿人,Codex 干活,token 直接砍 80%
来源:GitHub @DanMcInerney · Hacker News 热门 · 6月13日
一个名为 architect-loop 的开源项目提出了一个直接的想法——在 AI 编程场景里,不是所有环节都需要最强模型。它把工作流拆成两层:Fable 负责协调和审核(做"架构师"),Codex 负责具体构建(做"工程师")。结果:Fable 的 token 消耗减少 80%,总成本大幅下降,且代码质量据称不受影响。
值得关注:这可能是 Fable 5 被限制访问后,社区给出的最实用的回应之一。"强模型审、弱模型写"这个模式很多人想过,但 /architect 把它做成了一个即插即用的开源项目。它说清楚了一件事:即使你有 Fable 5 的访问权限,也不该在所有环节都用它。好的 AI 编程工作流本质上是模型路由问题。而且审稿人换成别的强模型也能跑——不绑死任何一个供应商。
链接仅供索引:https://github.com/DanMcInerney/architect-loop
三、OpenRouter Fusion API:复合模型半价达到 Fable 级智能
来源:X @OpenRouter · 6月13日
OpenRouter 推出 Fusion API,宣传语很直白:市场最智能的复合模型,一半的价格达到 Fable 级别的智能。Fusion 不是单一模型,而是通过组合多个底层模型来实现能力等效——在路由层做文章,让每次推理选择最优的模型路径。
值得关注:又一个 Fable 5 的替代方案,但走的是另一条路——不是创造一个更强的单一模型,而是用复合模型架构来凑。它把"模型组合"从一种省钱技巧升级成了一个产品。如果 Fusion 真能做到 Fable 级能力 + 半价,那单模型为王的逻辑可能要翻页了。
链接仅供索引:https://x.com/OpenRouter/status/2065856853989270011
四、Claude Code v2.1.174-176:模型强制管理 + enforceAvailableModels
来源:Claude Code GitHub Releases · 6月13日
Claude Code 连续三个版本更新,最值得关注的是 v2.1.175 新增的 enforceAvailableModels 管理设置。启用后,不仅会限制哪些模型可用,连 Default 模型也会被约束——如果 Default 解析到被禁用的模型,自动回退到白名单里的第一个。用户或项目设置无法绕过管理端配置的模型白名单。此外还修复了环境变量绕过 availableModels 限制的漏洞(v2.1.176)。
值得关注:这其实是 Fable 5 事件的另一面。企业 IT 管理者现在面临一个问题:怎么确保开发者不去用那些被监管限制、或者成本失控的模型?Claude Code 给出的答案是把模型选择权从开发者手里收到管理端。这不是一个让人兴奋的功能,但在企业级 AI 编程工具里,这种"限制性功能"会越来越重要。
链接仅供索引:https://github.com/anthropics/claude-code/releases
五、SemiAnalysis Token 经济分析:$200 订阅能榨出 $14,000 的 API 用量
来源:IT之家 · SemiAnalysis · 6月13日
SemiAnalysis 买遍了 Anthropic 和 OpenAI 的全部订阅方案,模拟高强度编码任务直到触及每周上限。结论令人咋舌:月费 $200 的 Claude Max 20x 方案,按 API 定价换算最高可消耗约 $8,000 的 token;ChatGPT Pro 20x 方案对应约 $14,000。用户通过订阅可获得 40 到 70 倍的 API 价值。SemiAnalysis 同时指出,这种定价体系在重度用户持续榨满上限后可能难以长期维持。
值得关注:AI 编程的隐性成本比表面价格大得多。你用订阅还是 API,用哪个模型、在什么环节用,成本差 40 到 70 倍。这不是省钱小技巧,是做 AI 编程工具选型和团队预算规划时必须搞清楚的问题。Fable 5 被拔线之后,模型选型又多了一个维度——不是"哪个模型最好",是"哪个模型在哪种付费方式下最划算"。
链接仅供索引:https://www.ithome.com/0/962/509.htm
AI 从业者应提升的三个能力方向
一、AI编程的"模型路由"思维
/architect 教你把 Fable 当审稿人、Codex 当工人;Fusion API 教你把多个模型拼成一个用。两件事都在说同一句话:别再指望一个模型通吃所有环节。什么时候上最强模型、什么时候用便宜的、什么时候组合——这条路由逻辑比单个模型的 benchmark 分数重要得多。二、开源模型的"落地验证"体系
GLM-5.2 加 MiniMax M3 加 Kimi K2.7-Code 加 Qwen——国产开源 Coding 模型的选择已经不是有没有的问题,是选哪个的问题。benchmark 排名看个方向就够了,真正需要建起来的是一套你自己的验证流程:在你的代码库里、你的技术栈上、你日常写的那些任务类型里,它到底跑得怎么样。
三、编程工具的"定价套利"能力
【本文完】
免责声明:本文内容基于公开信息整理,仅供参考。涉及的技术产品、服务、价格等信息以官方发布为准。本文不代表任何企业或机构观点。
夜雨聆风