苹果把Claude.md打包进App,2026年开发者工具大战已经打完第一回合了

苹果把Claude.md打包进App，2026年开发者工具大战已经打完第一回合了

上个月底，安全研究员 Aaron 在苹果 Apple Support App v5.13 的安装包里翻出了两个不该存在的文件——CLAUDE.md 和 CLAUDE_GLOBAL.md。

这是 Claude Code 的项目配置文件，相当于告诉 AI “这个项目的代码规范是什么、架构怎么组织的、测试怎么跑”。一个市值四万亿的公司，把自家的 AI 编码指令直接塞进了用户手机里。

苹果 24 小时内紧急撤回。但互联网不忘记东西。

更妙的是，这已经是三个月内第二次类似的乌龙了。3 月底，Anthropic 自己发布 Claude Code npm 包时忘了剔除 source map 文件，51 万行 TypeScript 源码完整曝光。原因一模一样：发布打包时手滑。

如果说 Claude Code 源码泄露出的是 Anthropic 的内裤，那苹果这次泄露的就是——”看，我们也在用这家人的 AI 写代码”。

但比起八卦，更值得聊的是这件事背后那条汹涌的暗流：2026 年，AI 编码正在从”玩具”变成”基础设施”，速度比所有人预想的都快。

65 星到 6.5 万星，只用了四个月

来看看 GitHub 上发生了什么。

TradingAgents，一个用多智能体模拟对冲基金交易决策的开源框架，Star 数 65.9k。什么概念？它比 Vue.js 的一些子项目还火。架构上它模拟了一个完整的交易公司：基本面分析师看财报，情绪分析师扫社交媒体，技术分析师画 K 线图，然后牛熊双方向的研究员互相辩论，最后由风控和投资组合经理拍板。

七个 AI Agent 角色，各自用自己的大模型接口。支持 OpenAI、Claude、Gemini、DeepSeek、甚至本地 Ollama。

这不是唯一一个爆发的。Ruflo（前身叫 Claude Flow），一个专门给 Claude Code 做多智能体编排的平台，39.7k 星。它提供了 100 多个专用 Agent（编码、测试、安全、文档、架构），支持蜂群协作（层次型/Mesh/自适应），自学习智能（SONA 神经模式），HNSW 向量记忆库，32 个官方插件——甚至还搞了个零信任跨实例联邦协作，用 Ed25519 签名做身份认证。

开发者们正在用多 Agent 做金融交易、写代码、审安全、管运维。五个季度前还被嘲笑”Agent 只是玩具”的论断，已经被 6.5 万星踩在脚下。

大模型在 Coding 战场上的军备竞赛

Claude Code 引爆了一条赛道。它发布两个月后，月之暗面的 Kimi K2 开源，把”编码 + Agent”立为模型核心卖点。智谱 GLM-5 跟上。DeepSeek V4 在 SWE-bench Verified 上跑出 83.7%，超越 GPT-5.2 和 Claude Opus 4.5。Mistral 不甘寂寞，4 月 29 日发布 Medium 3.5——128B 参数，256k 上下文，SWE-bench 77.6%，支持远程 Agent 在云端异步跑编码任务。

这些数字在一年前是难以想象的。SWE-bench Verified 这个评测集衡量的不是”写一段排序算法”这种教科书问题，而是真实的 GitHub Issue——模型要理解一个不熟悉的开源项目，定位 bug，修改代码，跑测试，提交 PR。2025 年初，最高分不到 50%。2026 年中，前三名全部破 80%。

赛道逻辑很清楚：能做 Agentic Coding 的模型才有资格上牌桌。纯聊天模型已经不值得看了。

“DeepSeek 版 Claude Code” 和那条裂缝

2.3k 星的项目，名字直白到不需要解释——”DeepSeek-Cowork”，开源替代 Claude Code，专门针对 DeepSeek 优化。GitHub 上同类项目越来越多。

原因很简单：Claude Code 确实强，但 Anthropic 的 API 很贵，而且不接中国开发者。DeepSeek V4 编程能力在开源模型中登顶，一个 1.6 万亿参数的 MoE 模型，价格只有 GPT-5.5 的十分之一。开发者天然会流向成本更低、门槛更低的方案。

这不是零和博弈。Claude Code 定义了这个品类，但市场足够大，大到可以容纳多个生态位。苹果选择了 Claude Code 做内部工具，华为和中科大的 openJiuwen 在做全栈国产化编码 Agent，小红书刚成立了 AI 一级部门 Dots——每家都在选自己的桩。

被遗忘的角落：Zig 说不

但也不是所有人都兴奋。

4 月底，Zig 编程语言项目发布了一项严苛政策：全面禁止 LLM 辅助的代码贡献。禁止在 Issue 里用 AI 回复，禁止提交 AI 生成的 PR，甚至禁止用 AI 翻译评论。Zig 的核心论点是——LLM 不会学习，审查者花时间指导 AI 用户，但那名用户的能力并没有提高。长期来看，这会掏空社区的人才储备。

同一时间，Node.js 社区出现了要求 TSC 禁止 AI 代码进入核心库的请愿书，上百名开发者签名。Hacker News 上吵了几百楼。

这是一场关于”开源灵魂”的争论。效率派的说法是：你有病啊，AI 帮我十分钟写完了以前一天的活，你让我不用？保守派的说法是：十年后你的项目里全是没人能维护的 AI 代码，你开心吗？

两边都没错。但现实是，AI 辅助编码的渗透率已经不可逆了。一项针对 12 万开发者的调查显示，92.6% 每月至少用一次 AI 编码助手。这不是未来，这是现在。

三个趋势，一次说透

归纳一下现在这个节点，三个趋势值得盯：

第一，”能写代码”正在取代”能聊天”成为大模型的核心衡量标准。SWE-bench 就是新的 ImageNet。模型厂商不在这上面刷出好成绩，连发布会都不好意思开。

第二，Agent 架构从单 Agent 走向多 Agent 协作。TradingAgents 的对冲基金模拟、Ruflo 的蜂群编排、Mistral 的远程 Agent——都在走同一个方向：把任务拆碎，让多个 AI 角色配合干活。一个 Agent 做完丢给下一个，出错的地方有专门的 Agent 检查。

第三，成本和准入正在制造分流。Claude Code / Opus 4.6 对得起它的价格，但 DeepSeek V4 + 开源替代方案的组合正在吃掉长尾市场。2026 年底，编码工具链从付费到开源的光谱上，每一个价位段都会有至少一个 AI 编码选项。

不是结尾

苹果那两被删除的 CLAUDE.md 文件里写了些什么？有安全研究员做了内容恢复。苹果的编码规范中有一条要求格外有趣：”Never generate placeholder code or TODO comments—either implement it fully or leave it untouched.”（永远不要生成占位代码或者 TODO 注释——要么就完整实现，要么就不动它。）

这大概就是为什么苹果选择了这场豪赌。不是因为他们觉得 AI 写得好，而是因为他们相信，配上足够严格的规范，AI 可以写出他们不觉得丢人的代码。

你呢，你觉得这个规范有一天也能套在自己头上吗？