苹果把Claude.md打包进App,2026年开发者工具大战已经打完第一回合了
苹果把Claude.md打包进App,2026年开发者工具大战已经打完第一回合了
上个月底,安全研究员 Aaron 在苹果 Apple Support App v5.13 的安装包里翻出了两个不该存在的文件——CLAUDE.md 和 CLAUDE_GLOBAL.md。
这是 Claude Code 的项目配置文件,相当于告诉 AI “这个项目的代码规范是什么、架构怎么组织的、测试怎么跑”。一个市值四万亿的公司,把自家的 AI 编码指令直接塞进了用户手机里。
苹果 24 小时内紧急撤回。但互联网不忘记东西。
更妙的是,这已经是三个月内第二次类似的乌龙了。3 月底,Anthropic 自己发布 Claude Code npm 包时忘了剔除 source map 文件,51 万行 TypeScript 源码完整曝光。原因一模一样:发布打包时手滑。
如果说 Claude Code 源码泄露出的是 Anthropic 的内裤,那苹果这次泄露的就是——”看,我们也在用这家人的 AI 写代码”。
但比起八卦,更值得聊的是这件事背后那条汹涌的暗流:2026 年,AI 编码正在从”玩具”变成”基础设施”,速度比所有人预想的都快。
65 星到 6.5 万星,只用了四个月
来看看 GitHub 上发生了什么。
TradingAgents,一个用多智能体模拟对冲基金交易决策的开源框架,Star 数 65.9k。什么概念?它比 Vue.js 的一些子项目还火。架构上它模拟了一个完整的交易公司:基本面分析师看财报,情绪分析师扫社交媒体,技术分析师画 K 线图,然后牛熊双方向的研究员互相辩论,最后由风控和投资组合经理拍板。
七个 AI Agent 角色,各自用自己的大模型接口。支持 OpenAI、Claude、Gemini、DeepSeek、甚至本地 Ollama。
这不是唯一一个爆发的。Ruflo(前身叫 Claude Flow),一个专门给 Claude Code 做多智能体编排的平台,39.7k 星。它提供了 100 多个专用 Agent(编码、测试、安全、文档、架构),支持蜂群协作(层次型/Mesh/自适应),自学习智能(SONA 神经模式),HNSW 向量记忆库,32 个官方插件——甚至还搞了个零信任跨实例联邦协作,用 Ed25519 签名做身份认证。
开发者们正在用多 Agent 做金融交易、写代码、审安全、管运维。五个季度前还被嘲笑”Agent 只是玩具”的论断,已经被 6.5 万星踩在脚下。
大模型在 Coding 战场上的军备竞赛
Claude Code 引爆了一条赛道。它发布两个月后,月之暗面的 Kimi K2 开源,把”编码 + Agent”立为模型核心卖点。智谱 GLM-5 跟上。DeepSeek V4 在 SWE-bench Verified 上跑出 83.7%,超越 GPT-5.2 和 Claude Opus 4.5。Mistral 不甘寂寞,4 月 29 日发布 Medium 3.5——128B 参数,256k 上下文,SWE-bench 77.6%,支持远程 Agent 在云端异步跑编码任务。
这些数字在一年前是难以想象的。SWE-bench Verified 这个评测集衡量的不是”写一段排序算法”这种教科书问题,而是真实的 GitHub Issue——模型要理解一个不熟悉的开源项目,定位 bug,修改代码,跑测试,提交 PR。2025 年初,最高分不到 50%。2026 年中,前三名全部破 80%。
赛道逻辑很清楚:能做 Agentic Coding 的模型才有资格上牌桌。纯聊天模型已经不值得看了。
“DeepSeek 版 Claude Code” 和那条裂缝
2.3k 星的项目,名字直白到不需要解释——”DeepSeek-Cowork”,开源替代 Claude Code,专门针对 DeepSeek 优化。GitHub 上同类项目越来越多。
原因很简单:Claude Code 确实强,但 Anthropic 的 API 很贵,而且不接中国开发者。DeepSeek V4 编程能力在开源模型中登顶,一个 1.6 万亿参数的 MoE 模型,价格只有 GPT-5.5 的十分之一。开发者天然会流向成本更低、门槛更低的方案。
这不是零和博弈。Claude Code 定义了这个品类,但市场足够大,大到可以容纳多个生态位。苹果选择了 Claude Code 做内部工具,华为和中科大的 openJiuwen 在做全栈国产化编码 Agent,小红书刚成立了 AI 一级部门 Dots——每家都在选自己的桩。
被遗忘的角落:Zig 说不
但也不是所有人都兴奋。
4 月底,Zig 编程语言项目发布了一项严苛政策:全面禁止 LLM 辅助的代码贡献。禁止在 Issue 里用 AI 回复,禁止提交 AI 生成的 PR,甚至禁止用 AI 翻译评论。Zig 的核心论点是——LLM 不会学习,审查者花时间指导 AI 用户,但那名用户的能力并没有提高。长期来看,这会掏空社区的人才储备。
同一时间,Node.js 社区出现了要求 TSC 禁止 AI 代码进入核心库的请愿书,上百名开发者签名。Hacker News 上吵了几百楼。
这是一场关于”开源灵魂”的争论。效率派的说法是:你有病啊,AI 帮我十分钟写完了以前一天的活,你让我不用?保守派的说法是:十年后你的项目里全是没人能维护的 AI 代码,你开心吗?
两边都没错。但现实是,AI 辅助编码的渗透率已经不可逆了。一项针对 12 万开发者的调查显示,92.6% 每月至少用一次 AI 编码助手。这不是未来,这是现在。
三个趋势,一次说透
归纳一下现在这个节点,三个趋势值得盯:
第一,”能写代码”正在取代”能聊天”成为大模型的核心衡量标准。SWE-bench 就是新的 ImageNet。模型厂商不在这上面刷出好成绩,连发布会都不好意思开。
第二,Agent 架构从单 Agent 走向多 Agent 协作。TradingAgents 的对冲基金模拟、Ruflo 的蜂群编排、Mistral 的远程 Agent——都在走同一个方向:把任务拆碎,让多个 AI 角色配合干活。一个 Agent 做完丢给下一个,出错的地方有专门的 Agent 检查。
第三,成本和准入正在制造分流。Claude Code / Opus 4.6 对得起它的价格,但 DeepSeek V4 + 开源替代方案的组合正在吃掉长尾市场。2026 年底,编码工具链从付费到开源的光谱上,每一个价位段都会有至少一个 AI 编码选项。
不是结尾
苹果那两被删除的 CLAUDE.md 文件里写了些什么?有安全研究员做了内容恢复。苹果的编码规范中有一条要求格外有趣:”Never generate placeholder code or TODO comments—either implement it fully or leave it untouched.”(永远不要生成占位代码或者 TODO 注释——要么就完整实现,要么就不动它。)
这大概就是为什么苹果选择了这场豪赌。不是因为他们觉得 AI 写得好,而是因为他们相信,配上足够严格的规范,AI 可以写出他们不觉得丢人的代码。
你呢,你觉得这个规范有一天也能套在自己头上吗?
夜雨聆风