上周的AI编程圈,三件大事几乎同时发生。
微软在Build大会上推出首款自研编程模型MAI-Code-1-Flash,正式从OpenAI客户变成竞争对手。Claude Opus 4.8上线当天被曝"蒸馏"中国模型,用中文问它"你是谁",它说自己是DeepSeek。MiniMax M3开源发布,编程能力超GPT-5.5,逼近Opus 4.7。
三条线搅在一起,AI编程工具的格局正在被改写。
一、微软掀桌,从客户到对手

6月3日旧金山Build大会,微软扔了个重磅炸弹。
首款自研AI编程模型MAI-Code-1-Flash正式发布,可根据文本描述直接输出应用程序和网站的源代码。同时发布的还有推理模型MAI-Thinking-1,350亿活跃参数,专为高效能和低Token成本设计。
这不是单款产品,而是一个完整的MAI模型家族。一共7款模型,覆盖文本、代码、图像、语音生成。微软正在建立一个不依赖任何第三方的基础模型体系。
原因很简单,Claude太贵了。
微软已经在内部要求所有团队从Claude Code切换到GitHub Copilot,因为Claude的租赁成本实在太高。根据The Information此前的报道,微软每年花在第三方大模型上的费用惊人。自研之后,不仅可以在Azure上运行避免第三方抽成,还能把成本优势直接传递给开发者。
GitHub Copilot过去一直靠OpenAI的模型活着,现在微软要让它真正硬起来了。直接对标Cursor和Claude Code。
从客户到对手,微软这一步走得又快又狠。
二、Claude翻车,上线就出事

5月29日,Anthropic发布Claude Opus 4.8。
这本该是一个高光时刻。同日还宣布完成650亿美元H轮融资,投后估值9650亿美元,逼近万亿。但上线数小时后,风向就变了。
有用户在API测试中发现,如果用中文追问Opus 4.8的身份,它并不稳定给出Claude的答案。有时候自称是通义千问(Qwen),有时候报出DeepSeek的名字。
很快有人在多个平台复现了这个问题。无论是Linux Do技术社区,还是微博、X上都有确认截图。
更讽刺的是,今年2月Anthropic还发了一篇长文,痛斥DeepSeek、Moonshot、MiniMax等中国公司通过大量虚假账号和高频交互提取Claude能力用于训练自家模型。现在自己的旗舰模型被发现"蒸馏"了中国的开源模型。
蒸馏回旋镖,扎到自己身上了。
除了身份危机,Opus 4.8还有实际使用问题。有开发者发现它在处理文件时会反复读同一份内容30遍,浪费大量Token。不少企业开发者选择退回4.6版本,因为"4.6最稳"。
加上此前被曝的"计划性淘汰"争议,为了推4.8,暗中阉割旧模型性能,Anthropic的用户信任正在被一点点蚕食。
三、国产追赶,开源追平闭源

三个故事里,MiniMax M3可能是最安静的,也可能是最关键的。
6月1日,MiniMax M3正式发布。196B参数、11B激活、100万Token上下文、原生多模态。SWE-Bench Pro 59.0%,超越GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。Agent评测Claw-eval拿到最高分。SVG-Bench超过Opus 4.7。
更关键的是,它是全球唯一同时集齐编程、百万上下文、原生多模态的开源模型。
技术架构上M3用的是自研的MSA稀疏注意力机制。在百万级上下文下,单Token计算量只有上一代的1/20,预填充阶段加速9倍,解码阶段加速15倍。
简单说就是,你可以本地部署,数据不出内网,还能fine-tune适配业务场景。没有API调用成本的上限焦虑。
当你的开源模型能力已经接近闭源旗舰,成本还低到可以忽略时,闭源厂商的日子就不好过了。
四、三线交织,格局已变

把这三件事放在一起看,AI编程工具的格局正在发生结构性的改变。
微软从客户变成对手,意味着生态层面的反击。过去GitHub Copilot的优势只在和VS Code的集成度上,现在有了自家模型,终于有了"硬刚"的底气。
Claude翻车暴露了两个问题,一是闭源模型的可信度正在下降,二是Anthropic在商业化和技术能力之间的拉扯越来越明显。
国产开源模型的能力正在逼近天花板。M3在编程能力上接近Opus 4.7,在Agent评测上甚至拿到了最高分,而且是开源的。
三个判断
第一,AI编程工具正在从模型竞赛变成生态竞赛。微软有VS Code和GitHub,Cursor有Agent模式,Claude Code有终端原生体验。谁能在模型之上构建更好的开发体验,谁才是最终的赢家。
第二,**开源模型正在从"追赶者"变成"定义者"**。M3不仅是开源,还在Agent能力上领先。当开源模型开始在部分维度超越闭源,闭源的护城河就只剩生态和数据飞轮了。
第三,用户信任比技术能力更难重建。Claude Opus 4.8的蒸馏争议和性能问题,正在消耗开发者的耐心。而开发者的信任一旦流失,就很难再回来了。
2026年的AI编程战场,好戏刚刚开始。
夜雨聆风