AI 日报|MiniMax M3 开源、材料版 AlphaFold 来了、AI 编程工具三国杀

AI 日报｜MiniMax M3 开源、材料版 AlphaFold 来了、AI 编程工具三国杀

今天是 2026 年 6 月 1 日，儿童节。AI 圈的"大孩子们"也没闲着，几件大事值得聊聊。

核心事件

MiniMax M3 正式发布，国内首个"全能型"开源模型

MiniMax 今天正式发布 M3 模型——国内第一个同时具备前沿编程能力、1M 超长上下文和原生多模态能力的模型，而且直接开源了。在 SWE-Bench Pro、Terminal Bench 等评测上达到国际一线水平。实测反馈来看，体感接近 Opus 4.7 水平。有人已经拿 M3 写代码、用 Opus 4.8 + GPT 5.5 做对抗式 Code Review，跑完了一个完整 PR。国内大模型开源这条路上，MiniMax 确实在认真投入。

材料版 AlphaFold 来了：40 个工业任务 SOTA

深度原理发布了材料基座模型 MPA（Materials Property Axiom），思路很有意思——把 LLM 的预训练-中期训练-微调三阶段训练范式搬到了材料科学领域，再引入物理对齐和混合读出头。结果是在 40 个真实工业任务上全面 SOTA，对陌生材料结构的预测能力显著提升。AI for Science 今年确实在加速，不再是论文里的花架子了。

AI 编程工具三国杀：Codex 被怼"作秀"，Claude Code 吃掉九成 Token

OpenAI Codex 突破 500 万用户后搞了个额度重置"福利"，结果被用户吐槽时机和常规周期重叠，诚意不够。与此同时，数据显示 Claude Code 在 AI 编程工具中吃掉了近 90% 的 Token 消耗量。两个产品的路线差异越来越明显：Codex 走的是"量大管饱但抠门"，Claude Code 走的是"用得多但贵"。AI 编程工具的商业化正进入深水区。

Agnes AI 无限期免费开放全模态 API

全球 Top 10 AI Lab 之一的 Agnes AI 宣布无限期免费开放文本、图片和视频三个模型的 API。目标很明确：让 AI 能力变成基础设施，降低开发者的使用门槛。免费策略能不能持续是一回事，但对独立开发者和小团队来说，这确实是个好消息。

其他值得关注的事

RoboAgent：3B 小模型在机器人场景碾压 GPT-4o。 北大和星源智团队把复杂具身任务拆成五个基础模块，三阶段训练后让 3B 参数的 VLM 在未知场景达到 94% 成功率。思路比堆参数聪明。

快手用 Agent 重塑风控体系。 QCon 大会上快手风控负责人分享了过去半年的实践——用 Agent 和 AI 原生转型，把产品、运营、研发三个职能重新洗牌。"液态组织"这个概念挺有意思。

微软 Azure Logic Apps 加了沙箱化代码解释器。 AI 智能体可以在 Hyper-V 隔离沙箱里跑 Python、JS、C# 和 PowerShell。企业级 AI Agent 的基础设施在不断完善。

淘宝的 AI Friendly 架构实战。 大淘宝技术分享了从传统架构向 AI 架构演进的三范式——确定性到概率性、结构化到语义化、静态到动态。结合秒杀业务的 AI 审核系统做了具体拆解，工程参考价值很高。

制糖工厂出了个"智能体电源"。 支持 MCP 协议和 AI Agent 原生接入的充电器，160W 持续输出，还能拼拆。硬件和 AI Agent 的结合越来越具体了。

Addy Osmani 谈"智能体引擎优化"（AEO）。 一个新概念：让文档对 AI 编程智能体可发现、可解析且 token 高效。本质上是说，未来的文档不光是写给人看的，还得写给 Agent 看。

一个观察

今天 10 条新闻里，有 6 条直接和 Agent 相关——Agent 写代码、Agent 做风控、Agent 优化文档、Agent 接入硬件、Agent 的训练范式、Agent 的基础设施。"Agent"这个词已经从概念阶段进入了全面落地期。接下来比拼的不是谁先喊出这个口号，而是谁先把 Agent 真正嵌入到工作流里产生价值。MiniMax M3 的开源，某种程度上也是在为 Agent 生态铺路——模型能力到位了，Agent 才有得玩。