AI 日报|MiniMax M3 开源、材料版 AlphaFold 来了、AI 编程工具三国杀
今天是 2026 年 6 月 1 日,儿童节。AI 圈的"大孩子们"也没闲着,几件大事值得聊聊。
核心事件
MiniMax M3 正式发布,国内首个"全能型"开源模型
MiniMax 今天正式发布 M3 模型——国内第一个同时具备前沿编程能力、1M 超长上下文和原生多模态能力的模型,而且直接开源了。在 SWE-Bench Pro、Terminal Bench 等评测上达到国际一线水平。实测反馈来看,体感接近 Opus 4.7 水平。有人已经拿 M3 写代码、用 Opus 4.8 + GPT 5.5 做对抗式 Code Review,跑完了一个完整 PR。国内大模型开源这条路上,MiniMax 确实在认真投入。
材料版 AlphaFold 来了:40 个工业任务 SOTA
深度原理发布了材料基座模型 MPA(Materials Property Axiom),思路很有意思——把 LLM 的预训练-中期训练-微调三阶段训练范式搬到了材料科学领域,再引入物理对齐和混合读出头。结果是在 40 个真实工业任务上全面 SOTA,对陌生材料结构的预测能力显著提升。AI for Science 今年确实在加速,不再是论文里的花架子了。
AI 编程工具三国杀:Codex 被怼"作秀",Claude Code 吃掉九成 Token
OpenAI Codex 突破 500 万用户后搞了个额度重置"福利",结果被用户吐槽时机和常规周期重叠,诚意不够。与此同时,数据显示 Claude Code 在 AI 编程工具中吃掉了近 90% 的 Token 消耗量。两个产品的路线差异越来越明显:Codex 走的是"量大管饱但抠门",Claude Code 走的是"用得多但贵"。AI 编程工具的商业化正进入深水区。
Agnes AI 无限期免费开放全模态 API
全球 Top 10 AI Lab 之一的 Agnes AI 宣布无限期免费开放文本、图片和视频三个模型的 API。目标很明确:让 AI 能力变成基础设施,降低开发者的使用门槛。免费策略能不能持续是一回事,但对独立开发者和小团队来说,这确实是个好消息。
其他值得关注的事
RoboAgent:3B 小模型在机器人场景碾压 GPT-4o。 北大和星源智团队把复杂具身任务拆成五个基础模块,三阶段训练后让 3B 参数的 VLM 在未知场景达到 94% 成功率。思路比堆参数聪明。
快手用 Agent 重塑风控体系。 QCon 大会上快手风控负责人分享了过去半年的实践——用 Agent 和 AI 原生转型,把产品、运营、研发三个职能重新洗牌。"液态组织"这个概念挺有意思。
微软 Azure Logic Apps 加了沙箱化代码解释器。 AI 智能体可以在 Hyper-V 隔离沙箱里跑 Python、JS、C# 和 PowerShell。企业级 AI Agent 的基础设施在不断完善。
淘宝的 AI Friendly 架构实战。 大淘宝技术分享了从传统架构向 AI 架构演进的三范式——确定性到概率性、结构化到语义化、静态到动态。结合秒杀业务的 AI 审核系统做了具体拆解,工程参考价值很高。
制糖工厂出了个"智能体电源"。 支持 MCP 协议和 AI Agent 原生接入的充电器,160W 持续输出,还能拼拆。硬件和 AI Agent 的结合越来越具体了。
Addy Osmani 谈"智能体引擎优化"(AEO)。 一个新概念:让文档对 AI 编程智能体可发现、可解析且 token 高效。本质上是说,未来的文档不光是写给人看的,还得写给 Agent 看。
一个观察
今天 10 条新闻里,有 6 条直接和 Agent 相关——Agent 写代码、Agent 做风控、Agent 优化文档、Agent 接入硬件、Agent 的训练范式、Agent 的基础设施。"Agent"这个词已经从概念阶段进入了全面落地期。接下来比拼的不是谁先喊出这个口号,而是谁先把 Agent 真正嵌入到工作流里产生价值。MiniMax M3 的开源,某种程度上也是在为 Agent 生态铺路——模型能力到位了,Agent 才有得玩。
夜雨聆风