
今日速览
01微软不靠 OpenAI 了,一口气掏出 7 款自研模型
02Copilot 从插件变成桌面 App,Agent 原生编程来了
03Windows 给 AI Agent 加了执行容器,出不了沙箱
04Trump 签了 AI 行政令,自愿交模型、30 天审查
05佛罗里达把 OpenAI 告了,ChatGPT 安全缺陷首次被追责
06不换模型,换搜索方式,Perplexity 把搜索做成了一行 import
07Anthropic 算了一笔账:浏览器 Agent 有 31.5% 概率被劫持
08NVIDIA 开源第一个物理 AI 基础模型,机器人公司不用从零造轮子
09Codex 要进 ChatGPT 了,10 亿用户的下一个入口
10NVIDIA 硅光交换机量产,数据中心能效翻 5 倍
11Google 说 AI 需求已经超过供应能力了
12欧盟新法案:想接政府订单,云服务商总部得在欧盟
13Intel 绕开了 GPU 战场,从机器人部署切入 AI
14xAI 把 Cursor 的引擎塞进了 Grok Build,成本只要对手十分之一
15NVIDIA 和 Unitree 公开了人形机器人的完整设计图纸
16Build 和 Computex 上,NVIDIA 和微软悄悄对齐了 Agent 技术栈
17WWDC 倒计时 5 天,Siri 要换成 Gemini 的大脑
18微软的量子芯片把可靠性提了 1000 倍
19GitHub 上 Agent Skill 生态一周涨了 30 万星
20AWS 自研 Trainium 芯片量产,推理成本降到 GPU 的六分之一
01|7 款模型、零蒸馏、全部自研——微软把 AI 底牌全翻了
Build 2026 开幕 keynote 上,Satya Nadella 一次性发布了 MAI 模型家族——推理、编程、图像、语音、转录,全栈覆盖、全部从零训练、没有一滴蒸馏。最受关注的是 MAI-Thinking-1:350 亿参数,128K 上下文,在关键基准上和 Claude Opus 4.6 打平。另一款 MAI-Code-1-Flash 只有 50 亿参数,专为 GitHub Copilot 定制,深度嵌在 VS Code 里。
Mustafa Suleyman 把这次发布叫做「AI 独立日」。名字有点大,但逻辑是准的:微软去年 4 月重新谈了对 OpenAI 的排他条款,年底开始训自己的模型,半年后 7 款同时亮相。速度快到 OpenAI 那边应该也在重新算账。
02|Copilot 从插件变成了一个独立桌面应用

GitHub Copilot 不再只是编辑器的附赠功能了。Build 上发布的桌面版是一个完整的 Agent 编程环境——每个任务跑在隔离工作区里,支持多会话并行。Agent 可以帮你审代码、处理合并冲突,甚至在你没打开电脑的时候跑测试。
Windows 11、Mac、Linux 全平台同时上线。对标的是 Claude Code 的终端体验,但微软加了一层图形界面和 GitHub 生态的原生集成。
对开发者的实际影响:Copilot 从「你写代码时帮你补全」变成了「你说需求,它自己建项目、写代码、跑测试、提 PR」。编程 Agent 的竞争正在从模型能力转向工作流整合——GitHub 手里有 1 亿开发者仓库,这是 Claude Code 和 Codex 都没有的。
03|Windows 给 Agent 加了一道物理围墙
MXC(Microsoft Execution Containers)是内建在 Windows 里的 Agent 沙箱。IT 管理员可以设定 Agent 能碰哪些文件、能调哪些 API、需要什么权限。Agent 在容器里跑,碰不到外面的东西。
ACS(Agent Control Specifications)是一套开源策略标准,用代码定义 Agent 的行为边界:什么能做、什么不能做、什么时候必须等人批准。
这两个东西放在一起,解决的是一件事:企业不敢放 Agent 进生产环境。不是因为 Agent 不够聪明——是因为没人能保证它不会做错事。MXC 和 ACS 给了一个「可以验证」的安全承诺。
04|30 天、自愿、五角大楼审查——Trump 签了一份被大幅削弱的 AI 行政令

6 月 2 日,Trump 签署了一份 AI 行政令。和两周前被取消的那版相比,改动很说明问题。
原版要求 90 天强制审查,新版本变成了 30 天自愿提交。原版的审查主体是商务部,新版本换成了五角大楼、NSA 和国土安全部。据说 Musk、Zuckerberg 和其他科技领袖在 5 月 21 日签署仪式被取消前集体游说过。
同一时间,Anthropic 正在起诉 Trump 政府将其列入「供应链风险」黑名单。一边是自愿交模型,一边是被列入黑名单——AI 行业和华盛顿的关系正处于一个奇怪的节点:既不信任,又不得不合作。
05|佛罗里达把 OpenAI 告了,ChatGPT 的安全缺陷第一次面临法律定义

这起诉讼可能比 Build 上的任何发布都重要。佛罗里达州正式起诉 OpenAI 及其 CEO Sam Altman,指控 ChatGPT 的安全缺陷与 2025 年一起大规模枪击案有关。
这是第一次有州政府把 AI 产品缺陷和 CEO 个人责任直接挂钩。诉讼要求 OpenAI 公开安全协议并支付罚金。无论判决结果如何,这个案子会为「模型输出造成的伤害谁来负责」立一个先例。
在一个 Build 和 Computex 都在展示 Agent 能做更多事的同一周,佛罗里达的诉讼在问一个相反的问题:Agent 做错事的时候,谁买单。
06|Perplexity 把搜索变成了一行 import
内部基准测试里,这套新架构在 WANDR 基准上比 Anthropic 的方案好了 2.5 倍,token 消耗减少了 85%。在 200 个高危 CVE 查询上准确率 100%。
本质上,Perplexity 在和 Google 抢同一个东西:Agent 时代的搜索入口。Google 有搜索引擎但 Agent 生态偏弱,Perplexity 反其道——先占住 Agent 的搜索调用,再倒推用户习惯。
07|Anthropic 第一次量化了 Agent 的安全风险:31.5%

Anthropic 发布了一项 Agent 安全研究,结论令人不安:在安全机制完全生效之前,浏览器 Agent 有 31.5% 的概率被恶意网站劫持。
攻击方式包括隐藏的 prompt 注入、伪装成合法按钮的点击劫持、以及自动填充虚假表单。研究建议在 Agent 部署中加入「人类审批」节点——在执行敏感操作前暂停,等待确认。
31.5% 这个数字的意义在于,它把 Agent 安全从「我们觉得有风险」变成了「我们知道风险有多大」。对于正在考虑把 Agent 部署到生产环境的企业来说,这是一个可以放进风险评估表里的具体数字。
08|NVIDIA 开源了物理世界的基础模型

NVIDIA 和 Hugging Face 在 Computex 上联合发布了 Cosmos 3——第一个完全开源的物理 AI 基础模型。专门用于机器人仿真和自动驾驶训练,可以生成逼真的物理世界场景作为合成训练数据。
对行业的意义:物理 AI 最大的瓶颈不是算法,是训练数据。真实世界的机器人数据又贵又慢,Cosmos 3 用合成数据填这个坑。任何机器人公司或自动驾驶团队都可以基于它做二次开发。
同一天 NVIDIA 还和 Unitree 发布了 Isaac GR00T——全球第一个开源人形机器人参考设计,包含完整的硬件规格、控制算法和仿真环境。
09|Codex 的下一个入口是 ChatGPT——10 亿用户

OpenAI 宣布 Codex 将在未来几周内并入 ChatGPT。不需要额外安装,在聊天窗口里就能让 AI 写代码、跑测试、部署应用。
同时发布的还有 6 个 Codex 角色插件:金融、创意设计、销售、产品设计、投行、数据分析。每个角色是一套预配置的 Agent 模板——告诉它你什么角色,它自动加载对应的工具链。
Codex 从「开发者的编程助手」到「所有人的 Agent 入口」,这一步的意义不在功能,在分发。ChatGPT 有 10 亿用户,而 Claude Code 和 Copilot 加起来可能不到这个数的十分之一。入口即护城河。
10|NVIDIA 把光和电做在了同一块芯片上

Computex 上 NVIDIA 宣布 Spectrum-X 硅光以太网交换机全面量产。关键数字:能效是传统交换机的 5 倍,AI 工作负载 uptime 提升 5 倍。
硅光子技术的核心是把光信号和电信号的转换集成在同一块芯片上,省掉了传统光模块的功耗和延迟。黄仁勋在 keynote 上说「Token 是 AI 行业的核心收入单位」——Spectrum-X 要解决的就是 token 在数据中心之间流动的成本。
对开发者来说这很底层,但对用了 AI API 的人来说,token 成本和延迟最终都落在这类基础设施上。
11|Google 亲口承认:AI 需求已经超过供应了

6 月 2 日,Google 公开表示来自企业和消费者的 AI 解决方案需求「已超出公司现有供应能力」。这句话的背景是 Alphabet 刚宣布的 $800 亿股权融资和 $1,800-1,900 亿年度 AI 资本支出。
Google 的 TPU 产能、数据中心建设和 Gemini API 调用量都在撞天花板。不是 Google 一家的问题——微软和 Meta 同期也公布了创纪录的 AI 资本支出。AI 基础设施的供不应求,是 2026 年最大的结构性主题之一。
12|欧盟出了一道选择题:想拿政府合同,总部搬过来

欧盟正在起草「Cloud and AI Development Act」,其中最引人注目的一条:为欧盟政府提供服务的云厂商必须在欧盟境内设立总部。AWS、Azure、Google Cloud 全在射程内。
加上 8 月 2 日即将全面生效的 EU AI Act,欧洲正在用监管画一条线——线内的公司可以做生意,线外的公司不行。对 AI 公司来说,合规成本正在从「可选的」变成「必须的」。
13|Intel 不跟 NVIDIA 拼 GPU,换了赛道

Intel 在 Computex 上发布了 OpenVINO Physical AI 框架,专门用于机器人开发和部署。官方数据:机器人部署周期从 6 个月缩到 3.5 个月。
Intel 在 AI 训练芯片上被 NVIDIA 压制了几年。Physical AI——机器人、工业自动化、边缘计算——是 Intel 试图绕开 GPU 主战场的一次侧翼进攻。机器人推理不需要 H100 级别的算力,但需要低延迟和高可靠性。这是 Intel 的 Xeon 和 Gaudi 擅长的领域。
14|xAI 不拼模型,拼成本和生态

xAI 在 Grok Build 里整合了 Cursor 的 Composer 2.5 引擎。SWE-Bench 多语言版 79.8%,成本大约是对手的十分之一。
策略很清楚:不在模型能力和 OpenAI/Anthropic 硬碰硬,而是在成本和生态集成上找突破口。Grok Build 的定位是「便宜到可以随便用的编程 Agent」。对于个人开发者和中小企业来说,token 账单才是真正的门槛。
15|人形机器人的设计图纸,NVIDIA 开源了

NVIDIA 和 Unitree 发布了 Isaac GR00T——全球第一个开源人形机器人参考设计。完整的硬件规格、控制算法、仿真环境全部公开。
黄仁勋说「机器人是下一波 AI 的终极载体」。GR00T 给这个赛道发了一把通用钥匙——创业公司不需要从零画图纸,直接在开源设计上改。
加上 Cosmos 3 的合成数据能力,NVIDIA 在人形机器人上的布局基本成型:用 Cosmos 生成训练数据,用 GR00T 做硬件参考,用 Vera CPU 跑推理。
16|一个造引擎,一个造刹车

Build 和 Computex 同时进行,NVIDIA 和微软在两条线上悄悄对齐了技术栈。
底层是 NVIDIA 的 Vera Rubin 平台和 Spectrum-X 硅光网络;中层是 Windows MXC 执行容器和 ACS 策略标准;上层是 GitHub Copilot 和 Scout 这些 Agent 产品。黄仁勋在 Computex 上说「Token 是核心收入单位」,微软在 Build 上给这个 token 加了安全锁。
Agent 要大规模进企业,需要两样东西:够强的引擎,和够可靠的刹车。NVIDIA 和微软各给了一样。
17|Siri 换脑倒计时 5 天

WWDC 2026 将在 6 月 8 日开幕。这届的重点只有一个:Siri。
两年跳票后,iOS 27 的 Siri 底层将从苹果自研模型换成 Google Gemini,蒸馏后跑在 M5 芯片上。独立的 Siri app、Dynamic Island 入口、跨应用操作——这些都是之前承诺过但没兑现的。
对于用了两年「旧 Siri」的 iPhone 用户来说,WWDC 不是看苹果发布了什么新 AI 功能——是看苹果终于把两年前画过的饼端出来。
18|量子比特的寿命从微秒变成了 20 秒
量子计算和 AI 的关系不是「谁替代谁」,是「谁先突破,另一个就多一件工具」。20 秒的量子比特寿命意味着纠错变得可行——而纠错是量子计算最大的门槛。
19|Agent Skill 正在变成一个新的分发市场

本周 GitHub Trending 上 Agent Skill 相关的仓库一周涨了约 30 万星。OpenClaw 生态、claude-code/skills 开源、taste-skill 和 stop-slop 等独立开发者的 skill 包——这个品类正在以开源形式自然生长出一个没有审核、没有抽成的「Agent App Store」。
Skill 协议——把领域知识打包成 AI 可调用的模块——正在成为独立开发者的新分发格式。不用建平台、不用拉用户,写一个 skill,全世界的 Agent 都能用。
20|AWS 的 Trainium 芯片量产,推理成本卷到新低

AWS 在 6 月初宣布自研 Trainium AI 训练/推理芯片进入量产阶段。对于已经跑在 AWS 上的企业来说,推理成本可以降到 GPU 方案的约六分之一。
Bedrock 已经在同一周上线了 GPT-5.5 和 Claude Opus 4.8,加上自研芯片的量产,AWS 的策略很清楚:模型层面保持开放(谁的模型都能跑),基础设施层面自研(能省的钱自己赚)。
来源
· Microsoft — 7款自研MAI模型
· GitHub/Microsoft — Copilot桌面版
· Microsoft — MXC+ACS Agent安全
· White House — Trump AI行政令
· Florida/OpenAI — 佛罗里达诉OpenAI
· Perplexity — Search as Code
· Anthropic — Agent 31.5%劫持率研究
· NVIDIA/HuggingFace — Cosmos 3物理AI开源
· OpenAI — Codex并入ChatGPT
· NVIDIA — Spectrum-X硅光量产
· Google — AI需求超供应
· EU — Cloud & AI Act
· Intel — OpenVINO Physical AI
· xAI — Grok Build整合Composer 2.5
· NVIDIA/Unitree — Isaac GR00T人形机器人开源
· NVIDIA/Microsoft — 统一Agent技术栈
· Apple — Siri+Gemini WWDC倒计时
· Microsoft — Majorana 2量子芯片
· GitHub — Agent Skill生态爆发
· AWS — Trainium芯片量产
夜雨聆风