字节开源Bernini;特朗普AI新政落地;OpenAI把Codex塞进ChatGPT;微软连发7个模型;VAST完成近2亿美元融资;Google开始买代码训练

AI开源圈日报｜6月3日

1. 美国签署新版AI行政令，前沿模型发布前安全审查走向“轻监管”

美国新签署的AI行政令聚焦前沿模型在网络安全、国家安全、关键基础设施方面的风险评估。相比此前更强硬的监管设想，最终版本明显收窄，更强调“创新与安全并行”。这说明美国AI政策正在从“强约束”转向“产业可接受的安全框架”，AI公司获得了更大操作空间。

2. OpenAI将Codex整合进ChatGPT，AI编程进入主产品入口

OpenAI围绕Codex推出新升级，重点是把编程能力进一步放进ChatGPT工作流，并支持通过Sites插件构建和部署托管站点。这意味着Codex不再只是开发者工具，而是在向“人人可用的AI开发环境”演进。未来ChatGPT可能不只是回答问题，而是直接帮助用户搭建网页、写应用、跑自动化流程。

3. 微软Build 2026连发7个MAI模型，减少对OpenAI单一路径依赖

微软AI发布包括MAI-Thinking-1、MAI-Code-1-Flash在内的多款模型，覆盖推理、代码等方向。MAI-Thinking-1被视为微软自研高级推理模型的重要节点，MAI-Code-1-Flash则面向代码生成与开发任务。微软正在把模型、Copilot、Agent、操作系统入口打通，AI战略明显更独立。

4. GitHub Copilot App发布，AI编程从插件走向桌面级Agent体验

GitHub推出Copilot App，定位为“agent-native desktop experience”，同时Copilot SDK正式可用，云端与本地沙箱进入公开预览，CLI也增加语音、调度等能力。AI编程正在从IDE补全工具升级为“开发者桌面工位”。这会改变软件开发流程：不是人问AI答，而是AI在任务、代码、测试、环境之间持续行动。

5. Google被曝付费购买Play开发者代码，用于训练AI工具

Google向部分Google Play应用开发者发出付费邀请，希望获取代码库访问权，用于训练AI编程工具。这是一个重要信号：公开互联网数据已经不够，真实商业代码正在成为稀缺训练资产。代码不再只是交付物，也可能成为AI时代的数据资产和议价筹码。

6. Google/Alphabet被传大规模资本动作，AI数据中心与TPU扩张继续加速

围绕Google/Alphabet的大额融资与资本安排传闻升温，市场关注其是否将继续加码AI数据中心、下一代TPU和算力基础设施。虽然部分信息仍需谨慎看待，但趋势非常明确：AI竞争已经不只是模型竞赛，而是算力、能源、数据中心和资本成本的综合竞赛。

7. Anthropic扩展Claude Mythos至关键基础设施，AI安全成本争议升温

Claude Mythos被用于更高风险场景，包括关键基础设施安全检测等方向。同时，围绕高强度AI安全测试的token成本、算力成本和商业可持续性出现讨论。AI安全正在从“理念问题”变成“成本问题”：谁来付账、能否规模化、是否真的比人工更有效，都会成为企业采购时的核心问题。

8. VAST完成近2亿美元融资，世界模型路线继续升温

VAST披露新一轮近2亿美元融资，并明确世界模型路线。世界模型被视为具身智能、自动驾驶、机器人、视频生成的重要底层方向，核心是让AI不只理解文本，而是理解物理世界和连续环境。这类融资说明资本仍在押注“下一代AI不是聊天，而是能理解和预测世界”。

9. 中国具身智能融资火热，千寻与星尘智能成为焦点

国内具身智能赛道继续吸金，千寻相关融资规模引发关注，星尘智能完成超10亿元B轮融资、估值破百亿元。机器人与具身智能正在成为中国AI投资的重要主线。相比纯大模型，具身智能更接近制造业、服务业和实体场景，也更容易形成产业链带动效应。

10. 字节开源Bernini，AI视频编辑从“生成”走向“理解后再动手”

字节开源统一框架Bernini，思路是给DiT视频生成/编辑模型配上更强的理解与规划能力。过去AI视频更强调生成效果，现在重点开始转向可控编辑：理解用户意图、识别视频内容，再精准修改。视频AI正在从“炫技demo”走向专业创作工具。

11. 百度文心发布PaddleOCR-VL-1.6，文档解析准确率突破96%

PaddleOCR-VL-1.6面向文档理解与解析，准确率达到96.33%，并支持网页端和API调用。文档解析是企业AI落地最刚需的场景之一，涉及合同、票据、报表、说明书、知识库等大量非结构化资料。相比聊天机器人，文档理解模型更容易直接进入企业流程。

12. 阿里Qwen3.7-Plus上线，多模态Agent继续卷工具操作能力

Qwen3.7-Plus定位多模态智能体基座，强调可复刻桌面端专业软件操作能力，并已上线阿里云百炼。多模态Agent的核心不再只是“看懂图片”，而是看懂界面、理解任务、调用工具、完成操作。国内大模型竞争正在从参数和跑分，转向真实工具链能力。

13. 微软开源ASSERT，用自然语言测试AI行为

ASSERT是面向AI Agent和LLM应用的评测框架，允许用自然语言描述需求并生成行为测试。随着Agent进入生产环境，企业最担心的不是“能不能回答”，而是“能不能稳定按要求做事”。AI测试框架会成为Agent工程化的重要基础设施。

14. Microsoft Scout与Project Solara曝光，AI Agent开始抢操作系统入口

微软推出Scout个人助理，并披露Project Solara这类面向AI Agent设备的新系统方向。其核心意图是把AI从应用层推进到系统层：办公、设备、文件、通知、任务调度都可能被Agent接管。未来的入口竞争，可能不是App Store，而是谁控制AI执行任务的第一入口。

15. Google推出AI诈骗电话检测，应对深伪冒充风险

Google Phone/Android开始加强对AI深伪与冒充联系人诈骗电话的检测能力。随着语音克隆和实时对话AI成熟，诈骗从“短信钓鱼”进入“声音冒充”阶段。手机系统级防护会成为AI安全的新战场。

要点速览：最值得关注的不是单个模型，而是四条主线：AI监管开始降温但不放松安全；AI编程全面进入主产品入口；高质量代码和企业私有数据被重新定价；具身智能、文档解析、视频编辑等应用场景正在加速落地。

—END—

关注我，带你了解全球AI新鲜热点资讯！

ECShopX开源商城不只是“商城前台”：把它当作「品牌私域业务底座」来用，才真正值钱！｜商派开源专栏

第一代AI Agent在垃圾场“寻宝失败”！重建数智化业务底座，「Agent+高质量数据」激活智能倍增效应｜商派AI专栏

免费可商用！ONEX OMS开源订单管理系统，全面支持零售电商场景、O2O门店场景、分销业务，一件代发业务······

耐克与谷歌合作开发AI人工智能购物功能，谷歌“代理式电商”愿景落地

AI时代的数智化转型：商派“业务系统基因+AI智能体”双轮驱动模式，为企业提供长期“确定性”选择