
AI开源圈日报|6月3日
1. 美国签署新版AI行政令,前沿模型发布前安全审查走向“轻监管”
美国新签署的AI行政令聚焦前沿模型在网络安全、国家安全、关键基础设施方面的风险评估。相比此前更强硬的监管设想,最终版本明显收窄,更强调“创新与安全并行”。这说明美国AI政策正在从“强约束”转向“产业可接受的安全框架”,AI公司获得了更大操作空间。
2. OpenAI将Codex整合进ChatGPT,AI编程进入主产品入口
OpenAI围绕Codex推出新升级,重点是把编程能力进一步放进ChatGPT工作流,并支持通过Sites插件构建和部署托管站点。这意味着Codex不再只是开发者工具,而是在向“人人可用的AI开发环境”演进。未来ChatGPT可能不只是回答问题,而是直接帮助用户搭建网页、写应用、跑自动化流程。
3. 微软Build 2026连发7个MAI模型,减少对OpenAI单一路径依赖
微软AI发布包括MAI-Thinking-1、MAI-Code-1-Flash在内的多款模型,覆盖推理、代码等方向。MAI-Thinking-1被视为微软自研高级推理模型的重要节点,MAI-Code-1-Flash则面向代码生成与开发任务。微软正在把模型、Copilot、Agent、操作系统入口打通,AI战略明显更独立。
4. GitHub Copilot App发布,AI编程从插件走向桌面级Agent体验
GitHub推出Copilot App,定位为“agent-native desktop experience”,同时Copilot SDK正式可用,云端与本地沙箱进入公开预览,CLI也增加语音、调度等能力。AI编程正在从IDE补全工具升级为“开发者桌面工位”。这会改变软件开发流程:不是人问AI答,而是AI在任务、代码、测试、环境之间持续行动。
5. Google被曝付费购买Play开发者代码,用于训练AI工具
Google向部分Google Play应用开发者发出付费邀请,希望获取代码库访问权,用于训练AI编程工具。这是一个重要信号:公开互联网数据已经不够,真实商业代码正在成为稀缺训练资产。代码不再只是交付物,也可能成为AI时代的数据资产和议价筹码。
6. Google/Alphabet被传大规模资本动作,AI数据中心与TPU扩张继续加速
围绕Google/Alphabet的大额融资与资本安排传闻升温,市场关注其是否将继续加码AI数据中心、下一代TPU和算力基础设施。虽然部分信息仍需谨慎看待,但趋势非常明确:AI竞争已经不只是模型竞赛,而是算力、能源、数据中心和资本成本的综合竞赛。
7. Anthropic扩展Claude Mythos至关键基础设施,AI安全成本争议升温
Claude Mythos被用于更高风险场景,包括关键基础设施安全检测等方向。同时,围绕高强度AI安全测试的token成本、算力成本和商业可持续性出现讨论。AI安全正在从“理念问题”变成“成本问题”:谁来付账、能否规模化、是否真的比人工更有效,都会成为企业采购时的核心问题。
8. VAST完成近2亿美元融资,世界模型路线继续升温
VAST披露新一轮近2亿美元融资,并明确世界模型路线。世界模型被视为具身智能、自动驾驶、机器人、视频生成的重要底层方向,核心是让AI不只理解文本,而是理解物理世界和连续环境。这类融资说明资本仍在押注“下一代AI不是聊天,而是能理解和预测世界”。
9. 中国具身智能融资火热,千寻与星尘智能成为焦点
国内具身智能赛道继续吸金,千寻相关融资规模引发关注,星尘智能完成超10亿元B轮融资、估值破百亿元。机器人与具身智能正在成为中国AI投资的重要主线。相比纯大模型,具身智能更接近制造业、服务业和实体场景,也更容易形成产业链带动效应。
10. 字节开源Bernini,AI视频编辑从“生成”走向“理解后再动手”
字节开源统一框架Bernini,思路是给DiT视频生成/编辑模型配上更强的理解与规划能力。过去AI视频更强调生成效果,现在重点开始转向可控编辑:理解用户意图、识别视频内容,再精准修改。视频AI正在从“炫技demo”走向专业创作工具。
11. 百度文心发布PaddleOCR-VL-1.6,文档解析准确率突破96%
PaddleOCR-VL-1.6面向文档理解与解析,准确率达到96.33%,并支持网页端和API调用。文档解析是企业AI落地最刚需的场景之一,涉及合同、票据、报表、说明书、知识库等大量非结构化资料。相比聊天机器人,文档理解模型更容易直接进入企业流程。
12. 阿里Qwen3.7-Plus上线,多模态Agent继续卷工具操作能力
Qwen3.7-Plus定位多模态智能体基座,强调可复刻桌面端专业软件操作能力,并已上线阿里云百炼。多模态Agent的核心不再只是“看懂图片”,而是看懂界面、理解任务、调用工具、完成操作。国内大模型竞争正在从参数和跑分,转向真实工具链能力。
13. 微软开源ASSERT,用自然语言测试AI行为
ASSERT是面向AI Agent和LLM应用的评测框架,允许用自然语言描述需求并生成行为测试。随着Agent进入生产环境,企业最担心的不是“能不能回答”,而是“能不能稳定按要求做事”。AI测试框架会成为Agent工程化的重要基础设施。
14. Microsoft Scout与Project Solara曝光,AI Agent开始抢操作系统入口
微软推出Scout个人助理,并披露Project Solara这类面向AI Agent设备的新系统方向。其核心意图是把AI从应用层推进到系统层:办公、设备、文件、通知、任务调度都可能被Agent接管。未来的入口竞争,可能不是App Store,而是谁控制AI执行任务的第一入口。
15. Google推出AI诈骗电话检测,应对深伪冒充风险
Google Phone/Android开始加强对AI深伪与冒充联系人诈骗电话的检测能力。随着语音克隆和实时对话AI成熟,诈骗从“短信钓鱼”进入“声音冒充”阶段。手机系统级防护会成为AI安全的新战场。
要点速览:最值得关注的不是单个模型,而是四条主线:AI监管开始降温但不放松安全;AI编程全面进入主产品入口;高质量代码和企业私有数据被重新定价;具身智能、文档解析、视频编辑等应用场景正在加速落地。
—END—



夜雨聆风