AI 要闻 · 2026年6月3日

被一组数字震了一下：微软昨天在 Build 大会上说，现在每周有 300 万开发者 在用 Copilot——比三个月前翻了一倍多。而今天，他们又扔了三颗炸弹。

1. 微软 Build 2026 第二天：Scout 个人 AI 助手 + Project Solara + MAI Thinking-1

昨天（6月2日）Build 开幕，今天进入第二天，微软连发三箭。

Scout——你的"个人 AI 助手"，和 Copilot 的区别是：Copilot 帮你干活，Scout 帮你"记着事儿"。它能跨 App 记住你的工作上下文，下次打开文档直接续上次的思路。有点像把 Obsidian 的关联能力 + Claude 的记忆塞进了 Windows 底层。

Project Solara——面向 AI Agent 设备的系统构想。微软的算盘是：既然 Agent 要跑在手机、眼镜、车载各种设备上，就得有一个统一的"Agent 操作系统"来调度。这个坑，谷歌用 Aluminum OS 占，微软用 Solara 占。

MAI Thinking-1——微软首个高级推理模型，和 Claude Opus、GPT-5 系列正面刚。Mustafa Suleyman 把它定位为"可靠完成任务"的模型，不只是会聊天。目前已在 GitHub Copilot 后端灰度，46% 的新代码有它参与。

有人算了一下：微软三个月投了 130 亿美元在 AI 基础设施上，现在每周新增 30 万 Copilot 活跃用户。这场"Agent 平台"战争，微软用钱堆速度的打法，谷歌和 Anthropic 短期内追不上。

💬 你用 Copilot 吗？感觉它变聪明了没？

今天开始，Google Phone 应用向部分 Android 用户推送 AI 反诈功能。

原理不复杂：通话时，AI 实时分析对方语音特征，判断是不是 AI 合成的声音。如果是，弹窗警告你"这可能是 AI 伪造的语音"。

为什么现在做？ 过去半年，用 AI 克隆亲人声音的诈骗电话激增。美国 FTC 的数据：2025 年 AI 语音诈骗造成损失超过 26 亿美元，比 2024 年翻了 3 倍。老年人是重灾区。

Google 这个功能的聪明之处在于：它跑在本地 NPU 上，不用把你的通话内容上传云端。 这意味着隐私不泄露，响应速度也够快（延迟 < 200ms）。

不过有个尴尬：目前只支持英文，中文版得等。国内用户想用，估计得等华为、小米它们跟进类似功能。

据今日 CSDN AI 早报，豆包计划 6 月下旬 正式推出付费订阅，同步打通抖音电商场景。

具体怎么收费还没有公布，但业内猜测是"免费版 + 付费版"双轨制：

为什么现在推付费？ 豆包现在是国内 MAU 最高的 AI 应用（QuestMobile 数据：3 月 1.6 亿 MAU），但一直免费。算下来，每个活跃用户每月的推理成本大概 8-12 元，1.6 亿用户就是 每月 12-19 亿元 的亏损。再不收费，字节的 AI 账面压力太大。

对标来看：ChatGPT Plus 是 20 美元/月（约 144 元人民币），国内大概率会定在 30-50 元/月 这个区间——比 ChatGPT 便宜，但也不算"白菜价"。

💬 如果豆包收费，你愿意每月花多少钱用 AI 助手？

今天，字节在大模型社区开源了 Bernini——一个统一视频生成与编辑框架。

以前的视频编辑 AI（比如 Runway、Pika）的逻辑是：你给一段提示词，它直接生成新画面。问题是：它经常"理解偏了"，你想要"把背景换成海滩"，结果连人物都重生成了。

Bernini 的思路是：先理解，再动手。它会先分析视频的时序结构、镜头关系、人物动作，然后只修改你指定的部分，其他部分尽量保持原样。

技术上说，它用了一种叫"分层潜变量建模"的方法——把视频拆成"内容层"和"运动层"，编辑时只动内容层，运动层保持不变。这样出来的视频，动作连贯性比以前的方案好不少。

目前代码和模型权重已经在 GitHub 和 HuggingFace 上线，感兴趣可以去玩。

最后补一个"即将发生"的大事：多个独立信源确认，GPT-5.6 预计本月内发布。

目前已知的核心参数：

有意思的是，这次泄露的源头和上次一样：开发者在 OpenAI Codex 的后端日志里发现了还没官宣的模型名称。OpenAI 内部可能有"模型名提前出现在日志"的问题，或者……他们根本不在乎？

发布时间方面，Geeky Gadgets 的说法是"June 2026"，但没有具体日期。按 OpenAI 的节奏，大概率会在月底之前放出来，和 Anthropic 的 Claude Opus 4.8 正面竞争。

今天最值得关注的是 第 1 条和第 3 条的背后逻辑：微软在拼命把 AI 变成"平台"（让所有人都在我的平台上开发 Agent），而字节在拼命把 AI 变成"生意"（不能再烧钱了，得让用户买单）。这两条路，一条赌未来，一条赌现在。

信息来源

— CSDN AI 早报 2026-06-03 — BuildfastwithAI AI News Today — Geeky Gadgets GPT-5.6 Report — 腾讯新闻 / IT 之家相关报道