被一组数字震了一下:微软昨天在 Build 大会上说,现在每周有 300 万开发者 在用 Copilot——比三个月前翻了一倍多。而今天,他们又扔了三颗炸弹。
1. 微软 Build 2026 第二天:Scout 个人 AI 助手 + Project Solara + MAI Thinking-1
昨天(6月2日)Build 开幕,今天进入第二天,微软连发三箭。
Scout——你的"个人 AI 助手",和 Copilot 的区别是:Copilot 帮你干活,Scout 帮你"记着事儿"。它能跨 App 记住你的工作上下文,下次打开文档直接续上次的思路。有点像把 Obsidian 的关联能力 + Claude 的记忆塞进了 Windows 底层。
Project Solara——面向 AI Agent 设备的系统构想。微软的算盘是:既然 Agent 要跑在手机、眼镜、车载各种设备上,就得有一个统一的"Agent 操作系统"来调度。这个坑,谷歌用 Aluminum OS 占,微软用 Solara 占。
MAI Thinking-1——微软首个高级推理模型,和 Claude Opus、GPT-5 系列正面刚。Mustafa Suleyman 把它定位为"可靠完成任务"的模型,不只是会聊天。目前已在 GitHub Copilot 后端灰度,46% 的新代码有它参与。
有人算了一下:微软三个月投了 130 亿美元在 AI 基础设施上,现在每周新增 30 万 Copilot 活跃用户。这场"Agent 平台"战争,微软用钱堆速度的打法,谷歌和 Anthropic 短期内追不上。
💬 你用 Copilot 吗?感觉它变聪明了没?
2. Google Phone 上线 AI 反诈:实时识别深度伪造语音电话
今天开始,Google Phone 应用向部分 Android 用户推送 AI 反诈功能。
原理不复杂:通话时,AI 实时分析对方语音特征,判断是不是 AI 合成的声音。如果是,弹窗警告你"这可能是 AI 伪造的语音"。
为什么现在做? 过去半年,用 AI 克隆亲人声音的诈骗电话激增。美国 FTC 的数据:2025 年 AI 语音诈骗造成损失超过 26 亿美元,比 2024 年翻了 3 倍。老年人是重灾区。
Google 这个功能的聪明之处在于:它跑在本地 NPU 上,不用把你的通话内容上传云端。 这意味着隐私不泄露,响应速度也够快(延迟 < 200ms)。
不过有个尴尬:目前只支持英文,中文版得等。国内用户想用,估计得等华为、小米它们跟进类似功能。
3. 豆包 6 月下旬推进付费:国内 AI 应用商业化正式加速
据今日 CSDN AI 早报,豆包计划 6 月下旬 正式推出付费订阅,同步打通抖音电商场景。
具体怎么收费还没有公布,但业内猜测是"免费版 + 付费版"双轨制:
免费版:每天一定次数的对话额度,超出要等
付费版:无限次 + 更长上下文 + 多模态生成 + 电商场景优先推荐
为什么现在推付费? 豆包现在是国内 MAU 最高的 AI 应用(QuestMobile 数据:3 月 1.6 亿 MAU),但一直免费。算下来,每个活跃用户每月的推理成本大概 8-12 元,1.6 亿用户就是 每月 12-19 亿元 的亏损。再不收费,字节的 AI 账面压力太大。
对标来看:ChatGPT Plus 是 20 美元/月(约 144 元人民币),国内大概率会定在 30-50 元/月 这个区间——比 ChatGPT 便宜,但也不算"白菜价"。
💬 如果豆包收费,你愿意每月花多少钱用 AI 助手?
4. 字节开源 Bernini:视频编辑"先理解再动手"
今天,字节在大模型社区开源了 Bernini——一个统一视频生成与编辑框架。
以前的视频编辑 AI(比如 Runway、Pika)的逻辑是:你给一段提示词,它直接生成新画面。问题是:它经常"理解偏了",你想要"把背景换成海滩",结果连人物都重生成了。
Bernini 的思路是:先理解,再动手。它会先分析视频的时序结构、镜头关系、人物动作,然后只修改你指定的部分,其他部分尽量保持原样。
技术上说,它用了一种叫"分层潜变量建模"的方法——把视频拆成"内容层"和"运动层",编辑时只动内容层,运动层保持不变。这样出来的视频,动作连贯性比以前的方案好不少。
目前代码和模型权重已经在 GitHub 和 HuggingFace 上线,感兴趣可以去玩。
5. GPT-5.6 预计 6 月发布:150 万 Token 上下文,前端生成能力再升级
最后补一个"即将发生"的大事:多个独立信源确认,GPT-5.6 预计本月内发布。
目前已知的核心参数:
- 上下文窗口
:150 万 Token(比 GPT-5.5 的 105 万提升约 43%)
- 前端生成能力
:内部测试接近商用级,能一次性生成包含交互逻辑的完整网页
- UltraFast 模式
:响应速度比 GPT-5.5 快 2-3 倍
- 内部代号
:iris-alpha(主模型)+ ember-alpha(推理增强版)
有意思的是,这次泄露的源头和上次一样:开发者在 OpenAI Codex 的后端日志里发现了还没官宣的模型名称。OpenAI 内部可能有"模型名提前出现在日志"的问题,或者……他们根本不在乎?
发布时间方面,Geeky Gadgets 的说法是"June 2026",但没有具体日期。按 OpenAI 的节奏,大概率会在月底之前放出来,和 Anthropic 的 Claude Opus 4.8 正面竞争。
今日小结
今天最值得关注的是 第 1 条和第 3 条的背后逻辑:微软在拼命把 AI 变成"平台"(让所有人都在我的平台上开发 Agent),而字节在拼命把 AI 变成"生意"(不能再烧钱了,得让用户买单)。这两条路,一条赌未来,一条赌现在。
信息来源
— CSDN AI 早报 2026-06-03 — BuildfastwithAI AI News Today — Geeky Gadgets GPT-5.6 Report — 腾讯新闻 / IT 之家相关报道
夜雨聆风