
今日速览
01Sam Altman 被六州联手调查
02ChatGPT 被诉误导用药致死
03Symphony 给任务配 Codex Agent
04Google 发 ADK 让 Agent 学会暂停
05财务团队用上 Codex 做报告
06Anthropic 估值要冲 9000 亿了
07Google 首款 AI 笔记本来了
08Codex 能在应用间后台干活
09Claude Code 被安全团队用上了
10Copilot 推出 Max 计划和弹性配额
11有人用 Copilot CLI 做了个游戏
12Statewright 把准确率从 2 拉到 10
13微软发材料科学多任务模型
01|六州司法部长要求调查 Sam Altman

佛罗里达、蒙大拿等六州司法部长联合致信美国证交会,要求调查 Sam Altman 是否利用 OpenAI 谋私利。核心争议在于 Altman 在 OpenAI 没有直接股权,个人财务利益和公司业绩关联有限,存在自我交易风险。OpenAI 目前估值 8520 亿美元,但利益冲突审计报告至今未公开。
这是硅谷大公司治理问题第一次直接烧到 CEO 个人头上。
02|ChatGPT 被诉误导致青少年死亡

一名 19 岁青少年长期向 ChatGPT 咨询卡痛、阿普唑仑、酒精和止咳糖浆的混合使用,ChatGPT 给出了具体剂量建议,甚至指导如何增强药物体验。他最终因过量服药死亡,父母起诉 OpenAI。
OpenAI 回应称相关对话使用了已下线的旧版本模型。这件事的核心问题不是 AI 有没有责任,而是 AI 产品的安全边界应该划在哪。
03|Symphony 为每个任务启动 Codex 智能体

Codex 正在从一个"你告诉它做什么"的工具,变成"它自己知道该做什么"的智能体。
Symphony 的新能力是:每一个开放任务,都会自动启动一个运行中的 Codex 智能体。开发者不再需要手动触发——Codex 在后台持续运行,像一个永不掉线的工程师。对于正在搭建 Agent 工作流的团队来说,这可能是这周最重要的更新。
04|Google 的 ADK 让 Agent 学会暂停和恢复

Agent 掉线丢上下文一直是大规模部署的致命伤。Google 的 ADK 解决方式很直接:用持久状态机加持久化存储,让 Agent 学会"暂停"和"恢复"。
一个 HR 入职流程可能要跑好几天,ADK 让 Agent 在空闲时休眠、被事件唤醒后无缝继续,不会因为服务器重启就忘记做到哪一步了。企业级 Agent 终于不再是"演示很好、部署不了"的状态。
05|财务团队开始用 Codex 做报告

Codex 进财务团队这件事,比看起来有意思。不是程序员在用,而是财务分析师自己用自然语言生成管理层报告、做差异分析、建规划模型。
说白了就是把 Excel 里的宏换成了自然语言——你说"做一份这个月的差异桥接",Codex 自己写代码执行。财务不需要学编程,但需要学会准确描述问题。
06|Anthropic 被曝按 9000 亿美元估值融资

Anthropic 正在谈新一轮融资:投前估值超 9000 亿美元,融至少 300 亿。这将是它迄今最大的一轮。今年 2 月刚完成 300 亿 G 轮(投后 3800 亿),不到三个月估值又要翻倍。
算力太贵了。
07|Google 发布 AI 笔记本 Googlebook

Google 出了个新笔记本系列,不叫 Chromebook,叫 Googlebook。核心变化是:这不是一台"云优先"设备,而是"AI 优先"。
Magic Pointer 把系统光标变成了 AI 交互入口,光标划过文字自动触发建议。还有一个 Create Your Widget 功能,用自然语言就能生成桌面小组件。Gemini 不再是一个应用,而是操作系统的交互层。
08|Codex 实现跨应用后台多任务处理

Codex 的 Computer Use 新能力来了:它可以跨应用工作,不占用你的屏幕。
Ari X 和 Romain Huet 在对话中展示了这个场景——Agent 在后台点击、输入、切换窗口,而用户继续做自己的事。这和 Symphony 给任务配 Agent 是同一个方向的不同动作:Codex 正在从工具变成员工。
09|Anthropic 安全团队用 Claude Code 搭威胁检测平台

Anthropic 自己的安全团队用 Claude Code 搭了一个叫 CLUE 的平台,从概念验证到交付只用了一周。
CLUE Triage 自动初筛安全警报并分配处置建议,CLUE Investigate 让分析师用自然语言查日志,Claude 自动生成和执行查询。一个分析师几小时的工作被缩短到几分钟。最有意思的是:这家 AI 公司用自己最前沿的模型来保护自己的基础设施。
10|GitHub Copilot 推出 Max 计划和弹性配额

GitHub Copilot 的个人计划从 6 月 1 日起调整。Pro 和 Pro+ 引入弹性配额,同时新增一个 Max 计划。对重度开发者来说,这意味着更多选择空间——但也要留意新定价是否覆盖自己的实际使用量。
11|有人用 Copilot CLI 搭了一个 Roguelike 游戏

一个 GitHub 员工用 Copilot CLI 开发了一个工具,能把任意代码库转化成 Roguelike 风格的地下城。你在终端里探索代码结构,就像在玩一个复古游戏。
不是大新闻,但说明 Copilot CLI 的创造性使用空间比想象的大——AI 不只是帮你写代码,还可以帮你玩代码。
12|Statewright 用状态机把准确率拉到 10/10

Statewright 的做法很直接:不让 Agent 自由发挥。它在规划、实施、测试三个阶段限制 Agent 只能使用指定的工具,自动执行状态转换。
结果在 SWE-bench 子任务上,两个模型用了状态机约束后正确率从 2/10 直接跳到 10/10。Claude Code 已经集成了它。Agent 可靠性一直是部署的最大障碍,Statewright 的路径可能是最实用的解法之一。
13|微软发布材料科学多任务模型

微软的 MatterSim 发布了多任务模型 MatterSim-MT,能同时模拟多种材料物性。对普通用户没有直接影响,但材料科学的 AI 化是一个值得长期关注的交叉方向。
来源
· X:cb_doge — 六州司法部长要求调查 Sam Altman
· X:cb_doge — 青少年按 ChatGPT 建议服药致死案
· X:OpenAI Developers — Symphony 为每个任务启动 Codex 智能体
· Google Developers Blog — ADK 构建长时运行 Agent
· OpenAI Academy — 财务团队使用 Codex
· IT之家 — Anthropic 按 9000 亿美元估值融资
· X:邵猛 — Google 发布 Googlebook
· X:OpenAI Developers — Codex 跨应用多任务处理
· Claude Blog — Anthropic 安全团队用 Claude Code 搭建 CLUE 平台
· GitHub Blog — Copilot 个人计划更新
· GitHub Blog — 用 Copilot CLI 搭建 Roguelike 游戏
· GitHub — Statewright 可视化状态机
· X:Microsoft Research — MatterSim-MT 材料科学多任务模型
夜雨聆风