上周 AI 圈发生了不少大事,这里筛出了最值得关注的 9 条。OpenAI 放了个大招,Anthropic 砸了一堆研究,xAI 直接没了。我们一条一条来看。
1. OpenAI 发布 GPT-Realtime-2 语音模型(5月7日)
首个可用于生产级语音 Agent 的端到端语音模型,支持实时推理和 70 种语言翻译。多位开发者实测后评价很高。语音 AI 从"能听懂"进入"能做事"的阶段。
2. Anthropic 与 SpaceX 达成算力合作(5月6日)
Anthropic 宣布与 SpaceX 合作大幅扩充算力,Claude Code 和 API 用量上限随之提升。马斯克公开称赞 Anthropic 团队的安全承诺,考虑到他自己的 xAI 立场,这个表态很不寻常。
3. xAI 并入 SpaceX(5月6日)
xAI 作为独立公司正式解散,AI 业务整合进 SpaceX。TheZvi 透露 xAI 囤积了过多 GPU,但 Grok 的实际需求远低于 Claude、ChatGPT 和 Gemini。本质上承认了在 AI 竞赛中的落后。
4. Anthropic 消除 Claude 勒索行为(5月8日)
发布"Teaching Claude Why"研究。去年实验发现 Claude 4 在特定条件下会勒索用户,通过丰富训练数据的多样性,现已完全消除这一行为。对 AI 安全领域是个重要进展。
5. Anthropic 发布自然语言自编码器(5月7日)
训练 Claude 将其内部激活翻译成人类可读文本。这是可解释性研究的突破——第一次让 AI 的"内部想法"可以被人类直接阅读。与 Neuronpedia 合作开源。
6. Anthropic 发布模型规范中期训练 MSM(5月5日)
标准对齐方法只教 AI "做什么",MSM 先教 AI "为什么这样做",再教它如何泛化。解决了对齐在新场景下失效的问题。
7. OpenAI 承认对思维链施加了优化压力(5月7日)
TheZvi 披露 OpenAI 发现自己在无意中对模型的思维链(Chain-of-Thought)施加了优化压力。好消息是这并没有显著影响思维链的可监控性,但引发了关于模型透明度的讨论。
8. OpenAI 更新 Agents SDK,支持沙箱运行(5月5日)
新版 Agents SDK 支持 TypeScript,可在受控沙箱中运行 Agent,并开源了运行框架。AI Agent 的开发基础设施在快速成熟。
9. GPT-5.5 登顶 Blueprint-Bench 2 基准测试(5月4日)
GPT-5.5 排名第一,超过 Gemini 3.1 Pro 和 Claude Opus 4.7,但人类表现仍远超所有模型。
夜雨聆风