AI 首次获得数学界普遍认可。
数学突破
OpenAI 的 GPT-5.4 Pro 解决了 Erdős 问题 #1196,这是 1966 年提出的关于 primitive sets 的数学猜想。
这次突破之所以特殊,不是因为模型又刷了一个榜单,而是因为数学界罕见地给予了普遍认可。斯坦福助理教授 Jared Duker Lichtman(该问题的原始证明者)亲自验证,并称这是潜在的 "Book proof",优雅到符合 Erdős 的理想。
Terence Tao 也指出了与素数分布的新联系。解决方案已被加入 erdosproblems.com。
这标志着 AI 在纯数学领域的首次真正胜利——不是辅助工具,而是独立完成了连顶尖专家都认可的证明。
开发者工具演进
Andrew Ng 发布新课程,教授 Spec-Driven Development with Coding Agents。核心思想简单但有力:与其让代理凭感觉写代码(vibe coding),不如先写详细规格定义要构建的内容,然后用规格控制代理在项目复杂性增长时保持控制。
Claude Code 桌面版重新设计,支持并排运行多个会话,新增侧边栏管理。Anthropic 还发布了 11 个官方 Plugins,全部免费开源,覆盖销售、营销、法律、金融、客服、产品管理等领域。
更关键的是,Claude Plugins 本质上是一个 bundle:包含 Skills(教 Claude 如何执行特定任务)、Connectors(实时链接外部工具)、Slash Commands(触发整个工作流)、Sub-agents(并行处理任务片段)。
这不是代码 vs canvas 的争论,而是两者融合。
模型更新
Google 发布 Gemini 3.1 Flash TTS,最可控的文本转语音模型。通过 inline audio tags,可以精确控制语音风格、语速和节奏,甚至支持 [whispers]、[laughs] 等非语言声音标签。支持 70+ 种语言,所有输出都有 SynthID 水印。
OpenAI 发布 GPT-5.4-Cyber,网络安全专用版本,为经过认证的网络安全防御者提供更高级的防御工作流程。
Google Gemma 4 进入本地 AI 协调时代,能够评估场景并推理需要询问什么,调用分割模型执行视觉任务,支持自然语言迭代查询——全部在笔记本电脑上离线运行。
产业动向
Rohan Paul 引用 Brad Gerstner 的分析:AI 经济学发生根本性变化。OpenAI 的计算利润率从 35% 提升到 70%,Anthropic 从 -94% 转为 +40%。拥有自有计算资源的公司可以在收入增长的同时保持基础设施成本固定,物理电力成为主要瓶颈。
Emir Atli 宣布筹集 5000 万美元构建首个 AI Revenue Agent,运行新业务开发、扩展现有业务、销售线索挖掘。
硬件与机器人
Tesla AI5 芯片流片成功,单个芯片提供约 5 倍于双 AI4 配置的实际计算能力,匹配 Nvidia H100 性能。这为 FSD、Robotaxi 和 Optimus 人形机器人提供强大支持。
Google DeepMind 与 Boston Dynamics 合作,为 Spot 机器人提供 Gemini Robotics 具身推理模型,让机器人更好地理解环境、识别物体、遵循简单命令。
乐聚机器人推出世界首个人形机器人自动化工厂,年产能超过 10,000 台。
观察
AI 创业正在分化。获胜的公司不会像 AI 创业公司,而是看起来像一家无聊的公司,静静地从一个工作流中削减了一半的人力。
真正的价值在于具体场景的实际应用,而非炫技式的创新。
夜雨聆风