一句话总结
本期播客报道了Anthropic开发者日发布的新功能,以及埃隆·马斯克与Anthropic意外合作的消息,并分析了AI代理领域的最新趋势。
核心要点
•Anthropic开发者日重点转向智能体和应用,未发布重量级模型。
•马斯克、SpaceX与Anthropic联手合作,抢了开发者日风头。
•Anthropic推出“梦境”功能,用于代理记忆管理和自动学习。
•“结果”功能引入评分代理,提升任务质量审查。
•开源智能体生态在隐私和记忆管理方面领先于封闭实验室。
•Claude Code正演变为针对特定工作流优化的智能体生态系统。
行业新闻(Anthropic开发者日发布)
Anthropic举办了"Code with Claude"开发者日,没有发布新模型(没有Mythos公开版、没有Opus 4.8),焦点完全在Agent基础设施上——这本身就反映了2026年AI竞争的重心已经从模型转向了Harness。
三个核心发布。第一个是Dreaming——Agent的"REM睡眠"。这是一个定时运行的记忆管理系统,在Agent会话之间自动回顾过去的工作、提取模式、清理冗余记忆、发现单个Agent看不到的跨会话规律(比如反复犯的错误、团队共享的偏好)。下次调用时这些学习成果会被预加载。开源社区指出Hermes等项目早就在做类似的事——跨会话记忆、从经验中构建技能、持续变强。有评论者写道:"开源生态在Agent原语上领先闭源实验室将近一年了。"
第二个是Outcomes——Agent的"外部阅卷老师"。用户写一个评分标准,Agent完成任务后由一个独立的评分Agent对照标准打分。评分Agent不受任务Agent的推理过程影响,只看输出质量。不合格就打回重做。Anthropic内测数据:Word文档质量提升8.4%,PPT提升10.1%。这个功能把"外部评分Agent"从需要自己搭建变成了开箱即用的默认配置。
第三个是多Agent编排正式进入Managed Agents平台。主Agent拆分任务、分配给专用子Agent,子Agent各有独立模型、工具和系统提示,共享文件系统,主Agent可以中途检查进度,全程可审计。
另外Anthropic在开发者日前发布了Claude Finance——10个预置金融Agent(路演构建、会议准备、市场研究、月末结账等),可作为Cowork插件或Managed Agent部署,配套完整Cookbook。同时推出了Add-ins功能,Claude可以直接在Word等生产力软件内部工作(而不只是通过MCP连接器),获取软件原生上下文。
研究负责人Diane Peng透露了未来模型方向:更强的判断力和"代码品味"、"无限"上下文窗口(加了引号)、以及多Agent协调能力。"无限上下文"引发最多讨论——有人怀疑只是更好的压缩,有人认为如果上下文窗口真能无限扩展,模型就能从经验中持续学习,功能上等价于持续学习,AGI的争论将变得更加模糊。
Boris Cherney在活动上公开表示"vibe coding"这个词开始让他不爽,因为它严重低估了现在的实际工作方式。他说Anthropic内部已经没有任何手写代码,多个Claude在Slack上互相协调、循环执行、跨代码库解决问题。Andre Karpathy提议的"agentic engineering"Boris也觉得不太对,在征集更好的说法。
Dario在开场演讲中透露了一个惊人数据:Anthropic原本按每年10倍增长规划,结果今年Q1的年化增速是80倍——单季度80倍。
主题深度讨论:Elon的AI 3.0——从模型建造者变成算力军火商
开发者日所有发布在当天下午6点后被一条消息彻底淹没:Anthropic宣布与SpaceX达成合作,获得xAI的Colossus 1数据中心的完全使用权——22万块英伟达GPU、300MW算力,立即生效。
**对用户的直接影响:**Claude Code五小时限额翻倍;Pro和Max用户的高峰时段降速取消;API的Opus模型速率限制提升2-10倍。Anthropic增长负责人Amole Avasari解释:绝大多数用户卡在的是五小时限额而非周限额,所以先修这个,随着算力上线再逐步放开周限额。
**这笔交易为什么能成:**双方各有急需。Anthropic这一整年都在被算力不足折磨——用户体验持续恶化、Mythos不敢公开发布、OpenAI趁机猛攻。xAI则是另一种困境——Grok模型数月没更新、没有像样的Agent产品、联合创始人一个个离职、Elon自己承认"公司第一次没建对"。Cursor合作也名不副实——The Information报道双方并无联合开发模型的计划。但xAI坐拥海量闲置GPU。Derek Thompson的总结最精准:Musk有算力没模型,Anthropic有模型没算力,新联盟由此而生。
更大的棋局:Elon的AI战略三阶段
节目主持人认为这笔交易的意义远超算力租赁。Elon的AI战略经历了三个阶段:1.0是OpenAI联合创始人;2.0是xAI模型建造者(Grok);3.0是算力基础设施商——本质上从"做Sam Altman/Dario的事"转向了"做黄仁勋的事"。
这个转向有深层逻辑。Rohin Shah的框架很精准:Elon的天赋在于"已知但极难的事"——把资金、人才和时间压缩到极致做出大规模硬件系统(SpaceX、Tesla、Colossus)。但AI前沿模型属于"未知且极难的事"——需要的不是执行力而是研究突破,而"我们不知道怎么用资源换来思想家"。这解释了为什么xAI在模型上始终落后前沿实验室,但Colossus数据中心的建设速度让所有人震惊。
SpaceX合并xAI可能从一开始就不是为了Grok,而是为了获得地面算力基础设施的立足点——Elon曾多次谈及未来的轨道数据中心,这条路径从地面GPU仓库开始,向天空延伸。xAI甚至将作为独立公司解散,变成"SpaceX AI"。Grok不会立刻放弃——X/Twitter仍然需要它,Optimus机器人未来也可能用到——但战略重心已经非常清晰。
行业反应和下一步
Aaron Levy(Box CEO):"SpaceX作为垂直整合的AI算力公司,完全说得通。" Dean Ball:"Elon真正的神级能力是在物理世界造东西,Colossus上线速度超过所有人预期,这是美国的巨大资产。" 社区最直白的反应来自Chubby:"好了Anthropic,给我们看看22万块GPU和310MW能让你做什么。"
OpenAI会不会做出反应?Zuckerberg会不会成为另一个算力供应方?没人知道,但AI竞争的格局确实在一夜之间发生了结构性变化。
提到的产品/技术
•Anthropic
•Claude Code
•OpenAI
•GPT-55
•Kdex
•Opus 47
•Hermes
•EVA
•G Brian
对 Vibe Coder 的启发
关注开源智能体生态在隐私和记忆管理上的进展,可结合Anthropic的托管智能体功能提升自动化效率。
🎧 扫码收听音频版
扫描下方二维码,收听完整音频 & 查看原文

觉得有用?点个 在看 和 关注 支持一下
夜雨聆风