AI 原生产品开发范式:Anthropic 产品团队的极速迭代方法论与 PM 角色重构(来自 Lenny’s Podcast)
对话者
Cat Wu : Anthropic Claude Code与 Cowork 产品负责人Lenny Rachitsky:Lenny‘s Podcast 主持人
概要
Anthropic Claude Code 与 Cowork 产品负责人 Cat Wu 的深度访谈,系统拆解 Anthropic 产品团队在 AI 原生应用开发中实现“以天为单位”发布节奏的核心方法论。对话背景是AI 模型能力以每数月为周期发生跃迁,传统软件开发中“6-12 个月规划周期”彻底失效,产品团队必须在高度不确定性和持续变化的技术前沿中保持输出。
Cat Wu 指出,Anthropic的产品功能交付周期已从传统 6 个月压缩至 1 个月,部分功能甚至缩至 1 周或 1 天。这一极速并非依赖“更强大的模型”(尽管 Mythos 模型带来边际提升),而是源于一套精心设计的流程、原则与文化:极低流程负担、清晰指标周读、团队原则文档、以及“研究预览”机制。Anthropic 将大部分功能以明确标注的“研究预览”形式发布,降低承诺成本,加速用户反馈闭环。
对话深入分析了 AI 时代产品经理角色的根本性重构。Cat Wu 认为,当代码编写成本因AI 而急剧下降时,稀缺能力从“如何构建”转向“决定构建什么”——即“产品品味”。她揭示了PM 与工程师角色的融合趋势:Anthropic 几乎所有PM 都具备工程背景或实际编写代码,工程师也被培养出强大的产品品味。与此同时,她提出了“可用性企业家”的逆向概念——通过让模型自我反思其错误行为,PM可以直接定位系统提示词或工具链的缺陷,而非仅依赖用户反馈。
对话还涵盖 Anthropic 的组织成功要素:以“将安全的 AGI 带给全人类”为统一使命,使跨团队决策无需冗长协调;团队拥抱“混乱中的平静”心态,容忍产品不一致性以换取速度;以及从“任务成功”到“多任务并行”再到“百个智能体同时运行”的产品演进路线图。最后,Cat Wu 为产品经理与知识工作者提供了可操作的生存指南:将重复性工作自动化至 100% 成功率(95%不够),并使用“每天实际使用的应用”而非一次性原型来获得真正杠杆。
主题分析
主题一:从 6 个月到 1 天——极速迭代的实现机制
Anthropic 产品团队的交付节奏在行业中处于领先水平。Cat Wu 给出具体数据:许多产品功能的时间线从传统 6 个月缩短至1 个月,部分功能甚至缩至 1 周或 1 天。这一变化并非简单归因于“拥有最先进的模型”,而是源于系统性流程设计。
核心机制包括三个层面:
第一,设定清晰的季度目标。大语言模型的通用性天然制造了模糊性——产品可以为任何人做任何事。PM 的核心职责是明确“关键用户是谁、核心问题是什么、主要用例是什么”。例如,Claude Code 的一个目标是“让企业中的专业开发者安全地实现零权限提示疲劳”。这种具体化排除了大量潜在方案,使团队聚焦。
第二,建立可重复的“研究预览”发布流程。Anthropic 将绝大多数功能以“研究预览”形式发布,清晰标注为早期实验性功能,不承诺长期支持。这大幅降低了团队的发布心理负担与质量预期,使功能可在1-2 周内从概念进入用户手中。Cat Wu 强调,这是为了“获取反馈并快速迭代”,而非追求完美。
第三,跨职能协同的标准化。Anthropic 构建了工程、文档、产品营销之间的紧密流程。工程师在内部“狗粮”测试后,在“常青发布室”频道发布功能,随后文档负责人与产品营销负责人可在一夜之间完成发布公告。PM的角色是建立这一框架,而非在每次发布中充当协调者。
此外,Anthropic 采用每周指标读会与团队原则文档,确保每位成员深刻理解业务驱动因素,从而无需 PM 批准即可自主决策。这种“低流程、高授权”的模式是极速迭代的组织基础。
主题二:AI 产品经理的核心技能——从协调者到品味判断者
Cat Wu 在访谈中反复强调一个核心命题:当代码编写成本因AI 而急剧下降时,最有价值的技能不再是“如何构建”,而是“决定构建什么”——即产品品味。她观察到大量试图进入AI 领域的 PM 仍然沿用旧范式:过度关注多季度路线图对齐、合作伙伴协调、以及详细的产品需求文档(PRD)。这些技能在 AI 原生环境中不再是核心。
她提出 PM 需要发展的三项新兴技能:
•定义一个月后的产品形态:模型能力与用户行为在 1 个月时间尺度上高度不确定。优秀的 PM 能够基于用户“滥用现有产品极限”的方式,感知模式、设定方向,并根据模型实际能力调整路径。最难的是“恰到好处的 AGI 狂热”——既不过度押注于超级智能(届时产品只需一个文本框),也不过低估计当前模型的局限。
•引导用户进入“黄金路径”:当前模型并非全知全能。PM 需要深刻理解模型的优势与弱点,设计交互范式来放大优势、修补弱点。这需要花费大量时间与模型对话,甚至让模型“内省”自身错误。Cat Wu 举例:当模型做出意外行为(如修改前端代码后不测试UI),她会直接询问模型“你为什么这样做”,模型有时会回答“系统提示中有混淆内容”或“我委托子智能体但未检查其工作”。这种内省能力是 PM 调试模型行为的核心工具。
•构建评估集:Cat Wu 认为评估(evals)是被低估的PM 技能。不需要成百上千个评估,10 个精心设计的评估即可帮助团队量化目标、衡量进展、识别缺口。评估不仅是工程任务,更是产品定义的具象化——它强迫 PM 回答“成功究竟长什么样”。
主题三:PM 与工程师的边界消融——谁在做什么
Anthropic 的产品团队中,几乎所有PM 都具备工程背景或实际编写 Claude Code。设计师也往往曾是前端工程师。这种背景趋同并非偶然,而是对“代码变便宜”这一趋势的适应性演化。
Cat Wu 描述了两种极端策略:公司可以雇佣大量具备产品品味的工程师,也可以保持工程师数量不变而雇佣更多PM 来引导工作。Anthropic 选择了前者——团队专注于雇佣具有出色产品品味的工程师,使其能够“端到端”从 Twitter 用户反馈到周末发布产品,几乎无需产品介入。这是她认为最高效的交付方式。
然而,这并不意味着 PM 角色消失。相反,PM 的职责转向更模糊、更跨职能的领域:确保营销、销售、财务、容量等团队对计划达成共识,移除发布前的所有障碍。在Claude Code 团队,Boris(技术负责人)负责3-6 个月的产品愿景,Cat Wu 负责从当前状态通向该愿景的路径,以及跨职能对齐。两人约80% 思维同步,剩余 20% 各自驱动自己更在意的领域。
值得关注的是,角色融合带来的代价是“产品一致性”的牺牲。当多个工程师各自快速发布功能时,可能出现功能重叠或用户困惑。Anthropic为此特意推出“/powerup”命令,主动引导新用户了解核心功能与最佳实践——这与其最初“产品应足够直观,无需教程”的原则相悖,但快速迭代迫使团队做出权衡。
主题四:研究预览与“足够好”哲学——容忍不完美以换取速度
Anthropic 的发布策略与传统B2B 企业级软件形成鲜明对比。传统企业产品倾向于季度发布、严格测试、完整文档、长期兼容性承诺。Anthropic则选择将大部分功能以“研究预览”形式推出,明确告知用户这是早期概念、可能不被长期支持、可能存在 bug。
Cat Wu 坦言,这种策略使其能够承受“发布一个不完美的功能”。在传统 PM 角色中,功能有bug 会让她彻夜难眠;现在她能够接受,因为“我们会听到反馈并在下次发布中修复”。这种心态转变是极速迭代的文化基础。
但研究预览并非放任质量。Anthropic 内部有严格的“狗粮”流程:工程师在内部使用功能后,才在“常青发布室”发布。随后文档与营销团队在一夜之间完成配套材料。这使得从概念到用户手中的周期压缩到极致。
Cat Wu 也承认了这种模式的代价:产品不一致性增加,新用户可能困惑于“完成 X 任务的最佳路径是什么”。团队需要投入更多教育资源(如/powerup 功能)来引导用户。此外,用户也感到需要每天查看 Twitter 以跟上最新功能,产生“永不停止的跑步机”疲劳感。Anthropic的长期目标是让工具本身主动教育用户,而非依赖外部渠道。
主题五:模型能力跃迁如何重塑产品——删除功能比添加更频繁
Cat Wu 提出了一个反直觉的观察:每当新模型发布,团队做的最多的事情不是添加功能,而是删除功能。许多现有功能实际上是“模型的拐杖”——因为模型无法自然完成某件事,团队添加了工具或提示来强制它完成。当模型变聪明后,这些拐杖不再需要。
经典案例是“待办列表”功能。早期 Claude Code 在执行大型重构时,模型会更改 5 个调用点然后停止。团队模拟人类行为,添加了待办列表工具,让模型列出所有需更改的位置并逐项完成。起初需要不断提示“你完成待办列表了吗?”;后续模型版本开始自然使用该列表,不再需要提示;最新模型中,待办列表已降级为可选的用户透明度工具,模型即使不用也能彻底完成更改。
另一个案例是代码审查功能。团队尝试构建代码审查产品多次,但早期模型准确性不足,未达到发布标准。直到 Opus 4.5/4.6及 Sonnet 4.6,模型能力才足以同时运行多个代码审查智能体、遍历整个代码库、综合出工程师合并前需解决的真实问题集。Cat Wu 的核心建议是:构建尚未完全工作的产品。提前搭建原型,一旦新模型发布,立即测试其是否填补了能力缺口。这是保持领先的关键策略。
主题六:Claude 的性格——被低估的产品护城河
Cat Wu 认为,Claude的“性格”是其成功的关键因素之一,但常被外界低估。她描述了 Claude 的理想协作特质:乐观、低自我、真诚而富有同理心、积极的行动倾向。用户反馈中高频出现的情感是“喜欢与 Claude 一起工作”——这不仅关乎任务完成,更关乎情感体验。
这一性格并非随机生成,而是由专门的团队(如 Amanda)精心“塑造”。塑造模型性格是一项极其模糊的任务,因为成功难以量化。相比编码任务(可以通过测试验证),性格塑造需要极强的信念与审美判断。Cat Wu 指出,Claude 的性格使其区别于其他模型:OpenClaw用户之所以对政策变更感到失望,部分原因正是 Claude 的性格令人愉悦。
从产品战略视角,性格是难以复制的护城河。模型的知识与推理能力可以被追赶,但用户对特定交互风格的偏好一旦形成,迁移成本极高。Anthropic 对性格的持续投入,本质上是在构建品牌与用户情感连接。
主题七:统一使命作为决策加速器
Anthropic 能够在大型组织规模上保持极速决策,Cat Wu 归因于两点:统一的使命与极致的聚焦。使命是“将安全的AGI 带给全人类”。这并非空洞口号,而是用作日常决策的仲裁原则。当面临两个相互竞争的优先级时,团队会讨论“哪一个对 Anthropic 的使命更重要”,然后所有人支持该决定。这意味着一个团队可能需要牺牲自己的目标(例如推迟 Claude Code 功能)以支持更重要的公司级目标。
Cat Wu 特别强调使命与聚焦的区别:使命意味着“将 Anthropic 的目标置于任何个人或单个产品之上”。团队成员愿意做出伤害自己 KPI 的选择,只要这有利于公司整体成功。她举例:“如果 Claude Code 失败但 Anthropic 成功,我会非常高兴。”这种文化在大多数公司中极为罕见。
聚焦则体现为拒绝偏离核心使命的诱惑。相比某些竞争对手涉足社交网络、信息流等多元化业务,Anthropic 始终围绕 AGI 安全与推理能力。这使其资源不被稀释。
主题八:Claude Code 与 Cowork 的产品矩阵——何时使用何种工具
Cat Wu 清晰划分了三个产品表面的使用场景:
- Claude Code CLI:终端中的命令行工具,功能最强、新功能最先落地。适合一次性编码任务或少量并行任务。
- Claude Code Desktop:提供图形界面,支持实时预览 web 应用。适合需要前端视觉反馈的任务,或对终端不适用的非技术用户。Desktop 也是所有会话(CLI、Desktop、Web、Mobile)的统一控制平面。
- Claude Code Mobile:解决“在外出时没有笔记本电脑”的场景。用户可以在移动端启动任务,无需保持笔记本常开。
- Cowork:用于输出非代码的工作成果,如 Slack 清零、收件箱清零、幻灯片制作、文档起草等。连接数据源(Slack、Gmail、Google Calendar、Google Drive)后,Cowork 可以自动合成信息并生成高质量输出。
Cat Wu 演示了Cowork 的典型用例:为一个会议准备 20 页幻灯片。她向Cowork 提供产品营销负责人起草的要点、自己不满意的初稿、以及演讲的核心叙事要求。Cowork 随后扫描 Twitter、内部发布室、演示频道,综合信息,在数小时内生成了符合Anthropic 设计系统的精美幻灯片。她仅需调整少量文字和对演示进行最后一轮优化。
主题九:自动化到 100%——95% 不是自动化
Cat Wu 提出一个被忽视的原则:如果一个自动化只达到95% 成功率,它就不是真正的自动化。剩余 5% 的失败意味着用户仍需监控、干预、修复,这无法释放认知带宽。她在访谈中承认自己“非常内疚”于这一点:她曾尝试让 Cowork 自动将 Gmail 收件箱归零,但始终未达到 100% 准确率,导致偶尔遗漏重要邮件。
她的建议是:投入额外精力,将自动化推进到 100%。这最后 5-10% 往往比前 90% 更耗时,但这是从“有趣的概念验证”到“真正可依赖的工具”的质变门槛。团队也应持续改善自定义工作流的用户体验(如技能定义、反馈循环、技能更新),使这一过程不再痛苦。
主题十:AI 时代的生存指南——从手动重复到创造性杠杆
Cat Wu 为知识工作者提供了务实的行动框架。首先,识别工作中重复执行的、令人厌倦的耗时的任务。然后,使用AI 工具(Claude Code、Cowork 或其他)将其自动化。迭代该自动化直至成功率接近 100%。最后,释放出的时间应投入于原先因带宽不足而被搁置的“副项目”——那些符合公司战略但无人承担的创意。
她警告两个极端:一端是“从不自定义”,从未利用 AI 获取杠杆;另一端是“过度定制”——沉迷于配置完美的工作流、添加大量技能和 MCP,以至于分散了对核心任务的注意力。简单配置往往比复杂配置更有效。
关于 AI 能力认知的鸿沟,Cat Wu 观察到:2024 年代的产品是“对话式”,而Claude Code 一代是“行动式”。许多人仍停留在早期聊天机器人的体验,认为 AI 只是“告诉你该做什么”。真正的“啊哈时刻”发生在用户意识到 AI 可以“直接为你做”时。她鼓励听众构建“每天实际使用的应用”,而非一次性原型,因为只有持续使用才能产生真正的杠杆。
总结与展望
Anthropic 的产品方法论为 AI 原生创业公司提供了可复用的范式。其核心并非神秘的技术优势,而是对以下原则的严格遵循:以天为单位交付、低流程高授权、研究预览降低承诺、模型能力跃迁即删除旧功能、以及产品品味超越协调能力成为PM 的核心竞争力。
从风险投资视角,这一范式揭示了 AI 原生公司的规模化挑战。随着模型能力持续提升(Cat Wu 预测每数月发生一次跃迁),产品团队的适应速度将成为区分赢家与输家的关键变量。那些仍以“6个月发布周期”运作的组织,将在注意力市场与用户信任度上被系统性淘汰。
同时,Anthropic 的组织文化——统一使命、聚焦、拥抱混乱、容忍不完美——与传统企业软件公司的治理模式形成鲜明对立。对于投资组合公司,建议在早期即植入“研究预览”文化,并通过每周指标读会与团队原则文档实现去中心化决策。PM 的招聘标准需从“协调能力”转向“产品品味与模型内省能力”。
展望未来,Cat Wu 勾勒了 Claude Code 与 Cowork 的演进路线:从“单个任务成功”到“同时运行多个智能体”再到“同时运行数百个智能体”。这要求基础设施从本地执行转向远程托管,以及全新的用户界面设计——让人类知道哪些任务需要关注、如何快速验证智能体工作的完整性、以及如何通过反馈实现持续自我改进。对于风险资本,这一路线图中的基础设施层(远程智能体编排、验证工具、反馈系统)存在显著的投资机会。
免责声明
本报告基于有关对话,不构成任何投资建议,亦不代表任何机构的正式立场。本报告仅用于研究与教育目的。
夜雨聆风