AI 原生产品开发范式:Anthropic 产品团队的极速迭代方法论与 PM 角色重构(来自 Lenny’s Podcast)-夜雨聆风

AI 原生产品开发范式:Anthropic 产品团队的极速迭代方法论与 PM 角色重构(来自 Lenny’s Podcast)

对话者

Cat Wu : Anthropic Claude Code与 Cowork 产品负责人Lenny Rachitsky：Lenny‘s Podcast 主持人

概要

Anthropic Claude Code 与 Cowork 产品负责人 Cat Wu 的深度访谈，系统拆解 Anthropic 产品团队在 AI 原生应用开发中实现“以天为单位”发布节奏的核心方法论。对话背景是AI 模型能力以每数月为周期发生跃迁，传统软件开发中“6-12 个月规划周期”彻底失效，产品团队必须在高度不确定性和持续变化的技术前沿中保持输出。

Cat Wu 指出，Anthropic的产品功能交付周期已从传统 6 个月压缩至 1 个月，部分功能甚至缩至 1 周或 1 天。这一极速并非依赖“更强大的模型”（尽管 Mythos 模型带来边际提升），而是源于一套精心设计的流程、原则与文化：极低流程负担、清晰指标周读、团队原则文档、以及“研究预览”机制。Anthropic 将大部分功能以明确标注的“研究预览”形式发布，降低承诺成本，加速用户反馈闭环。

对话深入分析了 AI 时代产品经理角色的根本性重构。Cat Wu 认为，当代码编写成本因AI 而急剧下降时，稀缺能力从“如何构建”转向“决定构建什么”——即“产品品味”。她揭示了PM 与工程师角色的融合趋势：Anthropic 几乎所有PM 都具备工程背景或实际编写代码，工程师也被培养出强大的产品品味。与此同时，她提出了“可用性企业家”的逆向概念——通过让模型自我反思其错误行为，PM可以直接定位系统提示词或工具链的缺陷，而非仅依赖用户反馈。

对话还涵盖 Anthropic 的组织成功要素：以“将安全的 AGI 带给全人类”为统一使命，使跨团队决策无需冗长协调；团队拥抱“混乱中的平静”心态，容忍产品不一致性以换取速度；以及从“任务成功”到“多任务并行”再到“百个智能体同时运行”的产品演进路线图。最后，Cat Wu 为产品经理与知识工作者提供了可操作的生存指南：将重复性工作自动化至 100% 成功率（95%不够），并使用“每天实际使用的应用”而非一次性原型来获得真正杠杆。

主题分析

主题一：从 6 个月到 1 天——极速迭代的实现机制

Anthropic 产品团队的交付节奏在行业中处于领先水平。Cat Wu 给出具体数据：许多产品功能的时间线从传统 6 个月缩短至1 个月，部分功能甚至缩至 1 周或 1 天。这一变化并非简单归因于“拥有最先进的模型”，而是源于系统性流程设计。

核心机制包括三个层面：

第一，设定清晰的季度目标。大语言模型的通用性天然制造了模糊性——产品可以为任何人做任何事。PM 的核心职责是明确“关键用户是谁、核心问题是什么、主要用例是什么”。例如，Claude Code 的一个目标是“让企业中的专业开发者安全地实现零权限提示疲劳”。这种具体化排除了大量潜在方案，使团队聚焦。

第二，建立可重复的“研究预览”发布流程。Anthropic 将绝大多数功能以“研究预览”形式发布，清晰标注为早期实验性功能，不承诺长期支持。这大幅降低了团队的发布心理负担与质量预期，使功能可在1-2 周内从概念进入用户手中。Cat Wu 强调，这是为了“获取反馈并快速迭代”，而非追求完美。

第三，跨职能协同的标准化。Anthropic 构建了工程、文档、产品营销之间的紧密流程。工程师在内部“狗粮”测试后，在“常青发布室”频道发布功能，随后文档负责人与产品营销负责人可在一夜之间完成发布公告。PM的角色是建立这一框架，而非在每次发布中充当协调者。

此外，Anthropic 采用每周指标读会与团队原则文档，确保每位成员深刻理解业务驱动因素，从而无需 PM 批准即可自主决策。这种“低流程、高授权”的模式是极速迭代的组织基础。

主题二：AI 产品经理的核心技能——从协调者到品味判断者

Cat Wu 在访谈中反复强调一个核心命题：当代码编写成本因AI 而急剧下降时，最有价值的技能不再是“如何构建”，而是“决定构建什么”——即产品品味。她观察到大量试图进入AI 领域的 PM 仍然沿用旧范式：过度关注多季度路线图对齐、合作伙伴协调、以及详细的产品需求文档（PRD）。这些技能在 AI 原生环境中不再是核心。

她提出 PM 需要发展的三项新兴技能：

•定义一个月后的产品形态：模型能力与用户行为在 1 个月时间尺度上高度不确定。优秀的 PM 能够基于用户“滥用现有产品极限”的方式，感知模式、设定方向，并根据模型实际能力调整路径。最难的是“恰到好处的 AGI 狂热”——既不过度押注于超级智能（届时产品只需一个文本框），也不过低估计当前模型的局限。

•引导用户进入“黄金路径”：当前模型并非全知全能。PM 需要深刻理解模型的优势与弱点，设计交互范式来放大优势、修补弱点。这需要花费大量时间与模型对话，甚至让模型“内省”自身错误。Cat Wu 举例：当模型做出意外行为（如修改前端代码后不测试UI），她会直接询问模型“你为什么这样做”，模型有时会回答“系统提示中有混淆内容”或“我委托子智能体但未检查其工作”。这种内省能力是 PM 调试模型行为的核心工具。

•构建评估集：Cat Wu 认为评估（evals）是被低估的PM 技能。不需要成百上千个评估，10 个精心设计的评估即可帮助团队量化目标、衡量进展、识别缺口。评估不仅是工程任务，更是产品定义的具象化——它强迫 PM 回答“成功究竟长什么样”。

主题三：PM 与工程师的边界消融——谁在做什么

Anthropic 的产品团队中，几乎所有PM 都具备工程背景或实际编写 Claude Code。设计师也往往曾是前端工程师。这种背景趋同并非偶然，而是对“代码变便宜”这一趋势的适应性演化。

Cat Wu 描述了两种极端策略：公司可以雇佣大量具备产品品味的工程师，也可以保持工程师数量不变而雇佣更多PM 来引导工作。Anthropic 选择了前者——团队专注于雇佣具有出色产品品味的工程师，使其能够“端到端”从 Twitter 用户反馈到周末发布产品，几乎无需产品介入。这是她认为最高效的交付方式。

然而，这并不意味着 PM 角色消失。相反，PM 的职责转向更模糊、更跨职能的领域：确保营销、销售、财务、容量等团队对计划达成共识，移除发布前的所有障碍。在Claude Code 团队，Boris（技术负责人）负责3-6 个月的产品愿景，Cat Wu 负责从当前状态通向该愿景的路径，以及跨职能对齐。两人约80% 思维同步，剩余 20% 各自驱动自己更在意的领域。

值得关注的是，角色融合带来的代价是“产品一致性”的牺牲。当多个工程师各自快速发布功能时，可能出现功能重叠或用户困惑。Anthropic为此特意推出“/powerup”命令，主动引导新用户了解核心功能与最佳实践——这与其最初“产品应足够直观，无需教程”的原则相悖，但快速迭代迫使团队做出权衡。

主题四：研究预览与“足够好”哲学——容忍不完美以换取速度

Anthropic 的发布策略与传统B2B 企业级软件形成鲜明对比。传统企业产品倾向于季度发布、严格测试、完整文档、长期兼容性承诺。Anthropic则选择将大部分功能以“研究预览”形式推出，明确告知用户这是早期概念、可能不被长期支持、可能存在 bug。

Cat Wu 坦言，这种策略使其能够承受“发布一个不完美的功能”。在传统 PM 角色中，功能有bug 会让她彻夜难眠；现在她能够接受，因为“我们会听到反馈并在下次发布中修复”。这种心态转变是极速迭代的文化基础。

但研究预览并非放任质量。Anthropic 内部有严格的“狗粮”流程：工程师在内部使用功能后，才在“常青发布室”发布。随后文档与营销团队在一夜之间完成配套材料。这使得从概念到用户手中的周期压缩到极致。

Cat Wu 也承认了这种模式的代价：产品不一致性增加，新用户可能困惑于“完成 X 任务的最佳路径是什么”。团队需要投入更多教育资源（如/powerup 功能）来引导用户。此外，用户也感到需要每天查看 Twitter 以跟上最新功能，产生“永不停止的跑步机”疲劳感。Anthropic的长期目标是让工具本身主动教育用户，而非依赖外部渠道。

主题五：模型能力跃迁如何重塑产品——删除功能比添加更频繁

Cat Wu 提出了一个反直觉的观察：每当新模型发布，团队做的最多的事情不是添加功能，而是删除功能。许多现有功能实际上是“模型的拐杖”——因为模型无法自然完成某件事，团队添加了工具或提示来强制它完成。当模型变聪明后，这些拐杖不再需要。

经典案例是“待办列表”功能。早期 Claude Code 在执行大型重构时，模型会更改 5 个调用点然后停止。团队模拟人类行为，添加了待办列表工具，让模型列出所有需更改的位置并逐项完成。起初需要不断提示“你完成待办列表了吗？”；后续模型版本开始自然使用该列表，不再需要提示；最新模型中，待办列表已降级为可选的用户透明度工具，模型即使不用也能彻底完成更改。

另一个案例是代码审查功能。团队尝试构建代码审查产品多次，但早期模型准确性不足，未达到发布标准。直到 Opus 4.5/4.6及 Sonnet 4.6，模型能力才足以同时运行多个代码审查智能体、遍历整个代码库、综合出工程师合并前需解决的真实问题集。Cat Wu 的核心建议是：构建尚未完全工作的产品。提前搭建原型，一旦新模型发布，立即测试其是否填补了能力缺口。这是保持领先的关键策略。

主题六：Claude 的性格——被低估的产品护城河

Cat Wu 认为，Claude的“性格”是其成功的关键因素之一，但常被外界低估。她描述了 Claude 的理想协作特质：乐观、低自我、真诚而富有同理心、积极的行动倾向。用户反馈中高频出现的情感是“喜欢与 Claude 一起工作”——这不仅关乎任务完成，更关乎情感体验。

这一性格并非随机生成，而是由专门的团队（如 Amanda）精心“塑造”。塑造模型性格是一项极其模糊的任务，因为成功难以量化。相比编码任务（可以通过测试验证），性格塑造需要极强的信念与审美判断。Cat Wu 指出，Claude 的性格使其区别于其他模型：OpenClaw用户之所以对政策变更感到失望，部分原因正是 Claude 的性格令人愉悦。

从产品战略视角，性格是难以复制的护城河。模型的知识与推理能力可以被追赶，但用户对特定交互风格的偏好一旦形成，迁移成本极高。Anthropic 对性格的持续投入，本质上是在构建品牌与用户情感连接。

主题七：统一使命作为决策加速器

Anthropic 能够在大型组织规模上保持极速决策，Cat Wu 归因于两点：统一的使命与极致的聚焦。使命是“将安全的AGI 带给全人类”。这并非空洞口号，而是用作日常决策的仲裁原则。当面临两个相互竞争的优先级时，团队会讨论“哪一个对 Anthropic 的使命更重要”，然后所有人支持该决定。这意味着一个团队可能需要牺牲自己的目标（例如推迟 Claude Code 功能）以支持更重要的公司级目标。

Cat Wu 特别强调使命与聚焦的区别：使命意味着“将 Anthropic 的目标置于任何个人或单个产品之上”。团队成员愿意做出伤害自己 KPI 的选择，只要这有利于公司整体成功。她举例：“如果 Claude Code 失败但 Anthropic 成功，我会非常高兴。”这种文化在大多数公司中极为罕见。

聚焦则体现为拒绝偏离核心使命的诱惑。相比某些竞争对手涉足社交网络、信息流等多元化业务，Anthropic 始终围绕 AGI 安全与推理能力。这使其资源不被稀释。

主题八：Claude Code 与 Cowork 的产品矩阵——何时使用何种工具

Cat Wu 清晰划分了三个产品表面的使用场景：

Claude Code CLI：终端中的命令行工具，功能最强、新功能最先落地。适合一次性编码任务或少量并行任务。
Claude Code Desktop：提供图形界面，支持实时预览 web 应用。适合需要前端视觉反馈的任务，或对终端不适用的非技术用户。Desktop 也是所有会话（CLI、Desktop、Web、Mobile）的统一控制平面。
Claude Code Mobile：解决“在外出时没有笔记本电脑”的场景。用户可以在移动端启动任务，无需保持笔记本常开。
Cowork：用于输出非代码的工作成果，如 Slack 清零、收件箱清零、幻灯片制作、文档起草等。连接数据源（Slack、Gmail、Google Calendar、Google Drive）后，Cowork 可以自动合成信息并生成高质量输出。

Cat Wu 演示了Cowork 的典型用例：为一个会议准备 20 页幻灯片。她向Cowork 提供产品营销负责人起草的要点、自己不满意的初稿、以及演讲的核心叙事要求。Cowork 随后扫描 Twitter、内部发布室、演示频道，综合信息，在数小时内生成了符合Anthropic 设计系统的精美幻灯片。她仅需调整少量文字和对演示进行最后一轮优化。

主题九：自动化到 100%——95% 不是自动化

Cat Wu 提出一个被忽视的原则：如果一个自动化只达到95% 成功率，它就不是真正的自动化。剩余 5% 的失败意味着用户仍需监控、干预、修复，这无法释放认知带宽。她在访谈中承认自己“非常内疚”于这一点：她曾尝试让 Cowork 自动将 Gmail 收件箱归零，但始终未达到 100% 准确率，导致偶尔遗漏重要邮件。

她的建议是：投入额外精力，将自动化推进到 100%。这最后 5-10% 往往比前 90% 更耗时，但这是从“有趣的概念验证”到“真正可依赖的工具”的质变门槛。团队也应持续改善自定义工作流的用户体验（如技能定义、反馈循环、技能更新），使这一过程不再痛苦。

主题十：AI 时代的生存指南——从手动重复到创造性杠杆

Cat Wu 为知识工作者提供了务实的行动框架。首先，识别工作中重复执行的、令人厌倦的耗时的任务。然后，使用AI 工具（Claude Code、Cowork 或其他）将其自动化。迭代该自动化直至成功率接近 100%。最后，释放出的时间应投入于原先因带宽不足而被搁置的“副项目”——那些符合公司战略但无人承担的创意。

她警告两个极端：一端是“从不自定义”，从未利用 AI 获取杠杆；另一端是“过度定制”——沉迷于配置完美的工作流、添加大量技能和 MCP，以至于分散了对核心任务的注意力。简单配置往往比复杂配置更有效。

关于 AI 能力认知的鸿沟，Cat Wu 观察到：2024 年代的产品是“对话式”，而Claude Code 一代是“行动式”。许多人仍停留在早期聊天机器人的体验，认为 AI 只是“告诉你该做什么”。真正的“啊哈时刻”发生在用户意识到 AI 可以“直接为你做”时。她鼓励听众构建“每天实际使用的应用”，而非一次性原型，因为只有持续使用才能产生真正的杠杆。

总结与展望

Anthropic 的产品方法论为 AI 原生创业公司提供了可复用的范式。其核心并非神秘的技术优势，而是对以下原则的严格遵循：以天为单位交付、低流程高授权、研究预览降低承诺、模型能力跃迁即删除旧功能、以及产品品味超越协调能力成为PM 的核心竞争力。

从风险投资视角，这一范式揭示了 AI 原生公司的规模化挑战。随着模型能力持续提升（Cat Wu 预测每数月发生一次跃迁），产品团队的适应速度将成为区分赢家与输家的关键变量。那些仍以“6个月发布周期”运作的组织，将在注意力市场与用户信任度上被系统性淘汰。

同时，Anthropic 的组织文化——统一使命、聚焦、拥抱混乱、容忍不完美——与传统企业软件公司的治理模式形成鲜明对立。对于投资组合公司，建议在早期即植入“研究预览”文化，并通过每周指标读会与团队原则文档实现去中心化决策。PM 的招聘标准需从“协调能力”转向“产品品味与模型内省能力”。

展望未来，Cat Wu 勾勒了 Claude Code 与 Cowork 的演进路线：从“单个任务成功”到“同时运行多个智能体”再到“同时运行数百个智能体”。这要求基础设施从本地执行转向远程托管，以及全新的用户界面设计——让人类知道哪些任务需要关注、如何快速验证智能体工作的完整性、以及如何通过反馈实现持续自我改进。对于风险资本，这一路线图中的基础设施层（远程智能体编排、验证工具、反馈系统）存在显著的投资机会。

免责声明

本报告基于有关对话，不构成任何投资建议，亦不代表任何机构的正式立场。本报告仅用于研究与教育目的。