实现趋零,品味为王-AI 如何重塑软件产品的生产方式与团队角色

一、摘要

2026 年 6 月 28 日，Lenny 播客发布了一期与 OpenAI Codex 产品与工程负责人 Andrew Ambrosino 的深度对话。Andrew 曾是设计师、软件工程师，也是 YC 明星金融创业公司 Catch 的创始人，身兼 CEO、CTO 与产品负责人多职。作为当下最前沿 AI 软件团队的一线领导者，他提出的核心判断正在引发产品与研发从业者的广泛讨论：

“软件开发中最昂贵的东西，已经不再是“实现”，而是“品味”。” — Andrew Ambrosino，OpenAI Codex 负责人

这期对话最鲜明的立场，是对“AI 让写代码变便宜、于是不再需要产品经理”这一流行论断的正面反驳。Andrew 把这种想法称为“工程师的傲慢”：会用 AI 工具，并不等于具备专业的产品、设计或财务能力；专业岗位背后的纪律与方法论依然不可或缺。他的核心判断是——

“AI 没有消灭专业，而是把专业的门槛从“会不会做”提升到了“选什么做”。”

本文以这期对话为主线思考，分析其关于“专业门槛不降反升”“产品开发流程倒置”“品味成为稀缺能力”“角色坍塌与重叠”“AI 产品终极形态”五大核心观点，并结合国内外 AI 编程工具的落地数据、Vibe Coding 范式的演进争议、以及企业组织形态的变化，形成面向业界人士的系统性洞察。

核心结论

关键量化信号：Codex 自 2026 年 1 月起使用量增长6 倍，外部周活跃用户超500 万；OpenAI 内部约90%员工每周使用 Codex，覆盖工程、市场、财务、法务等岗位。这标志着 AI 正从“编程工具”扩展为“跨职能通用工作入口”。

二、对话背景与信源

2.1 视频与嘉宾

说明：本文的对话内容依据公开访谈的完整中文编译整理，并交叉核对了 OpenAI Codex 桌面应用发布的公开资料。由于视频原始字幕受平台访问限制，本文引用以经编辑的中文转述为准，不改变原意。

2.2 为什么这期对话值得业界重视

信源前沿：OpenAI Codex 是“自己写自己”的 AI 编程产品，团队的工作方式代表了 AI 原生组织的极端样本。

视角跨界：Andrew 兼具设计、工程、产品、创业多重背景，观点不局限于单一职能立场。

话题普适：产品流程倒置、品味稀缺、角色坍塌，是几乎所有软件团队在未来一两年都将面对的共性问题。

三、核心观点一：产品开发流程的“倒置”

Andrew 认为，当下作为产品领导者最难处理的事情之一，就是流程的倒置（the process is inverted）。过去的软件开发建立在一个隐含假设之上——“实现是昂贵的”，因此必须在前期通过文档、研究、原型来层层“去风险”，因为文档和设计比实现便宜。而这个假设已经被彻底改变。

图 1：软件产品开发流程从“线性前置去风险”到“多路并行、策划收敛”的倒置

3.1 从“实现驱动”到“策划驱动”

“对于某个我们急需做的功能，可能有 90 个不同的、没有协调的团队在各自实现和尝试。流程是倒过来的——实现不再是昂贵的部分，昂贵的是品味。” — Andrew Ambrosino

在 OpenAI 内部，“给人们无限的 token”意味着任何有想法的人都能直接把想法做出来。于是同一需求会自发涌现大量并行原型，产品团队的主要工作从“实现本身”转变为策划（curation）与整合：这 90 次尝试里哪些是好的？哪些应该融入其他方案？应该如何框定问题？这个功能的开关应该有几个分段？

业界印证：并行原型正在成为工程标配

Vercel v0 与 StackBlitz Bolt.new：一句自然语言可同时生成多个可运行前端版本，产品与设计直接在浏览器里对比取舍，把“先写规格再实现”压缩成“先看候选再收敛”。这正是 Andrew 描述的“90 个原型”的商业化形态。

GitHub Spark / Copilot Workspace：从一句意图出发生成完整应用骨架，开发者的角色前移为“审阅与引导”，GitHub 官方将其定位为“意图到应用”的策展式开发。

Anthropic Claude Artifacts 与国内“秒哒/文心快码”：非工程角色也能在对话中即时产出可交互原型，需求评审会上“边聊边生成三个版本当场投票”已在部分团队成为常态。

这些实践共同说明：流程倒置不是 OpenAI 的孤例，而是工具层已经把“实现”变成随手可得的公共品，倒逼组织把稀缺注意力重新分配到“判断与收敛”。

3.2 “PRD 已死”是一个危险的误读

市面上流行“PRD 已死、原型为王”的说法，但 Andrew 明确表示完全不认同。他的观点更为精细：当实现成本在每种媒介上都趋近于零时，直接跳到原型固然诱人（尤其对非工程背景的人），但工程师同样容易陷入“写大量没人读的文档”的陷阱。真正的问题不是“要不要文档”，而是——

“当时间变得充裕，为你想表达的观点选择正确的“媒介”，就变得前所未有地重要。” — Andrew Ambrosino

典型实践：头部团队为何仍然坚持“先写清楚”

亚马逊 PR/FAQ（未来新闻稿）：任何新产品立项必须先写一份“假想的发布新闻稿+常见问答”，用文字逼迫团队想清楚“为谁解决什么”。AI 时代原型再便宜，这份“方向文档”依然是决策锚点。

Basecamp 的 Shape Up：用“塑形文档”界定问题边界与胃口（appetite），刻意不画高保真原型，正是为避免团队过早对“精致外壳”做反应——与 Andrew 的“原始标记”忧虑完全一致。

Linear、Stripe 的写作文化：以高质量书面沟通著称的团队并未因 AI 放弃文档，反而更强调“把判断沉淀成文字”，因为原型能验证“怎么做”，却回答不了“该不该做、要做到哪一步”。

案例启示：“PRD 已死”混淆了两件事——被淘汰的是“为流程而写、无人阅读的仪式性文档”，被强化的是“为澄清判断而写的思考型文档”。媒介的价值不取决于形式新旧，而取决于它服务于哪一类问题。

3.3 “媒介与阶段的解耦”带来的新风险

Andrew 指出一个容易被忽视的深层变化：过去“媒介本身隐含了流程信号”——看起来像生产环境的东西，就意味着它处于流程后期、已被去风险、设计已评审。而现在这些信号被解耦了。一个由 AI 快速生成的原型可能“视觉上已经可以上线”，导致公司里足够多的人误以为“我们现在就能发布”，但实际上它仍处于早期探索阶段，既非正确的研究方向，也未必是用户真正需要的。

这里引出对话中一个精彩的类比——“原始标记（primary mark）”：画家在画布上落下的第一笔，会成为之后一切的回应对象。如果过早跳到精致原型，团队就只会对这个原型做出反应，而非对更大的想法做出反应。这正是“选择正确媒介”的价值所在。

四、核心观点二：真正稀缺的是“品味”

“品味（taste）”是这期对话被反复提及、也最容易被说烂的词。Andrew 特意对它做了拆解，强调品味远不止于审美。

图 2：“品味”作为 AI 时代新稀缺能力的四维构成

4.1 品味的四个维度

1. 审美判断：例如一个交互动画在语义上是否匹配它想传达的意思，是否“太跳”。这是最直观、但也只是其中一部分。

2. 系统思考：这个东西如何融入整个系统？它与代码库中其他部分应共享什么？这涉及抽象层的组织。

3. 方向判断：“如果我们什么都能造，那目标是什么？主题是什么？我们怎么到达那里？”——Andrew 认为这才是真正品味问题的核心。

4. 媒介选择：用什么形式（文档、原型、AB 测试）来呈现信息、达成目标，本身就是一种高阶判断。

4.2 为什么当前 AI 仍然做不好设计

Andrew给出了三层原因，分为“会消失的实际原因”与“更难解决的深层原因”：

设计更难评分：为“好设计／坏设计”构建训练反馈回路，远比“代码能否编译、能否跑通”繁重，因为人类审美是反馈机制中的必需环节。

缺乏飞轮激励：实验室历史上更倾向让模型擅长能“加速 AI 研究”的事情（如写对代码），设计不直接在这个飞轮里。

设计需要“新颖性”：软件工程希望模型偏向已知模式，而设计恰恰需要随机性与新颖。“如果模型每次都输出 Linear 官网那样的好设计，挑战反而不在这里。”

更棘手的是抽象层问题：品牌重塑的浅层版本是逐个更新 263 个组件，深层版本是理解“这两个看起来不同的东西”在语义上共享了什么交互模式。这种跨越“软件设计与底层代码”的抽象映射，在当前技术下仍“有点遥不可及”。

“让我们暂时为人类大脑鼓掌——想出全新的东西、而不是从已有模式中生成，这仍是人类目前最有价值的地方。” — 对话小结

业界镜像：把“品味”当作核心资产的公司

Linear：以“克制的产品品味”成为行业标杆，几乎不做 A/B 测试，而是靠团队对“什么是对的”的高度共识来收敛——这正是 Andrew 所说“方向判断”维度的极致体现。

Airbnb 的设计系统（DLS）与 Cereal：把设计语言抽象为可复用组件与原则，体现的正是“系统思考”——理解“不同界面在语义上共享了什么”，而非逐个像素堆砌。这恰是 Andrew 指出当前 AI 最难跨越的抽象层。

Midjourney／Figma AI 的边界：AI 已能生成惊艳的单张视觉，但在“一套跨 200+ 组件、可维护、语义自洽的产品设计系统”上仍显吃力——印证了“会画一张漂亮图 ≠ 懂产品设计”。

苹果与字节跳动的“审美护城河”：苹果长期以“克制与一致”建立品牌溢价；字节内部以“大力出奇迹”的 A/B 实验文化验证方向。两种路径分别对应“方向判断靠品味”与“方向判断靠数据”，代表了品味工程化的两种流派。

对照启示：当 AI 抹平了执行差距，企业之间的差距将越来越多地由“品味密度”决定——是否有一群人能稳定地做出“对的、协调的、有新鲜感的”判断。这是一种可以刻意培养、却难以被工具替代的组织能力。

五、核心观点三：角色的“坍塌”与重叠

图 3：AI 时代产品团队中 PM／设计／工程角色的重叠与“技术成员”内核

5.1 用“平均位置”而非“边界”定义角色

Andrew 观察到，在 Codex 组织内看到的角色坍塌比公司其他部门、乃至整个经济都更明显——部分原因是 Codex 是面向工程师的技术产品：设计师懂工程师语言，产品经理懂技术、会写代码。他提出一个很有价值的表述：

“每个人不再由“设计在哪停止、工程从哪开始”的边界来定义，而是由他们工作的“平均位置”来定义。你的角色，就是你花时间做的那些事情的平均值。” — Andrew Ambrosino

OpenAI 沿用了源自 Xerox、在研究型公司中常见的“技术成员（Member of Technical Staff）”称谓——职能不固定，切换角色和学习最佳实践都变得更容易，一个人的有效性不再与“是否熟练某个具体工具”绑定，而在于“能否进入正确的思维模式”。

5.2 对“取消产品角色”的明确警告

面对“每个人都变成构建者、可以取消产品这个角色”的流行论调，Andrew 表达了明确的担忧。他把“因为 AI 让写代码变便宜、就不再需要 PM”的推论称为“工程师的傲慢”——会操作 AI 工具，并不等于掌握了产品或财务这类专业岗位背后的纪律与方法论：

“取消角色”的危险在于，它可能连带否定“专长有可掌握的最佳实践”这一观念。

产品是一门有真实最佳实践、有真实试错、有真实流程的学科；不能因为“我写了几行代码”就把它抛弃。

边界（“这不是你的领域”）消失是好事，但存在平衡——不是每个人都能在广度和深度上做所有事，这也是“管理者不会消失”的原因。

“产品有它的技能成分，工程也有它的技能成分——很多工程师没有意识到，其他角色并不只是在“凭感觉做事”。” — Andrew Ambrosino

5.3 Dogfooding 驱动的组织形态

Codex 桌面应用的整个开发由“内部自测（dogfooding）”循环驱动：团队所有人都尽可能在这个应用里做事，即便它一开始不是最好的工具——正因为如此，它才有机会成为最好的工具。很多设计正是团队“边用边发现问题”完成的。Andrew 坦言这是一种“非常不舒服的处境”，而且团队的汇报线、协作方式“每周都在变”。

5.4 “区域联防”协作与“焖着”原型的规划策略

当同一需求会自发涌现大量并行原型、且团队边界持续流动时，传统“自上而下集中规划”的协作方式随之失效。Andrew 描述的新协作范式更像篮球里的“区域联防（zone defense）”：放弃精确的自顶向下拆分，让每个人各自覆盖一块“区域”，核心工作不再是“把任务做完”，而是策展、引导与对齐——在不断变化的态势中判断哪些原型值得推进、如何融合、如何收敛到统一方向。

与之配套的是一种反直觉的规划策略——“焖着（let it simmer）”原型：把未来可能需要的功能提前做成原型，如果当前底层模型的智力还“跑不通”，就先放着不动。一旦底层模型完成一次能力升级，这些旧原型可能无需改动外壳代码就能直接上线。

“产品的上限取决于底层的智力，而不是外壳。模型变聪明了，很多原来“跑不通”的原型就自然成立了。” — 对话要点提炼

这条策略的深意在于：在“实现趋零”的时代，团队真正应该积累的资产，不是一次性交付的代码，而是对“系统智力临界点”的预判——提前押注哪些形态会在下一代模型上成立，并用低成本原型占好位置。

组织实践：角色重叠正在被明确制度化

Shopify（2025 CEO 内部信）：Tobi Lütke 要求“申请增加人手前，先证明为什么 AI 做不了”，并把“会用 AI”写入全员绩效——本质是要求每个角色都向“构建者”重叠，与 Codex 的观察同频。

“一人独角兽”与极小团队：Midjourney 曾以约 40 人支撑数亿美元营收；Cursor（Anysphere）以极小团队做到高估值。角色高度重叠、每人都是端到端“构建者”，是这类组织的共同特征。

国内“全栈工程师+AI”小队：字节、腾讯等的部分创新团队采用“铁三角/小分队”模式，一个人同时承担需求、设计草案与实现，管理者角色反而更重要——印证 Andrew“管理者不会消失”的判断。

需要警惕的反例：一些公司把“角色坍塌”误读为“可以裁掉专业角色”，结果是产品判断力真空、设计一致性崩坏。角色重叠的前提是“每个人补齐多学科的方法论”，而非“取消学科”。

六、Codex 的产品野心与信号

Andrew 在推文中表达了一个目标：让 Codex 成为有史以来最好的桌面应用。其质量门槛要高到——用户在做下一件事时“不会有任何犹豫，它就是自然而然的选择”，如同人们习惯性打开一个浏览器标签。

这一野心本身就是一个行业信号：AI 编程产品正在从“辅助写代码”向“人类指挥、AI 执行”的通用生产力入口演进，软件开发从“人类主导、AI 辅助”迈向“人类指挥、AI 执行”的新型协作生态。

6.1 终极愿景：AI 不是聊天框，而是“工作主基地”

Andrew 明确反对“把所有软件都塞进一个对话框”的思路。在他的设想中，AI 的终点更像“水”一样渗透进现有工具，而非取代所有界面。他给出了两条并行的演进路径：

5. AI 像“手”一样直接操作现有专业软件：不必重造一个视频剪辑器，而是让 AI 直接读写现有工具的工程文件与数据（例如通过修改工程文件数据来完成视频剪辑），把人类的意图翻译成对专业软件的精确操作。

6. AI 成为“工作主基地（work home base）”：一个能根据任务自动调整界面复杂度的通用入口——做表格时隐藏代码、写代码时提供完整开发环境，界面随任务“自适应地生长与收敛”，而不是让用户去适应固定的软件形态。

“终点不是把一切塞进聊天框，而是让智能像水一样流进你已经在用的工具里，并随你手头的任务改变自己的形状。” — 对话愿景提炼

图 4：AI 产品的双重演进路径——作为“手”操作现有软件，与作为自适应“工作主基地”

6.2 Andrew 的个人忠告

“不要固守你的流程，固守你能交付的结果。” — Andrew Ambrosino（创业失败 10–15 年后的经验之谈）

七、国内外行业实践的印证与分歧

Andrew 的观察并非孤例。将其放到 2026 年全球 AI 编程与产品实践的大背景中，可以看到清晰的共鸣，也存在值得警惕的分歧。

7.1 市场大盘：AI 编程已成主流范式

“Vibe Coding（氛围编程）”由 Andrej Karpathy 于 2025 年提出，2026 年已从极客标签演变为主流开发范式的一部分，并被 MIT Technology Review 列入十大突破技术、成为柯林斯词典年度词汇候选。这从社会语言学层面印证了 Andrew 所说的“任何人都能构建任何东西”。

7.2 范式演进：从 Vibe Coding 到 Harness Engineering

国内技术社区对 AI 编程范式的演进有一条清晰的脉络，恰好与 Andrew“不要神化原型、要选对媒介”的判断相互呼应：

这条演进线的本质，与 Andrew 的“流程倒置”是同一枚硬币的两面：当实现变廉价，价值就上移到规范、判断与系统组织——也即“品味”的工程化表达。

7.3 现实的另一面：67% 失败率与“三阶段衰退”

与乐观叙事并存的是冷峻的落地现实。国内外多份报告与一线复盘揭示了“实现趋零”背后的隐性成本：

AI 项目失败率高达 67%，约 85% 的企业面临 AI 人才短缺，调试困难成为最大痛点。

“三阶段衰退曲线”：前期 AI 迅速生成小功能；中期系统复杂度上升，人类排查细微逻辑错误的成本与手写持平；后期长上下文累积导致指令遵循能力断崖式下跌。

“知识黑盒”风险：代码能跑，但出问题时不知从何下手——Vibe Coding 降低了 0 到 0.5 的门槛，却在 0.5 到 1 的路上制造“生成→混乱→重来”的循环。

典型事件：Node.js 核心贡献者曾用大量 Claude Code token 生成约 1.9 万行代码提交 PR，在社区引发关于“AI 代码可维护性与责任归属”的激烈辩论。这提示我们：“实现趋零”是就“从 0 到能跑”而言的；“从能跑到能交付”的工程严谨性，恰恰是品味与专业性的用武之地。

7.4 工具格局：能力趋同、成本分化

格局要点：头部工具在复杂多步骤工程任务上能力趋同，差异更多体现在成本模型（按量计费 vs 免费）、生态整合与本地化。国内以百度秒哒、字节 Trae 为代表，正把“自然语言开发”推向非技术人群，进一步验证 Andrew 所说的“跨职能通用入口”趋势。

八、国内外进展对比与差异分析

Andrew 的视角来自硅谷最前沿的 AI 原生团队。若把镜头拉远，国内外在“实现趋零、品味为王”这一趋势下的进展路径与侧重点存在系统性差异。理解这些差异，对中国从业者制定策略至关重要。

8.1 底层能力：模型与工具的“代差”正在收窄

过去认为国内外存在明显“代差”，但 2025–2026 年这一判断需要更新：闭源顶尖模型仍由海外领跑，开源与工程化中国已进入第一梯队。

标志性事件：GLM智谱，DeepSeek 以极低训练成本逼近顶尖闭源模型的编码能力，引发全球关注，被视为“工程效率驱动追赶”的代表；Qwen 系列在 Hugging Face 长期占据开源下载与衍生模型榜首。

8.2 产品与商业模式：付费订阅 vs 免费普惠

差异根源：海外市场对“效率溢价”有成熟付费习惯，因此更早围绕 Andrew 所说的“品味即稀缺资源”构建高端订阅；国内则更强调普惠与规模，把“自然语言开发”推向非技术人群，客观上更快验证了“跨职能通用入口”，但也更容易掉入“低质原型泛滥”的陷阱。

8.3 组织文化：角色坍塌的“主动”与“被动”

国外（主动重构）：Shopify、OpenAI 等自上而下重塑“人人皆构建者”的文化，把 AI 使用写入绩效与晋升，角色坍塌是被主动设计的组织演进。

国内（效率驱动）：更多以“提效/降本”为直接动因推动 AI 编码普及，角色融合往往由一线团队自发形成，制度化与方法论沉淀相对滞后。

共同风险：两地都出现“把角色坍塌误读为裁撤专业岗位”的苗头，导致产品判断力与设计一致性受损。

8.4 差异总览与中国从业者的机会窗口

结论：在“实现”这一层，国内外差距正快速收窄；真正拉开差距的将是“品味—判断—方法论”这一软层面。这既是中国从业者需要正视的短板，也是最值得投入的机会窗口——谁先把“品味工程化、判断体系化”，谁就能在实现红利见顶后建立真正的护城河。

九、面向未来的七大趋势洞察

洞察一：价值链上移——从“造物”到“择物”

当实现成本趋零，竞争的胜负手从“能不能做出来”转向“做什么、为谁做、何时收敛”。组织的核心资产将是高质量判断的密度，而非人力规模或工程产能。

洞察二：文档不死，但“媒介治理”成为新课题

“PRD 已死”是伪命题。真正的挑战是建立媒介与流程阶段的显式治理：团队需要明确“这个产物处于哪个阶段、被去风险到什么程度”，防止精致原型冒充生产就绪，造成决策误判。

洞察三：角色坍塌是“重叠”而非“消灭”

未来更可能是“T 型／π 型能力的重叠区扩大”，而非职能彻底消失。以“平均工作位置”定义角色，比用“头衔边界”定义更贴近现实。盲目“取消 PM／设计”会丢失沉淀多年的学科最佳实践，是高风险动作。

洞察四：品味成为可培养、可评估的“元能力”

品味不再是玄学，而是可拆解为审美、系统思考、方向判断、媒介选择四维的元能力。企业应将其纳入招聘画像、晋升标准与人才培养体系——尤其在 AI 承接了大量执行工作之后。

洞察五：AI 的设计与创造力短板，是人类的护城河窗口期

由于评分困难、飞轮缺位与新颖性要求，AI 在原创设计与范式创新上短期难以超越人类。这为设计师、产品人保留了一个关键的价值窗口，但窗口会随反馈机制完善而收窄——应抓紧向“定义问题、开创范式”的高地迁移。

洞察六：工程严谨性回归——Harness／Spec 是安全带

面对 67% 失败率与“三阶段衰退”，单纯 Vibe Coding 不可持续。规范驱动（SDD）、评测体系、可观测性、上下文工程等“驾驭 AI 的工程能力”，将成为区分“玩具 Demo”与“可交付产品”的分水岭。

洞察七：形态终局——从“聊天框”到“自适应工作主基地”

AI 产品的终局不是把一切塞进对话框，而是像水一样渗入现有工具、并随任务自适应界面。这意味着两条并行路径将长期共存：AI 作为“手”直接操作专业软件的底层数据；AI 作为通用“工作主基地”动态调整界面复杂度。对产品设计者而言，未来的竞争力在于“意图到操作”的翻译精度与“界面随任务生长”的自适应能力，而非堆叠固定功能。

十、结语

回到开头的问题——“产品经理还有必要吗？”Andrew 的回答既不是“是”也不是“否”，而是一次范式的重新定义：产品这门学科不会消失，会消失的是“以实现昂贵为前提”的旧流程、旧工具与旧边界。那些盲目砍掉 PM／设计岗位的公司，正是误把“实现容易”等同于“产品简单”——这恰恰是 Andrew 所说的“工程师的傲慢”。

当 AI 把“造物”的成本压到接近于零，人类的价值就集中到了“择物”与“品味”——定义做什么、如何组织系统、用什么媒介表达、以及知道何时收敛。一句话概括这期对话的核心：AI 没有消灭专业，而是把专业的门槛从“会不会做”提升到了“选什么做”。

对于业界专业人士，真正的机会不在于争论“某个角色是否会被取代”，而在于主动完成从“执行者”向“判断者与驾驭者”的迁移。实现趋零的时代，稀缺的从来不是代码，而是品味、判断，以及把它们工程化、组织化的能力。

“固守你能交付的结果，而不是你习惯的流程。”