实现趋零,品味为王-AI 如何重塑软件产品的生产方式与团队角色
一、摘要
2026 年 6 月 28 日,Lenny 播客发布了一期与 OpenAI Codex 产品与工程负责人 Andrew Ambrosino 的深度对话。Andrew 曾是设计师、软件工程师,也是 YC 明星金融创业公司 Catch 的创始人,身兼 CEO、CTO 与产品负责人多职。作为当下最前沿 AI 软件团队的一线领导者,他提出的核心判断正在引发产品与研发从业者的广泛讨论:
“软件开发中最昂贵的东西,已经不再是“实现”,而是“品味”。” — Andrew Ambrosino,OpenAI Codex 负责人
这期对话最鲜明的立场,是对“AI 让写代码变便宜、于是不再需要产品经理”这一流行论断的正面反驳。Andrew 把这种想法称为“工程师的傲慢”:会用 AI 工具,并不等于具备专业的产品、设计或财务能力;专业岗位背后的纪律与方法论依然不可或缺。他的核心判断是——
“AI 没有消灭专业,而是把专业的门槛从“会不会做”提升到了“选什么做”。”
本文以这期对话为主线思考,分析其关于“专业门槛不降反升”“产品开发流程倒置”“品味成为稀缺能力”“角色坍塌与重叠”“AI 产品终极形态”五大核心观点,并结合国内外 AI 编程工具的落地数据、Vibe Coding 范式的演进争议、以及企业组织形态的变化,形成面向业界人士的系统性洞察。
核心结论

关键量化信号:Codex 自 2026 年 1 月起使用量增长6 倍,外部周活跃用户超500 万;OpenAI 内部约90%员工每周使用 Codex,覆盖工程、市场、财务、法务等岗位。这标志着 AI 正从“编程工具”扩展为“跨职能通用工作入口”。
二、对话背景与信源
2.1 视频与嘉宾

说明:本文的对话内容依据公开访谈的完整中文编译整理,并交叉核对了 OpenAI Codex 桌面应用发布的公开资料。由于视频原始字幕受平台访问限制,本文引用以经编辑的中文转述为准,不改变原意。
2.2 为什么这期对话值得业界重视
信源前沿:OpenAI Codex 是“自己写自己”的 AI 编程产品,团队的工作方式代表了 AI 原生组织的极端样本。
视角跨界:Andrew 兼具设计、工程、产品、创业多重背景,观点不局限于单一职能立场。
话题普适:产品流程倒置、品味稀缺、角色坍塌,是几乎所有软件团队在未来一两年都将面对的共性问题。
三、核心观点一:产品开发流程的“倒置”
Andrew 认为,当下作为产品领导者最难处理的事情之一,就是流程的倒置(the process is inverted)。过去的软件开发建立在一个隐含假设之上——“实现是昂贵的”,因此必须在前期通过文档、研究、原型来层层“去风险”,因为文档和设计比实现便宜。而这个假设已经被彻底改变。

图 1:软件产品开发流程从“线性前置去风险”到“多路并行、策划收敛”的倒置
3.1 从“实现驱动”到“策划驱动”
“对于某个我们急需做的功能,可能有 90 个不同的、没有协调的团队在各自实现和尝试。流程是倒过来的——实现不再是昂贵的部分,昂贵的是品味。” — Andrew Ambrosino
在 OpenAI 内部,“给人们无限的 token”意味着任何有想法的人都能直接把想法做出来。于是同一需求会自发涌现大量并行原型,产品团队的主要工作从“实现本身”转变为策划(curation)与整合:这 90 次尝试里哪些是好的?哪些应该融入其他方案?应该如何框定问题?这个功能的开关应该有几个分段?
业界印证:并行原型正在成为工程标配
Vercel v0 与 StackBlitz Bolt.new:一句自然语言可同时生成多个可运行前端版本,产品与设计直接在浏览器里对比取舍,把“先写规格再实现”压缩成“先看候选再收敛”。这正是 Andrew 描述的“90 个原型”的商业化形态。
GitHub Spark / Copilot Workspace:从一句意图出发生成完整应用骨架,开发者的角色前移为“审阅与引导”,GitHub 官方将其定位为“意图到应用”的策展式开发。
Anthropic Claude Artifacts 与国内“秒哒/文心快码”:非工程角色也能在对话中即时产出可交互原型,需求评审会上“边聊边生成三个版本当场投票”已在部分团队成为常态。
这些实践共同说明:流程倒置不是 OpenAI 的孤例,而是工具层已经把“实现”变成随手可得的公共品,倒逼组织把稀缺注意力重新分配到“判断与收敛”。
3.2 “PRD 已死”是一个危险的误读
市面上流行“PRD 已死、原型为王”的说法,但 Andrew 明确表示完全不认同。他的观点更为精细:当实现成本在每种媒介上都趋近于零时,直接跳到原型固然诱人(尤其对非工程背景的人),但工程师同样容易陷入“写大量没人读的文档”的陷阱。真正的问题不是“要不要文档”,而是——
“当时间变得充裕,为你想表达的观点选择正确的“媒介”,就变得前所未有地重要。” — Andrew Ambrosino

典型实践:头部团队为何仍然坚持“先写清楚”
亚马逊 PR/FAQ(未来新闻稿):任何新产品立项必须先写一份“假想的发布新闻稿+常见问答”,用文字逼迫团队想清楚“为谁解决什么”。AI 时代原型再便宜,这份“方向文档”依然是决策锚点。
Basecamp 的 Shape Up:用“塑形文档”界定问题边界与胃口(appetite),刻意不画高保真原型,正是为避免团队过早对“精致外壳”做反应——与 Andrew 的“原始标记”忧虑完全一致。
Linear、Stripe 的写作文化:以高质量书面沟通著称的团队并未因 AI 放弃文档,反而更强调“把判断沉淀成文字”,因为原型能验证“怎么做”,却回答不了“该不该做、要做到哪一步”。
案例启示:“PRD 已死”混淆了两件事——被淘汰的是“为流程而写、无人阅读的仪式性文档”,被强化的是“为澄清判断而写的思考型文档”。媒介的价值不取决于形式新旧,而取决于它服务于哪一类问题。
3.3 “媒介与阶段的解耦”带来的新风险
Andrew 指出一个容易被忽视的深层变化:过去“媒介本身隐含了流程信号”——看起来像生产环境的东西,就意味着它处于流程后期、已被去风险、设计已评审。而现在这些信号被解耦了。一个由 AI 快速生成的原型可能“视觉上已经可以上线”,导致公司里足够多的人误以为“我们现在就能发布”,但实际上它仍处于早期探索阶段,既非正确的研究方向,也未必是用户真正需要的。
这里引出对话中一个精彩的类比——“原始标记(primary mark)”:画家在画布上落下的第一笔,会成为之后一切的回应对象。如果过早跳到精致原型,团队就只会对这个原型做出反应,而非对更大的想法做出反应。这正是“选择正确媒介”的价值所在。
四、核心观点二:真正稀缺的是“品味”
“品味(taste)”是这期对话被反复提及、也最容易被说烂的词。Andrew 特意对它做了拆解,强调品味远不止于审美。

图 2:“品味”作为 AI 时代新稀缺能力的四维构成
4.1 品味的四个维度
1. 审美判断:例如一个交互动画在语义上是否匹配它想传达的意思,是否“太跳”。这是最直观、但也只是其中一部分。
2. 系统思考:这个东西如何融入整个系统?它与代码库中其他部分应共享什么?这涉及抽象层的组织。
3. 方向判断:“如果我们什么都能造,那目标是什么?主题是什么?我们怎么到达那里?”——Andrew 认为这才是真正品味问题的核心。
4. 媒介选择:用什么形式(文档、原型、AB 测试)来呈现信息、达成目标,本身就是一种高阶判断。
4.2 为什么当前 AI 仍然做不好设计
Andrew给出了三层原因,分为“会消失的实际原因”与“更难解决的深层原因”:
设计更难评分:为“好设计/坏设计”构建训练反馈回路,远比“代码能否编译、能否跑通”繁重,因为人类审美是反馈机制中的必需环节。
缺乏飞轮激励:实验室历史上更倾向让模型擅长能“加速 AI 研究”的事情(如写对代码),设计不直接在这个飞轮里。
设计需要“新颖性”:软件工程希望模型偏向已知模式,而设计恰恰需要随机性与新颖。“如果模型每次都输出 Linear 官网那样的好设计,挑战反而不在这里。”
更棘手的是抽象层问题:品牌重塑的浅层版本是逐个更新 263 个组件,深层版本是理解“这两个看起来不同的东西”在语义上共享了什么交互模式。这种跨越“软件设计与底层代码”的抽象映射,在当前技术下仍“有点遥不可及”。
“让我们暂时为人类大脑鼓掌——想出全新的东西、而不是从已有模式中生成,这仍是人类目前最有价值的地方。” — 对话小结
业界镜像:把“品味”当作核心资产的公司
Linear:以“克制的产品品味”成为行业标杆,几乎不做 A/B 测试,而是靠团队对“什么是对的”的高度共识来收敛——这正是 Andrew 所说“方向判断”维度的极致体现。
Airbnb 的设计系统(DLS)与 Cereal:把设计语言抽象为可复用组件与原则,体现的正是“系统思考”——理解“不同界面在语义上共享了什么”,而非逐个像素堆砌。这恰是 Andrew 指出当前 AI 最难跨越的抽象层。
Midjourney/Figma AI 的边界:AI 已能生成惊艳的单张视觉,但在“一套跨 200+ 组件、可维护、语义自洽的产品设计系统”上仍显吃力——印证了“会画一张漂亮图 ≠ 懂产品设计”。
苹果与字节跳动的“审美护城河”:苹果长期以“克制与一致”建立品牌溢价;字节内部以“大力出奇迹”的 A/B 实验文化验证方向。两种路径分别对应“方向判断靠品味”与“方向判断靠数据”,代表了品味工程化的两种流派。
对照启示:当 AI 抹平了执行差距,企业之间的差距将越来越多地由“品味密度”决定——是否有一群人能稳定地做出“对的、协调的、有新鲜感的”判断。这是一种可以刻意培养、却难以被工具替代的组织能力。
五、核心观点三:角色的“坍塌”与重叠

图 3:AI 时代产品团队中 PM/设计/工程角色的重叠与“技术成员”内核
5.1 用“平均位置”而非“边界”定义角色
Andrew 观察到,在 Codex 组织内看到的角色坍塌比公司其他部门、乃至整个经济都更明显——部分原因是 Codex 是面向工程师的技术产品:设计师懂工程师语言,产品经理懂技术、会写代码。他提出一个很有价值的表述:
“每个人不再由“设计在哪停止、工程从哪开始”的边界来定义,而是由他们工作的“平均位置”来定义。你的角色,就是你花时间做的那些事情的平均值。” — Andrew Ambrosino
OpenAI 沿用了源自 Xerox、在研究型公司中常见的“技术成员(Member of Technical Staff)”称谓——职能不固定,切换角色和学习最佳实践都变得更容易,一个人的有效性不再与“是否熟练某个具体工具”绑定,而在于“能否进入正确的思维模式”。
5.2 对“取消产品角色”的明确警告
面对“每个人都变成构建者、可以取消产品这个角色”的流行论调,Andrew 表达了明确的担忧。他把“因为 AI 让写代码变便宜、就不再需要 PM”的推论称为“工程师的傲慢”——会操作 AI 工具,并不等于掌握了产品或财务这类专业岗位背后的纪律与方法论:
“取消角色”的危险在于,它可能连带否定“专长有可掌握的最佳实践”这一观念。
产品是一门有真实最佳实践、有真实试错、有真实流程的学科;不能因为“我写了几行代码”就把它抛弃。
边界(“这不是你的领域”)消失是好事,但存在平衡——不是每个人都能在广度和深度上做所有事,这也是“管理者不会消失”的原因。
“产品有它的技能成分,工程也有它的技能成分——很多工程师没有意识到,其他角色并不只是在“凭感觉做事”。” — Andrew Ambrosino
5.3 Dogfooding 驱动的组织形态
Codex 桌面应用的整个开发由“内部自测(dogfooding)”循环驱动:团队所有人都尽可能在这个应用里做事,即便它一开始不是最好的工具——正因为如此,它才有机会成为最好的工具。很多设计正是团队“边用边发现问题”完成的。Andrew 坦言这是一种“非常不舒服的处境”,而且团队的汇报线、协作方式“每周都在变”。
5.4 “区域联防”协作与“焖着”原型的规划策略
当同一需求会自发涌现大量并行原型、且团队边界持续流动时,传统“自上而下集中规划”的协作方式随之失效。Andrew 描述的新协作范式更像篮球里的“区域联防(zone defense)”:放弃精确的自顶向下拆分,让每个人各自覆盖一块“区域”,核心工作不再是“把任务做完”,而是策展、引导与对齐——在不断变化的态势中判断哪些原型值得推进、如何融合、如何收敛到统一方向。
与之配套的是一种反直觉的规划策略——“焖着(let it simmer)”原型:把未来可能需要的功能提前做成原型,如果当前底层模型的智力还“跑不通”,就先放着不动。一旦底层模型完成一次能力升级,这些旧原型可能无需改动外壳代码就能直接上线。
“产品的上限取决于底层的智力,而不是外壳。模型变聪明了,很多原来“跑不通”的原型就自然成立了。” — 对话要点提炼
这条策略的深意在于:在“实现趋零”的时代,团队真正应该积累的资产,不是一次性交付的代码,而是对“系统智力临界点”的预判——提前押注哪些形态会在下一代模型上成立,并用低成本原型占好位置。
组织实践:角色重叠正在被明确制度化
Shopify(2025 CEO 内部信):Tobi Lütke 要求“申请增加人手前,先证明为什么 AI 做不了”,并把“会用 AI”写入全员绩效——本质是要求每个角色都向“构建者”重叠,与 Codex 的观察同频。
“一人独角兽”与极小团队:Midjourney 曾以约 40 人支撑数亿美元营收;Cursor(Anysphere)以极小团队做到高估值。角色高度重叠、每人都是端到端“构建者”,是这类组织的共同特征。
国内“全栈工程师+AI”小队:字节、腾讯等的部分创新团队采用“铁三角/小分队”模式,一个人同时承担需求、设计草案与实现,管理者角色反而更重要——印证 Andrew“管理者不会消失”的判断。
需要警惕的反例:一些公司把“角色坍塌”误读为“可以裁掉专业角色”,结果是产品判断力真空、设计一致性崩坏。角色重叠的前提是“每个人补齐多学科的方法论”,而非“取消学科”。
六、Codex 的产品野心与信号
Andrew 在推文中表达了一个目标:让 Codex 成为有史以来最好的桌面应用。其质量门槛要高到——用户在做下一件事时“不会有任何犹豫,它就是自然而然的选择”,如同人们习惯性打开一个浏览器标签。

这一野心本身就是一个行业信号:AI 编程产品正在从“辅助写代码”向“人类指挥、AI 执行”的通用生产力入口演进,软件开发从“人类主导、AI 辅助”迈向“人类指挥、AI 执行”的新型协作生态。
6.1 终极愿景:AI 不是聊天框,而是“工作主基地”
Andrew 明确反对“把所有软件都塞进一个对话框”的思路。在他的设想中,AI 的终点更像“水”一样渗透进现有工具,而非取代所有界面。他给出了两条并行的演进路径:
5. AI 像“手”一样直接操作现有专业软件:不必重造一个视频剪辑器,而是让 AI 直接读写现有工具的工程文件与数据(例如通过修改工程文件数据来完成视频剪辑),把人类的意图翻译成对专业软件的精确操作。
6. AI 成为“工作主基地(work home base)”:一个能根据任务自动调整界面复杂度的通用入口——做表格时隐藏代码、写代码时提供完整开发环境,界面随任务“自适应地生长与收敛”,而不是让用户去适应固定的软件形态。
“终点不是把一切塞进聊天框,而是让智能像水一样流进你已经在用的工具里,并随你手头的任务改变自己的形状。” — 对话愿景提炼

图 4:AI 产品的双重演进路径——作为“手”操作现有软件,与作为自适应“工作主基地”
6.2 Andrew 的个人忠告
“不要固守你的流程,固守你能交付的结果。” — Andrew Ambrosino(创业失败 10–15 年后的经验之谈)
七、国内外行业实践的印证与分歧
Andrew 的观察并非孤例。将其放到 2026 年全球 AI 编程与产品实践的大背景中,可以看到清晰的共鸣,也存在值得警惕的分歧。
7.1 市场大盘:AI 编程已成主流范式

“Vibe Coding(氛围编程)”由 Andrej Karpathy 于 2025 年提出,2026 年已从极客标签演变为主流开发范式的一部分,并被 MIT Technology Review 列入十大突破技术、成为柯林斯词典年度词汇候选。这从社会语言学层面印证了 Andrew 所说的“任何人都能构建任何东西”。
7.2 范式演进:从 Vibe Coding 到 Harness Engineering
国内技术社区对 AI 编程范式的演进有一条清晰的脉络,恰好与 Andrew“不要神化原型、要选对媒介”的判断相互呼应:

这条演进线的本质,与 Andrew 的“流程倒置”是同一枚硬币的两面:当实现变廉价,价值就上移到规范、判断与系统组织——也即“品味”的工程化表达。
7.3 现实的另一面:67% 失败率与“三阶段衰退”
与乐观叙事并存的是冷峻的落地现实。国内外多份报告与一线复盘揭示了“实现趋零”背后的隐性成本:
AI 项目失败率高达 67%,约 85% 的企业面临 AI 人才短缺,调试困难成为最大痛点。
“三阶段衰退曲线”:前期 AI 迅速生成小功能;中期系统复杂度上升,人类排查细微逻辑错误的成本与手写持平;后期长上下文累积导致指令遵循能力断崖式下跌。
“知识黑盒”风险:代码能跑,但出问题时不知从何下手——Vibe Coding 降低了 0 到 0.5 的门槛,却在 0.5 到 1 的路上制造“生成→混乱→重来”的循环。
典型事件:Node.js 核心贡献者曾用大量 Claude Code token 生成约 1.9 万行代码提交 PR,在社区引发关于“AI 代码可维护性与责任归属”的激烈辩论。这提示我们:“实现趋零”是就“从 0 到能跑”而言的;“从能跑到能交付”的工程严谨性,恰恰是品味与专业性的用武之地。
7.4 工具格局:能力趋同、成本分化

格局要点:头部工具在复杂多步骤工程任务上能力趋同,差异更多体现在成本模型(按量计费 vs 免费)、生态整合与本地化。国内以百度秒哒、字节 Trae 为代表,正把“自然语言开发”推向非技术人群,进一步验证 Andrew 所说的“跨职能通用入口”趋势。
八、国内外进展对比与差异分析
Andrew 的视角来自硅谷最前沿的 AI 原生团队。若把镜头拉远,国内外在“实现趋零、品味为王”这一趋势下的进展路径与侧重点存在系统性差异。理解这些差异,对中国从业者制定策略至关重要。
8.1 底层能力:模型与工具的“代差”正在收窄
过去认为国内外存在明显“代差”,但 2025–2026 年这一判断需要更新:闭源顶尖模型仍由海外领跑,开源与工程化中国已进入第一梯队。

标志性事件:GLM智谱,DeepSeek 以极低训练成本逼近顶尖闭源模型的编码能力,引发全球关注,被视为“工程效率驱动追赶”的代表;Qwen 系列在 Hugging Face 长期占据开源下载与衍生模型榜首。
8.2 产品与商业模式:付费订阅 vs 免费普惠

差异根源:海外市场对“效率溢价”有成熟付费习惯,因此更早围绕 Andrew 所说的“品味即稀缺资源”构建高端订阅;国内则更强调普惠与规模,把“自然语言开发”推向非技术人群,客观上更快验证了“跨职能通用入口”,但也更容易掉入“低质原型泛滥”的陷阱。
8.3 组织文化:角色坍塌的“主动”与“被动”
国外(主动重构):Shopify、OpenAI 等自上而下重塑“人人皆构建者”的文化,把 AI 使用写入绩效与晋升,角色坍塌是被主动设计的组织演进。
国内(效率驱动):更多以“提效/降本”为直接动因推动 AI 编码普及,角色融合往往由一线团队自发形成,制度化与方法论沉淀相对滞后。
共同风险:两地都出现“把角色坍塌误读为裁撤专业岗位”的苗头,导致产品判断力与设计一致性受损。
8.4 差异总览与中国从业者的机会窗口

结论:在“实现”这一层,国内外差距正快速收窄;真正拉开差距的将是“品味—判断—方法论”这一软层面。这既是中国从业者需要正视的短板,也是最值得投入的机会窗口——谁先把“品味工程化、判断体系化”,谁就能在实现红利见顶后建立真正的护城河。
九、面向未来的七大趋势洞察
洞察一:价值链上移——从“造物”到“择物”
当实现成本趋零,竞争的胜负手从“能不能做出来”转向“做什么、为谁做、何时收敛”。组织的核心资产将是高质量判断的密度,而非人力规模或工程产能。
洞察二:文档不死,但“媒介治理”成为新课题
“PRD 已死”是伪命题。真正的挑战是建立媒介与流程阶段的显式治理:团队需要明确“这个产物处于哪个阶段、被去风险到什么程度”,防止精致原型冒充生产就绪,造成决策误判。
洞察三:角色坍塌是“重叠”而非“消灭”
未来更可能是“T 型/π 型能力的重叠区扩大”,而非职能彻底消失。以“平均工作位置”定义角色,比用“头衔边界”定义更贴近现实。盲目“取消 PM/设计”会丢失沉淀多年的学科最佳实践,是高风险动作。
洞察四:品味成为可培养、可评估的“元能力”
品味不再是玄学,而是可拆解为审美、系统思考、方向判断、媒介选择四维的元能力。企业应将其纳入招聘画像、晋升标准与人才培养体系——尤其在 AI 承接了大量执行工作之后。
洞察五:AI 的设计与创造力短板,是人类的护城河窗口期
由于评分困难、飞轮缺位与新颖性要求,AI 在原创设计与范式创新上短期难以超越人类。这为设计师、产品人保留了一个关键的价值窗口,但窗口会随反馈机制完善而收窄——应抓紧向“定义问题、开创范式”的高地迁移。
洞察六:工程严谨性回归——Harness/Spec 是安全带
面对 67% 失败率与“三阶段衰退”,单纯 Vibe Coding 不可持续。规范驱动(SDD)、评测体系、可观测性、上下文工程等“驾驭 AI 的工程能力”,将成为区分“玩具 Demo”与“可交付产品”的分水岭。
洞察七:形态终局——从“聊天框”到“自适应工作主基地”
AI 产品的终局不是把一切塞进对话框,而是像水一样渗入现有工具、并随任务自适应界面。这意味着两条并行路径将长期共存:AI 作为“手”直接操作专业软件的底层数据;AI 作为通用“工作主基地”动态调整界面复杂度。对产品设计者而言,未来的竞争力在于“意图到操作”的翻译精度与“界面随任务生长”的自适应能力,而非堆叠固定功能。
十、结语
回到开头的问题——“产品经理还有必要吗?”Andrew 的回答既不是“是”也不是“否”,而是一次范式的重新定义:产品这门学科不会消失,会消失的是“以实现昂贵为前提”的旧流程、旧工具与旧边界。那些盲目砍掉 PM/设计岗位的公司,正是误把“实现容易”等同于“产品简单”——这恰恰是 Andrew 所说的“工程师的傲慢”。
当 AI 把“造物”的成本压到接近于零,人类的价值就集中到了“择物”与“品味”——定义做什么、如何组织系统、用什么媒介表达、以及知道何时收敛。一句话概括这期对话的核心:AI 没有消灭专业,而是把专业的门槛从“会不会做”提升到了“选什么做”。
对于业界专业人士,真正的机会不在于争论“某个角色是否会被取代”,而在于主动完成从“执行者”向“判断者与驾驭者”的迁移。实现趋零的时代,稀缺的从来不是代码,而是品味、判断,以及把它们工程化、组织化的能力。
“固守你能交付的结果,而不是你习惯的流程。”
夜雨聆风