02 | AI PM的能力模型,比传统PM多会什么?

AI PM工作手册 · 第2/12期 | 阅读约8分钟

能力模型成长路径实用框架

昨天发完第一篇后，后台收到一条留言，我看完笑了半天。

一个读者说：「看完文章我终于确认了——我不是AI PM，我只是一个会用ChatGPT写周报的普通PM。」

后面又补了一句：「但我老板让我下个月负责一个'AI赋能客服'的项目，我现在慌得一批。能不能列个清单告诉我，AI PM到底要会哪些东西？我好对着补课。」

这就是第二篇要解决的问题。

上期我们聊了AI PM到底在做什么。这期聊一个更实操的问题：如果你想从传统PM转AI方向，或者已经在做AI产品但感觉基础不牢，你需要在哪些维度上补课？

不是给你一个「AI产品经理能力模型」的华丽框架图——那种图网上搜一搜能找出二十个版本，每个都画得漂漂亮亮，但看完还是不知道该从哪下手。

这篇文章要做的是：把能力模型拆成你下周就能开始练的东西。

阅读提示

这是「AI PM工作手册」系列的第2篇。上一篇我们厘清了AI PM到底做什么，还没看过的朋友建议先读第01期，对理解本篇有帮助。本系列的完整12期规划，可以在第01期的序言部分查看。

一、传统PM的能力地基，你得先站住了

先说一个容易被人跳过但至关重要的事实：

AI PM的能力模型不是在空地上盖楼，是在传统PM的地基上加层。

我见过一个学计算机出身的哥们，模型原理讲得头头是道，一让他写PRD就崩——需求背景和三句话概括完，剩下的篇幅全在讨论用什么模型、Prompt怎么设计。研发拿到文档直接问：「这个功能到底给谁用？解决什么问题？验收标准是什么？」

反过来，传统PM的基本功不过关，AI那层加得再高也站不稳。

所以先把传统PM的四个核心能力快速过一遍。这不是重点，但你需要确认自己在这四条线上有没有明显短板：

能力维度	核心内容
需求洞察	从用户反馈、数据、竞品中发现真实需求，区分「用户说的」和「用户真的要的」。在AI场景下额外要求：识别哪些需求适合用AI解决，哪些用传统方案就够了。
方案设计	把需求翻译成产品方案，输出PRD、原型、流程图。在AI场景下额外要求：定义AI功能的输入/输出、边界case、容错标准。
项目推动	协调研发、设计、测试、运营，把方案按时按质交付。在AI场景下额外要求：理解模型开发的不确定性，管理「效果」而非「功能」的交付节奏。
数据分析	通过指标监控产品表现，发现问题和机会。在AI场景下额外要求：看懂模型效果指标（准确率、召回率、接受率），把「数据异常」翻译成「优化方向」。

你不需要每条都做到100分。但如果你在需求洞察这条线上明显弱，那你做AI PM会比别人累很多——因为你连「这件事值不值得做」都没判断好，就开始纠结「用什么模型做」了。

▲ [ 图1 ] 传统PM能力地基 + AI能力叠加层

二、AI PM多出来的，到底是什么？

传统PM的四条线之外，AI PM需要额外长出三块新肌肉。这三块肌肉不是传统能力的简单延伸，是真正的新增维度。

新增能力一：技术感知

注意，我说的是「技术感知」，不是「技术能力」。

传统PM面对的技术栈相对稳定——前端框架、后端架构、数据库，这些东西三五年变化不大。你不需要知道React的虚拟DOM怎么实现的，但你知道「这个需求前端能不能做」就够了。

AI领域不一样。大模型的能力边界在以月为单位的节奏变化。半年前RAG还是前沿方向，现在已经是标配。一年前大家还在纠结Prompt怎么调，现在Agent框架都出了一堆。GPT-4出来之前，让模型做多步推理基本是幻想；GPT-4出来之后，这件事变成了工程问题。

技术感知不要求你写代码，但要求你保持三件事：

知道现在能做什么。大模型的最新版本能力到什么程度？市面上的AI产品做到了什么水平？这不需要看论文，多刷几个行业号、多看几个产品就够了。
判断半年后大概能做什么。不要精确预测——没人能。但要有一个大致的方向感，知道哪些能力正在快速变好，哪些短期内不会有突破。这个判断直接决定你现在的产品规划要不要给某些能力留位置。
识别技术的坑在哪里。大模型能不能做实时数据？能不能做精确计算？能不能处理超长文本？这些不是能力高低的问题，是天生局限的问题。不知道这些，你提出来的需求就是坑研发的。

举个例子。去年有个团队想做「AI自动生成财务报表并分析」。PM觉得这个需求天经地义——财务数据都在系统里，让AI读一下，生成分析报告，多好。

结果第一步就卡住了：财务报表里全是数字，大模型做算术是出了名的不靠谱。把「第三季度的总营收」算错一个数字，你敢拿给CFO看吗？

如果这个PM有基本的技术感知，他在写需求之前就会问自己一个问题：这个场景里，大模型擅长什么（分析文本、生成报告），不擅长什么（精确计算）？回答了这个，方案自然就分成了两步——先用规则引擎算数，再用大模型生成分析文字。

技术感知不是你懂多少技术，是你知道技术在什么情况下能帮你、什么情况下会坑你。

新增能力二：模型理解

这是三块新肌肉里最容易让人产生误解的一块。

「模型理解」不是让你去学机器学习、深度学习、NLP——那是算法工程师的事。PM需要的模型理解，范围窄很多，深度也浅很多：

理解大模型的基本工作原理——它不是在「思考」，它是在做概率预测。这个认知听起来简单，但它直接决定了你怎么设计交互：你不会期望它推理出你没给过信息的结论，你会在关键节点加确认机制。
理解Prompt的本质——Prompt不是咒语，是你给模型的「任务说明书」。好的Prompt和差的Prompt之间的差距，远超很多PM的想象。同样的模型，Prompt写得好和写得差，效果可以从「能用」到「没法用」。
理解RAG在什么场景下该用——当你的业务有大量实时更新的知识（比如产品文档、公司政策、FAQ），你不能靠微调模型来解决，成本太高、更新太慢。RAG这时候就是标配方案。
理解效果评估的基本逻辑——AI的输出不像传统功能有明确的「对」和「错」。「这个回答质量怎么样」是一个主观判断，你要学会把它转化成可量化的评估标准。

这四个理解的共同点是：它们不是让你「会做」，是让你「能判断」。判断一个方案靠不靠谱，判断一个优化方向值不值得试，判断一个工程师跟你说的「这样做不了」是真的做不了还是他在偷懒。

▲ [ 图2 ] AI PM的模型理解四层结构

新增能力三：不确定性管理

这是三块肌肉里最硬的一块，也是AI PM和传统PM最本质的分水岭。

传统软件的需求是这样写的：

用户点击「提交订单」按钮后，系统在3秒内完成支付并显示订单详情页。

这个需求有明确的行为、明确的时间、明确的结果。开发做到就是做到，没做到就是Bug。

AI功能的需求是这样写的：

当用户咨询退换货时，AI客服理解用户意图并给出符合公司政策的回复。

这里面的「理解用户意图」和「符合公司政策的回复」，每一个词都有模糊空间。就算做到了95%准确率，剩下的5%算不算Bug？如果那5%里有一条是「用户说我要退款，AI回复了'好的请提供订单号'，但用户其实已经退过款了」——这条算故障吗？

不确定性管理，就是学会和「做不到100%」和平共处，但又不让它失控。

具体来说，包含三个能力：

定义「够好了」的阈值。不是你说了算——是和业务方、用户、合规一起定出来的。退款准确率99%可能都不够，商品推荐60%可能就超出预期。每个场景有各自的容错标准。
设计兜底机制。AI答不出来的、答错的、答出安全风险的，得有退路。要么转人工，要么降级为固定话术，要么直接承认「我不知道」——哪一种都比硬编一个答案强。
建立持续监控。AI效果不是上线就完事了。业务规则变了、用户行为变了、模型版本变了，都可能让效果往下掉。你得有机制能及时发现，而不是等用户投诉才知道。

这三件事里，最难的是第一件。因为它没有标准答案，每个产品、每个场景都要从头判断。而且你提出来的标准，很可能和业务方的预期有巨大落差——「什么？你说AI可能答错？那我们要它干嘛？」

管理这种落差，本身就是AI PM能力的一部分。

三、不需要会写代码，但需要建立「技术共同语言」

这一段我想说得特别具体，因为每次聊到这个话题，两边的人都容易走极端。

一边是「我不会技术，但我可以学」，然后买了一堆网课学Python，三个月后发现除了会写Hello World之外毫无用处。

另一边是「我是PM又不是程序员，技术关我什么事」，然后每次和算法团队开会就像在听天书。

我的建议是：不要学技术，要学「理解技术的语言」。

这两件事有什么区别？学技术是你去搞懂LSTM和Transformer的数学原理。学「理解技术的语言」是你知道算法工程师说「这个需求用RAG可以，但召回率可能不高」是什么意思，以及你接下来该问什么问题。

具体来说，你需要能用正常人的语言解释这些概念：

幻觉（Hallucination）：模型在不知道答案的时候，不会说「我不知道」，而是会编一个听起来很合理的假答案。这是大模型的基因缺陷，不是哪个版本的Bug。
上下文窗口（Context Window）：模型一次能「记住」的信息量上限。给你的资料超过这个上限，前面的信息就会被丢掉。这是你设计RAG方案时必须考虑的约束。
推理延迟（Latency）：从用户发消息到AI回复，中间需要多长时间。如果超过3秒，用户体验就差了。每次加新能力（多轮对话、联网搜索、复杂推理）都会增加延迟，你需要在能力和速度之间做权衡。
成本结构：调用一次大模型API多少钱。一个小需求如果每次用户操作都调一次GPT-4，一个月可能吃掉整个部门的预算。这也是PM需要算的账。

这四个概念，一个下午就能理解。理解了，你和算法团队的沟通效率至少翻倍。不需要你写一行代码。

四、能力成长的三个阶段：你现在在哪？

讲完了AI PM的三块新肌肉，接下来是最实用的问题：我该怎么练？

我观察了周围做得比较好的AI PM，发现他们的成长路径大致分三个阶段。你不一定严格按顺序走，但每个阶段需要重点练的能力不一样。

阶段一：使用者 —— 「我会用AI工具」
你现在每天用ChatGPT、用AI绘图、用AI写代码助手。你的直觉开始建立：知道Prompt写得好不好对结果影响巨大，知道哪些任务AI做得比人快、哪些做得还没人好。
这个阶段要练的：把AI当成你的工作助手，每天用、用到顺手。写PRD时先用AI生成一版再改，做竞品分析时让AI列出框架你填充，整理会议纪要时直接用AI初稿再修正。用得越多，你对AI能力的直觉就越准。
判断你过了这个阶段的标准：你开始能在看到一个新需求时，本能地判断「这个用AI做比传统方案更合适」还是「这个没必要上AI」。

阶段二：设计者 —— 「我能定义AI产品方案」
你开始独立负责一个AI功能或产品模块的设计。你需要写PRD，需要定义Prompt策略，需要和算法团队讨论效果评估标准。这个阶段的核心不再是「用AI」，而是「让别人能用上AI」。
这个阶段要练的：写AI PRD的能力——特别是Prompt示例、边界case定义、容错标准；和算法团队对齐效果预期（而不是功能预期）；通过数据分析判断AI效果好不好。
判断你过了这个阶段的标准：你主导的AI功能上线了，效果达标（而不是「能跑就行」），并且你能说清楚为什么达标以及下一步如何优化。

阶段三：架构者 —— 「我能规划AI产品的技术策略」
你不再只是设计一个功能，而是需要判断整个产品的AI技术路线。什么时候用大模型、什么时候用小模型、什么时候用规则引擎？Agent的架构怎么设计？AI能力如何嵌入现有的产品体系？
这个阶段要练的：技术架构的判断力（选型、成本、扩展性）；复杂AI系统的拆解能力（把一个大目标拆成多个AI模块的组合）；对行业AI能力演进方向的持续跟踪。
判断你到了这个阶段的标准：你能在需求还没写的时候，就画出整个AI方案的技术架构图，并且算法团队看完认为可行。

大多数人——包括我在内——现在正卡在阶段一到阶段二的过渡期。这完全正常。AI行业这两年的变化速度太快了，一年前阶段二的能力要求，和今天的已经完全不一样。所以不要焦虑，但要保持练习。

▲ [ 图3 ] AI PM能力成长三阶段

五、来自测一下：你现在跑了多远？

讲了这么多，落到最后还是一张清单实用。

下面这16条，覆盖了传统PM基本功和AI PM新增能力的核心项。不需要每条都打勾——但你需要知道你哪些是短板，然后有意识地补。

AI PM能力自检清单

传统基本功（8项）

能从用户反馈和业务数据中独立发现需求，不只是承接老板/业务方的「需求」
能独立撰写结构完整的PRD（背景、目标、方案、验收标准、风险）
能用流程图/状态图清晰表达业务逻辑
能独立主持需求评审，回答研发和测试的核心质疑
能制定项目里程碑并推动按时交付
能定义产品核心指标并搭建基础数据看板
能通过数据分析发现问题并给出优化方向
能用竞品分析得出有意义的差异化判断

AI新增能力（8项）

能独立判断一个场景适不适合用AI解决（不是「老板说要做AI」就做）
能用自然语言解释大模型的基本工作原理和核心局限（幻觉、上下文窗口、延迟）
能独立设计和优化Prompt（结构完整、有角色、有约束、有示例）
能解释RAG是什么、解决什么问题、什么场景该用
能为AI功能定义「效果好不好」的评估标准（不是拍脑袋说85%就行）
能为AI功能设计兜底方案（AI做不了的时候怎么办）
能大致估算一个AI功能的调用成本（知道调用一次大模型大概多少钱）
能持续跟踪大模型行业的技术进展（自己关注的领域有什么新能力出现）

先勾选，再重点练短板。建议每月回来看一次，看看勾出来的格子有没有变多。

写在最后：别被「能力模型」吓到

最后说一句真心话。

我见过太多人，看到AI PM的能力要求之后第一反应是：「这也太多了吧，我离这个标准还差得远。」然后要么直接放弃，要么开始报各种课、买各种书，搞得很焦虑。

不需要。

能力模型不是你拿来打分的考卷，是你用来指方向的导航图。你不需要一次点亮所有技能点。你今天在哪不重要，重要的是你每周在往正确的方向走。

举个例子：你不用今天就学会写Prompt。但如果你这周开始，每次用ChatGPT之前认真想一想「我该怎么描述我的需求，才能让它做得更好」——三个月之后，你的Prompt设计能力会比现在高一大截。而这个过程几乎不需要额外花时间。

同样的道理，你不需要今天就能独立设计Agent架构。但如果你这周花半小时了解一下RAG是什么，下个月再看一篇Agent的案例文章，半年之后你对AI产品架构的判断力会自然建立起来。

AI PM的能力成长，不是考试突击，是日常积累。

下周我们进入需求篇。我们会聊一个所有AI PM都绕不开的核心问题：怎么找到真正值得用AI解决的场景？不是每个问题都适合上AI，但很多PM的判断逻辑是错的。下期见。

三件事推荐你做：

1. 用上面的自检清单给自己打一遍分，然后截图存下来。一个月之后再打一遍，看看进步了没有。

2. 转发给一个和你一样「正在转AI方向」的PM朋友。能力成长这件事，有个人互相监督会快很多。

3. 在评论区告诉我：你的自检清单里，哪一项是目前最大的短板？我会根据大家反馈最多的短板，在后续文章里重点展开。

下一篇预告

第03期：AI需求洞察，如何找到值得做的AI场景？

别再用「老板说要做AI」来决定做什么了 —— 你需要的是一套判断框架。

第03期：AI需求洞察，如何找到值得做的AI场景？

别再用「老板说要做AI」来决定做什么了 —— 你需要的是一套判断框架。