AI PM工作手册 · 第2/12期 | 阅读约8分钟
能力模型成长路径实用框架
昨天发完第一篇后,后台收到一条留言,我看完笑了半天。
一个读者说:「看完文章我终于确认了——我不是AI PM,我只是一个会用ChatGPT写周报的普通PM。」
后面又补了一句:「但我老板让我下个月负责一个'AI赋能客服'的项目,我现在慌得一批。能不能列个清单告诉我,AI PM到底要会哪些东西?我好对着补课。」
这就是第二篇要解决的问题。
上期我们聊了AI PM到底在做什么。这期聊一个更实操的问题:如果你想从传统PM转AI方向,或者已经在做AI产品但感觉基础不牢,你需要在哪些维度上补课?
不是给你一个「AI产品经理能力模型」的华丽框架图——那种图网上搜一搜能找出二十个版本,每个都画得漂漂亮亮,但看完还是不知道该从哪下手。
这篇文章要做的是:把能力模型拆成你下周就能开始练的东西。
阅读提示
这是「AI PM工作手册」系列的第2篇。上一篇我们厘清了AI PM到底做什么,还没看过的朋友建议先读第01期,对理解本篇有帮助。本系列的完整12期规划,可以在第01期的序言部分查看。
一、传统PM的能力地基,你得先站住了
先说一个容易被人跳过但至关重要的事实:
AI PM的能力模型不是在空地上盖楼,是在传统PM的地基上加层。
我见过一个学计算机出身的哥们,模型原理讲得头头是道,一让他写PRD就崩——需求背景和三句话概括完,剩下的篇幅全在讨论用什么模型、Prompt怎么设计。研发拿到文档直接问:「这个功能到底给谁用?解决什么问题?验收标准是什么?」
反过来,传统PM的基本功不过关,AI那层加得再高也站不稳。
所以先把传统PM的四个核心能力快速过一遍。这不是重点,但你需要确认自己在这四条线上有没有明显短板:
你不需要每条都做到100分。但如果你在需求洞察这条线上明显弱,那你做AI PM会比别人累很多——因为你连「这件事值不值得做」都没判断好,就开始纠结「用什么模型做」了。

▲ [ 图1 ] 传统PM能力地基 + AI能力叠加层
二、AI PM多出来的,到底是什么?
传统PM的四条线之外,AI PM需要额外长出三块新肌肉。这三块肌肉不是传统能力的简单延伸,是真正的新增维度。
新增能力一:技术感知
注意,我说的是「技术感知」,不是「技术能力」。
传统PM面对的技术栈相对稳定——前端框架、后端架构、数据库,这些东西三五年变化不大。你不需要知道React的虚拟DOM怎么实现的,但你知道「这个需求前端能不能做」就够了。
AI领域不一样。大模型的能力边界在以月为单位的节奏变化。半年前RAG还是前沿方向,现在已经是标配。一年前大家还在纠结Prompt怎么调,现在Agent框架都出了一堆。GPT-4出来之前,让模型做多步推理基本是幻想;GPT-4出来之后,这件事变成了工程问题。
技术感知不要求你写代码,但要求你保持三件事:
- 知道现在能做什么。大模型的最新版本能力到什么程度?市面上的AI产品做到了什么水平?这不需要看论文,多刷几个行业号、多看几个产品就够了。
- 判断半年后大概能做什么。不要精确预测——没人能。但要有一个大致的方向感,知道哪些能力正在快速变好,哪些短期内不会有突破。这个判断直接决定你现在的产品规划要不要给某些能力留位置。
- 识别技术的坑在哪里。大模型能不能做实时数据?能不能做精确计算?能不能处理超长文本?这些不是能力高低的问题,是天生局限的问题。不知道这些,你提出来的需求就是坑研发的。
举个例子。去年有个团队想做「AI自动生成财务报表并分析」。PM觉得这个需求天经地义——财务数据都在系统里,让AI读一下,生成分析报告,多好。
结果第一步就卡住了:财务报表里全是数字,大模型做算术是出了名的不靠谱。把「第三季度的总营收」算错一个数字,你敢拿给CFO看吗?
如果这个PM有基本的技术感知,他在写需求之前就会问自己一个问题:这个场景里,大模型擅长什么(分析文本、生成报告),不擅长什么(精确计算)?回答了这个,方案自然就分成了两步——先用规则引擎算数,再用大模型生成分析文字。
技术感知不是你懂多少技术,是你知道技术在什么情况下能帮你、什么情况下会坑你。
新增能力二:模型理解
这是三块新肌肉里最容易让人产生误解的一块。
「模型理解」不是让你去学机器学习、深度学习、NLP——那是算法工程师的事。PM需要的模型理解,范围窄很多,深度也浅很多:
- 理解大模型的基本工作原理——它不是在「思考」,它是在做概率预测。这个认知听起来简单,但它直接决定了你怎么设计交互:你不会期望它推理出你没给过信息的结论,你会在关键节点加确认机制。
- 理解Prompt的本质——Prompt不是咒语,是你给模型的「任务说明书」。好的Prompt和差的Prompt之间的差距,远超很多PM的想象。同样的模型,Prompt写得好和写得差,效果可以从「能用」到「没法用」。
- 理解RAG在什么场景下该用——当你的业务有大量实时更新的知识(比如产品文档、公司政策、FAQ),你不能靠微调模型来解决,成本太高、更新太慢。RAG这时候就是标配方案。
- 理解效果评估的基本逻辑——AI的输出不像传统功能有明确的「对」和「错」。「这个回答质量怎么样」是一个主观判断,你要学会把它转化成可量化的评估标准。
这四个理解的共同点是:它们不是让你「会做」,是让你「能判断」。判断一个方案靠不靠谱,判断一个优化方向值不值得试,判断一个工程师跟你说的「这样做不了」是真的做不了还是他在偷懒。

▲ [ 图2 ] AI PM的模型理解四层结构
新增能力三:不确定性管理
这是三块肌肉里最硬的一块,也是AI PM和传统PM最本质的分水岭。
传统软件的需求是这样写的:
用户点击「提交订单」按钮后,系统在3秒内完成支付并显示订单详情页。
这个需求有明确的行为、明确的时间、明确的结果。开发做到就是做到,没做到就是Bug。
AI功能的需求是这样写的:
当用户咨询退换货时,AI客服理解用户意图并给出符合公司政策的回复。
这里面的「理解用户意图」和「符合公司政策的回复」,每一个词都有模糊空间。就算做到了95%准确率,剩下的5%算不算Bug?如果那5%里有一条是「用户说我要退款,AI回复了'好的请提供订单号',但用户其实已经退过款了」——这条算故障吗?
不确定性管理,就是学会和「做不到100%」和平共处,但又不让它失控。
具体来说,包含三个能力:
- 定义「够好了」的阈值。不是你说了算——是和业务方、用户、合规一起定出来的。退款准确率99%可能都不够,商品推荐60%可能就超出预期。每个场景有各自的容错标准。
- 设计兜底机制。AI答不出来的、答错的、答出安全风险的,得有退路。要么转人工,要么降级为固定话术,要么直接承认「我不知道」——哪一种都比硬编一个答案强。
- 建立持续监控。AI效果不是上线就完事了。业务规则变了、用户行为变了、模型版本变了,都可能让效果往下掉。你得有机制能及时发现,而不是等用户投诉才知道。
这三件事里,最难的是第一件。因为它没有标准答案,每个产品、每个场景都要从头判断。而且你提出来的标准,很可能和业务方的预期有巨大落差——「什么?你说AI可能答错?那我们要它干嘛?」
管理这种落差,本身就是AI PM能力的一部分。
三、不需要会写代码,但需要建立「技术共同语言」
这一段我想说得特别具体,因为每次聊到这个话题,两边的人都容易走极端。
一边是「我不会技术,但我可以学」,然后买了一堆网课学Python,三个月后发现除了会写Hello World之外毫无用处。
另一边是「我是PM又不是程序员,技术关我什么事」,然后每次和算法团队开会就像在听天书。
我的建议是:不要学技术,要学「理解技术的语言」。
这两件事有什么区别?学技术是你去搞懂LSTM和Transformer的数学原理。学「理解技术的语言」是你知道算法工程师说「这个需求用RAG可以,但召回率可能不高」是什么意思,以及你接下来该问什么问题。
具体来说,你需要能用正常人的语言解释这些概念:
- 幻觉(Hallucination):模型在不知道答案的时候,不会说「我不知道」,而是会编一个听起来很合理的假答案。这是大模型的基因缺陷,不是哪个版本的Bug。
- 上下文窗口(Context Window):模型一次能「记住」的信息量上限。给你的资料超过这个上限,前面的信息就会被丢掉。这是你设计RAG方案时必须考虑的约束。
- 推理延迟(Latency):从用户发消息到AI回复,中间需要多长时间。如果超过3秒,用户体验就差了。每次加新能力(多轮对话、联网搜索、复杂推理)都会增加延迟,你需要在能力和速度之间做权衡。
- 成本结构:调用一次大模型API多少钱。一个小需求如果每次用户操作都调一次GPT-4,一个月可能吃掉整个部门的预算。这也是PM需要算的账。
这四个概念,一个下午就能理解。理解了,你和算法团队的沟通效率至少翻倍。不需要你写一行代码。
四、能力成长的三个阶段:你现在在哪?
讲完了AI PM的三块新肌肉,接下来是最实用的问题:我该怎么练?
我观察了周围做得比较好的AI PM,发现他们的成长路径大致分三个阶段。你不一定严格按顺序走,但每个阶段需要重点练的能力不一样。
阶段一:使用者 —— 「我会用AI工具」
你现在每天用ChatGPT、用AI绘图、用AI写代码助手。你的直觉开始建立:知道Prompt写得好不好对结果影响巨大,知道哪些任务AI做得比人快、哪些做得还没人好。
这个阶段要练的:把AI当成你的工作助手,每天用、用到顺手。写PRD时先用AI生成一版再改,做竞品分析时让AI列出框架你填充,整理会议纪要时直接用AI初稿再修正。用得越多,你对AI能力的直觉就越准。
判断你过了这个阶段的标准:你开始能在看到一个新需求时,本能地判断「这个用AI做比传统方案更合适」还是「这个没必要上AI」。
阶段二:设计者 —— 「我能定义AI产品方案」
你开始独立负责一个AI功能或产品模块的设计。你需要写PRD,需要定义Prompt策略,需要和算法团队讨论效果评估标准。这个阶段的核心不再是「用AI」,而是「让别人能用上AI」。
这个阶段要练的:写AI PRD的能力——特别是Prompt示例、边界case定义、容错标准;和算法团队对齐效果预期(而不是功能预期);通过数据分析判断AI效果好不好。
判断你过了这个阶段的标准:你主导的AI功能上线了,效果达标(而不是「能跑就行」),并且你能说清楚为什么达标以及下一步如何优化。
阶段三:架构者 —— 「我能规划AI产品的技术策略」
你不再只是设计一个功能,而是需要判断整个产品的AI技术路线。什么时候用大模型、什么时候用小模型、什么时候用规则引擎?Agent的架构怎么设计?AI能力如何嵌入现有的产品体系?
这个阶段要练的:技术架构的判断力(选型、成本、扩展性);复杂AI系统的拆解能力(把一个大目标拆成多个AI模块的组合);对行业AI能力演进方向的持续跟踪。
判断你到了这个阶段的标准:你能在需求还没写的时候,就画出整个AI方案的技术架构图,并且算法团队看完认为可行。
大多数人——包括我在内——现在正卡在阶段一到阶段二的过渡期。这完全正常。AI行业这两年的变化速度太快了,一年前阶段二的能力要求,和今天的已经完全不一样。所以不要焦虑,但要保持练习。

▲ [ 图3 ] AI PM能力成长三阶段
五、来自测一下:你现在跑了多远?
讲了这么多,落到最后还是一张清单实用。
下面这16条,覆盖了传统PM基本功和AI PM新增能力的核心项。不需要每条都打勾——但你需要知道你哪些是短板,然后有意识地补。
AI PM能力自检清单
传统基本功(8项)
能从用户反馈和业务数据中独立发现需求,不只是承接老板/业务方的「需求」
能独立撰写结构完整的PRD(背景、目标、方案、验收标准、风险)
能用流程图/状态图清晰表达业务逻辑
能独立主持需求评审,回答研发和测试的核心质疑
能制定项目里程碑并推动按时交付
能定义产品核心指标并搭建基础数据看板
能通过数据分析发现问题并给出优化方向
能用竞品分析得出有意义的差异化判断
AI新增能力(8项)
能独立判断一个场景适不适合用AI解决(不是「老板说要做AI」就做)
能用自然语言解释大模型的基本工作原理和核心局限(幻觉、上下文窗口、延迟)
能独立设计和优化Prompt(结构完整、有角色、有约束、有示例)
能解释RAG是什么、解决什么问题、什么场景该用
能为AI功能定义「效果好不好」的评估标准(不是拍脑袋说85%就行)
能为AI功能设计兜底方案(AI做不了的时候怎么办)
能大致估算一个AI功能的调用成本(知道调用一次大模型大概多少钱)
能持续跟踪大模型行业的技术进展(自己关注的领域有什么新能力出现)
先勾选,再重点练短板。建议每月回来看一次,看看勾出来的格子有没有变多。
写在最后:别被「能力模型」吓到
最后说一句真心话。
我见过太多人,看到AI PM的能力要求之后第一反应是:「这也太多了吧,我离这个标准还差得远。」然后要么直接放弃,要么开始报各种课、买各种书,搞得很焦虑。
不需要。
能力模型不是你拿来打分的考卷,是你用来指方向的导航图。你不需要一次点亮所有技能点。你今天在哪不重要,重要的是你每周在往正确的方向走。
举个例子:你不用今天就学会写Prompt。但如果你这周开始,每次用ChatGPT之前认真想一想「我该怎么描述我的需求,才能让它做得更好」——三个月之后,你的Prompt设计能力会比现在高一大截。而这个过程几乎不需要额外花时间。
同样的道理,你不需要今天就能独立设计Agent架构。但如果你这周花半小时了解一下RAG是什么,下个月再看一篇Agent的案例文章,半年之后你对AI产品架构的判断力会自然建立起来。
AI PM的能力成长,不是考试突击,是日常积累。
下周我们进入需求篇。我们会聊一个所有AI PM都绕不开的核心问题:怎么找到真正值得用AI解决的场景?不是每个问题都适合上AI,但很多PM的判断逻辑是错的。下期见。
三件事推荐你做:
1. 用上面的自检清单给自己打一遍分,然后截图存下来。一个月之后再打一遍,看看进步了没有。
2. 转发给一个和你一样「正在转AI方向」的PM朋友。能力成长这件事,有个人互相监督会快很多。
3. 在评论区告诉我:你的自检清单里,哪一项是目前最大的短板?我会根据大家反馈最多的短板,在后续文章里重点展开。
下一篇预告
第03期:AI需求洞察,如何找到值得做的AI场景?
别再用「老板说要做AI」来决定做什么了 —— 你需要的是一套判断框架。
第03期:AI需求洞察,如何找到值得做的AI场景?
别再用「老板说要做AI」来决定做什么了 —— 你需要的是一套判断框架。
夜雨聆风