最近我一直在用Codex 做一件事:
训练一个业务复盘 skill
不是让 AI 写几段漂亮话,也不是让它把复盘报告排版得更好看。
真正要做的是,把咨询顾问做业务复盘时的判断过程,拆成 AI 可以稳定执行的工作流程。
这件事让我越来越确认一个判断:
咨询行业用 AI,核心不是“写得更快”,而是“把顾问的判断标准产品化”。
尤其是 Codex+咨询 这个组合,很值得咨询公司认真研究。
因为 Codex 不只是聊天工具。它可以读文件、改文档、生成 Word、调用脚本、沉淀 skill,还能把一次次交付中的修正意见写回流程。
如果用得好,它不是一个临时写稿助手,而是一个可以被训练的咨询工作台。
一、为什么从业务复盘开始训练?
我没有一开始就训练“战略规划 AI”或“商业模式诊断 AI”。
我先从业务复盘切入。
原因很简单:业务复盘最适合训练。
它有清晰输入:目标、实际、差距、业务结构、项目案例、过程动作。
它有清晰方法:差距量化、差距拆解、关键差距识别、主因链下钻、根因确认、反推验证。
它也有清晰交付:关键差距摘要卡、根因分析主图、主因链说明、根因确认卡、后续建议。
这类工作不像纯战略判断那么发散,也不像普通文案写作那么主观。
它有结构,有标准,有检验方式。
咨询公司训练自己的 AI 工具,最好先从这种“有方法、有样本、有交付格式”的工作开始。
二、业务复盘 skill 不是一段 Prompt
很多人一说训练 AI,就想到写一个很长的 Prompt。
这还不够。
真正的 skill,至少要包含四层东西。
层级 | 要沉淀什么 | 业务复盘里的例子 |
方法论层 | 顾问做判断时遵守的原则 | 差距优先、主因链优先、根因要能反推差距改善 |
流程层 | AI 每次处理材料要按什么顺序走 | 先量化差距,再拆差距结构,再抓关键差距,最后下钻根因 |
交付层 | 输出应该长成什么样 | 摘要卡、主因链、根因确认卡、改进建议 |
校验层 | 怎么判断输出有没有跑偏 | 是否停在抽象原因,是否平均展开,是否编造数字,是否缺反推验证 |
如果只有 Prompt,没有方法论,AI 会写得像。
如果只有方法论,没有流程,AI 会每次发挥不稳定。
如果只有流程,没有校验,AI 会把错误包装得很完整。
所以我最近做的事,本质上不是“写提示词”,而是在训练一套咨询交付系统。
三、Codex 在这里的价值是什么?
Codex+咨询 的价值,和普通聊天式 AI 不太一样。
普通聊天工具更像一个顾问助理,你问它,它回答。
Codex 更像一个可以参与交付链条的工作台。
这段时间,我用它做了几类动作:
第一,读取客户给的 HTML、Word、Excel、PPT 等资料,抽出关键事实。
比如船用电机业务复盘里,它要抓住:全年差距来自哪里,主因链是哪一条,为什么不是单个项目失败,而是重点客户经营不足。
再比如阿里国际站复盘里,它要抓住:表面是询盘转化弱,深层是外贸负责人长期缺位,再往下是岗位画像与阶段需求不匹配。
第二,把复盘方法固化成 skill。
不是每次都重新告诉它“你要从差距开始”,而是把差距量化、主因链、对象化追问、反推验证这些规则写进 skill。
第三,用真实样本反复回测。
同一个复盘素材,先输出报告,再改成公众号,再改成头条文章。每次看它有没有抓住真正的主因,有没有把工具讲清楚,有没有为了好看而丢掉关键证据。
第四,把我的修正意见继续写回流程。
比如我发现它容易写得泛,就要求它必须回答“企业有什么痛点、这个工具解决什么、使用后有什么效果”。
我发现它容易跳过文档生成,就把“最终生成 Word 文档”写进流程。
我发现头条封面经常被忘掉,就把“头条必须生成 16:9 封面”写进 skill。
这就是训练。
不是一次写对,而是不断把顾问的判断和交付要求固化下来。
四、咨询公司应该怎么训练自己的 AI 工具?
我现在更倾向于把咨询公司的 AI 训练分成五步。
第一步,选一个高频交付场景。
不要一上来就做“全能咨询顾问”。先选一个可定义的场景,比如业务复盘、战略解码、组织绩效、经营分析会、客户访谈纪要、项目周报。
第二步,拆顾问动作。
把一个高级顾问脑子里的判断拆出来。比如业务复盘,顾问不是看到问题就写原因,而是先问:差距是多少?差距在哪?哪条链解释力最强?这个根因能不能反推改善?
第三步,沉淀标准交付物。
AI 不能只会聊天,它要知道交付物长什么样。业务复盘至少要有摘要卡、主因链、根因确认卡和建议。战略解码至少要有战略地图、三力四平台、关键任务和绩效承接。
第四步,用真实案例回测。
拿过去做过的项目材料喂给 AI,看它能不能复现顾问判断。不能复现,就说明 skill 还不够。这个过程比写 Prompt 重要得多。
第五步,把错误写回规则。
AI 每次跑偏,都是一次训练机会。比如它平均展开多条原因,就写入“主因链优先”;它停在能力不足,就写入“抽象原因必须落到具体客户、项目、环节”;它编造数据,就写入“没有材料支撑不得编造具体数字”。
可以把这五步写成一张表:
训练步骤 | 咨询公司要做什么 | 产出 |
选场景 | 从高频、可标准化、资料充足的交付开始 | 一个明确 skill 方向 |
拆动作 | 把顾问判断拆成步骤和追问 | 方法流程 |
定交付 | 明确输出结构、表格、检查清单 | 标准模板 |
做回测 | 用真实项目材料测试输出 | 样本库和问题清单 |
写规则 | 把跑偏点固化为约束 | 可复用 skill |
这套流程跑通后,AI 才会从“会写”变成“会按你的方法工作”。
五、咨询行业训练 AI,最怕三种误区
第一种误区,是把 AI 当成文案工具。
如果只是让 AI 把报告写得更顺,它当然有价值,但价值有限。咨询公司的核心资产不是文字,而是判断。
第二种误区,是把所有方法塞进一个超级 Prompt。
这会让 AI 看起来很强,但很难维护。一旦场景变复杂,规则互相打架,输出就会漂。
更好的方式,是一个场景一个 skill,一个 skill 一个清晰边界。
第三种误区,是没有回测。
咨询行业的 AI 工具,不能只看一次输出漂不漂亮。要拿真实项目材料反复测试,看它能不能稳定抓住主因,能不能保留证据,能不能避免编造,能不能按交付标准生成文档。
没有回测,就谈不上训练。
六、未来咨询公司的竞争,会多一个维度
过去咨询公司的竞争,主要看顾问经验、方法论、行业案例和交付团队。
以后还会多一个维度:
谁能把自己的方法论训练成工具。
这并不意味着顾问不重要。
恰恰相反,越是想训练 AI,越需要高级顾问把自己的判断说清楚。
AI 不会自动知道什么叫“主因链解释力更强”,也不会自动知道为什么“客户开发不足”不能停住。它需要顾问把判断标准拆出来、写进去、反复校正。
所以 Codex+咨询 的真正价值,不是替代顾问。
它更像一面镜子,逼咨询公司回答:
你的方法论到底能不能被拆解?
你的交付流程到底能不能被复用?
你的判断标准到底能不能被检验?
如果这些问题回答不出来,AI 只能帮你写得更快。
如果回答得出来,AI 就能帮你把咨询能力沉淀成系统。
最后一句话总结:
咨询公司训练 AI,真正训练的不是 AI。
训练的是自己的方法论、交付流程和判断标准。
夜雨聆风