Codex+咨询:我最近训练业务复盘AI工具的一点体会

最近我一直在用Codex 做一件事：

训练一个业务复盘 skill

不是让 AI 写几段漂亮话，也不是让它把复盘报告排版得更好看。

真正要做的是，把咨询顾问做业务复盘时的判断过程，拆成 AI 可以稳定执行的工作流程。

这件事让我越来越确认一个判断：

咨询行业用 AI，核心不是“写得更快”，而是“把顾问的判断标准产品化”。

尤其是 Codex+咨询这个组合，很值得咨询公司认真研究。

因为 Codex 不只是聊天工具。它可以读文件、改文档、生成 Word、调用脚本、沉淀 skill，还能把一次次交付中的修正意见写回流程。

如果用得好，它不是一个临时写稿助手，而是一个可以被训练的咨询工作台。

一、为什么从业务复盘开始训练？

我没有一开始就训练“战略规划 AI”或“商业模式诊断 AI”。

我先从业务复盘切入。

原因很简单：业务复盘最适合训练。

它有清晰输入：目标、实际、差距、业务结构、项目案例、过程动作。

它有清晰方法：差距量化、差距拆解、关键差距识别、主因链下钻、根因确认、反推验证。

它也有清晰交付：关键差距摘要卡、根因分析主图、主因链说明、根因确认卡、后续建议。

这类工作不像纯战略判断那么发散，也不像普通文案写作那么主观。

它有结构，有标准，有检验方式。

咨询公司训练自己的 AI 工具，最好先从这种“有方法、有样本、有交付格式”的工作开始。

二、业务复盘 skill 不是一段 Prompt

很多人一说训练 AI，就想到写一个很长的 Prompt。

这还不够。

真正的 skill，至少要包含四层东西。

层级	要沉淀什么	业务复盘里的例子
方法论层	顾问做判断时遵守的原则	差距优先、主因链优先、根因要能反推差距改善
流程层	AI 每次处理材料要按什么顺序走	先量化差距，再拆差距结构，再抓关键差距，最后下钻根因
交付层	输出应该长成什么样	摘要卡、主因链、根因确认卡、改进建议
校验层	怎么判断输出有没有跑偏	是否停在抽象原因，是否平均展开，是否编造数字，是否缺反推验证

如果只有 Prompt，没有方法论，AI 会写得像。

如果只有方法论，没有流程，AI 会每次发挥不稳定。

如果只有流程，没有校验，AI 会把错误包装得很完整。

所以我最近做的事，本质上不是“写提示词”，而是在训练一套咨询交付系统。

三、Codex 在这里的价值是什么？

Codex+咨询的价值，和普通聊天式 AI 不太一样。

普通聊天工具更像一个顾问助理，你问它，它回答。

Codex 更像一个可以参与交付链条的工作台。

这段时间，我用它做了几类动作：

第一，读取客户给的 HTML、Word、Excel、PPT 等资料，抽出关键事实。

比如船用电机业务复盘里，它要抓住：全年差距来自哪里，主因链是哪一条，为什么不是单个项目失败，而是重点客户经营不足。

再比如阿里国际站复盘里，它要抓住：表面是询盘转化弱，深层是外贸负责人长期缺位，再往下是岗位画像与阶段需求不匹配。

第二，把复盘方法固化成 skill。

不是每次都重新告诉它“你要从差距开始”，而是把差距量化、主因链、对象化追问、反推验证这些规则写进 skill。

第三，用真实样本反复回测。

同一个复盘素材，先输出报告，再改成公众号，再改成头条文章。每次看它有没有抓住真正的主因，有没有把工具讲清楚，有没有为了好看而丢掉关键证据。

第四，把我的修正意见继续写回流程。

比如我发现它容易写得泛，就要求它必须回答“企业有什么痛点、这个工具解决什么、使用后有什么效果”。

我发现它容易跳过文档生成，就把“最终生成 Word 文档”写进流程。

我发现头条封面经常被忘掉，就把“头条必须生成 16:9 封面”写进 skill。

这就是训练。

不是一次写对，而是不断把顾问的判断和交付要求固化下来。

四、咨询公司应该怎么训练自己的 AI 工具？

我现在更倾向于把咨询公司的 AI 训练分成五步。

第一步，选一个高频交付场景。

不要一上来就做“全能咨询顾问”。先选一个可定义的场景，比如业务复盘、战略解码、组织绩效、经营分析会、客户访谈纪要、项目周报。

第二步，拆顾问动作。

把一个高级顾问脑子里的判断拆出来。比如业务复盘，顾问不是看到问题就写原因，而是先问：差距是多少？差距在哪？哪条链解释力最强？这个根因能不能反推改善？

第三步，沉淀标准交付物。

AI 不能只会聊天，它要知道交付物长什么样。业务复盘至少要有摘要卡、主因链、根因确认卡和建议。战略解码至少要有战略地图、三力四平台、关键任务和绩效承接。

第四步，用真实案例回测。

拿过去做过的项目材料喂给 AI，看它能不能复现顾问判断。不能复现，就说明 skill 还不够。这个过程比写 Prompt 重要得多。

第五步，把错误写回规则。

AI 每次跑偏，都是一次训练机会。比如它平均展开多条原因，就写入“主因链优先”；它停在能力不足，就写入“抽象原因必须落到具体客户、项目、环节”；它编造数据，就写入“没有材料支撑不得编造具体数字”。

可以把这五步写成一张表：

训练步骤	咨询公司要做什么	产出
选场景	从高频、可标准化、资料充足的交付开始	一个明确 skill 方向
拆动作	把顾问判断拆成步骤和追问	方法流程
定交付	明确输出结构、表格、检查清单	标准模板
做回测	用真实项目材料测试输出	样本库和问题清单
写规则	把跑偏点固化为约束	可复用 skill

这套流程跑通后，AI 才会从“会写”变成“会按你的方法工作”。

五、咨询行业训练 AI，最怕三种误区

第一种误区，是把 AI 当成文案工具。

如果只是让 AI 把报告写得更顺，它当然有价值，但价值有限。咨询公司的核心资产不是文字，而是判断。

第二种误区，是把所有方法塞进一个超级 Prompt。

这会让 AI 看起来很强，但很难维护。一旦场景变复杂，规则互相打架，输出就会漂。

更好的方式，是一个场景一个 skill，一个 skill 一个清晰边界。

第三种误区，是没有回测。

咨询行业的 AI 工具，不能只看一次输出漂不漂亮。要拿真实项目材料反复测试，看它能不能稳定抓住主因，能不能保留证据，能不能避免编造，能不能按交付标准生成文档。

没有回测，就谈不上训练。

六、未来咨询公司的竞争，会多一个维度

过去咨询公司的竞争，主要看顾问经验、方法论、行业案例和交付团队。

以后还会多一个维度：

谁能把自己的方法论训练成工具。

这并不意味着顾问不重要。

恰恰相反，越是想训练 AI，越需要高级顾问把自己的判断说清楚。

AI 不会自动知道什么叫“主因链解释力更强”，也不会自动知道为什么“客户开发不足”不能停住。它需要顾问把判断标准拆出来、写进去、反复校正。

所以 Codex+咨询的真正价值，不是替代顾问。

它更像一面镜子，逼咨询公司回答：

你的方法论到底能不能被拆解？

你的交付流程到底能不能被复用？

你的判断标准到底能不能被检验？

如果这些问题回答不出来，AI 只能帮你写得更快。

如果回答得出来，AI 就能帮你把咨询能力沉淀成系统。

最后一句话总结：

咨询公司训练 AI，真正训练的不是 AI。

训练的是自己的方法论、交付流程和判断标准。