乐于分享
好东西不私藏

从衡量到兑现:AI价值如何真正走向经营结果——麦肯锡五层框架的观察与组织发展启示

从衡量到兑现:AI价值如何真正走向经营结果——麦肯锡五层框架的观察与组织发展启示

摘要

麦肯锡于4月24日发布的From promise to impact: How companies can measure—and realize—the full value of AI》这篇文章讨论的,并不只是“如何评估一个 AI 项目”,而是企业在 AI 应用进入深水区之后,如何建立一套能够把技术潜力转化为经营结果的管理系统。原文明确提出:AI 的潜力固然巨大,但其影响取决于 accountability;领导者需要衡量正确的指标,并且只规模化那些已经证明有效的方案
在这一判断之下,文章给出了一个完整的管理框架:一套从technical performance贯通到 financial impact 的五层测量体系;一套由 monthly and quarterly cadence、shared evidence pack 和 decision gates 组成的治理机制;以及一条从 Pilot 到 Full scale 的项目推进路径。其核心含义在于,AI 价值不是靠技术上线自然产生的,而是需要通过严谨的衡量、清晰的责任归属和持续的治理节奏,被组织稳定地“做出来”。

从组织发展视角看,这篇文章的启发也很明确:AI 价值衡量表面上是指标设计问题,实质上是组织管理问题;而 AI 价值兑现,最终取决于企业是否具备把技术表现、用户采用、流程改善、战略结果和财务结果连接起来的能力。

一、麦肯锡原文真正要解决的,不是“AI 重不重要”,而是“AI 如何产生可验证的影响”

文章开篇给出的判断非常直接:
“AI’s potential is enormous, but its impact depends on accountability.”
这几乎可以看作全文的总论点。

原文指出,不少企业虽然已经在一个或多个业务职能中使用生成式 AI,也开始尝试 agentic AI,但相当一部分组织仍然没有看到 enterprise-wide EBIT impact。在作者看来,AI 活动与 AI 影响之间的鸿沟,非但没有缩小,反而仍在扩大。

原文对这一现象的解释也很清楚:很多组织部署 AI 的方式,more visible than valuable。例如,各类横向通用工具——聊天机器人、copilot、总结器——可以改善员工体验,也能帮助人们工作得更快,但它们正在迅速变成 table stakes,往往难以直接改变企业的损益表。相比之下,更高价值的做法,是在特定业务域中推动 end-to-end workflows 的自动化,例如理赔处理、客户服务、需求计划等。原文特别强调,这类部署“do more than accelerate work—they reshape it”。
但即使进入这些高价值场景,企业仍然常常难以证明影响。团队对“该衡量什么、如何归因”缺乏共识,结果是项目难以继续扩大,预算受到质疑,原本应该被强化的 business case 反而被不断重新审视。
因此,麦肯锡真正试图解决的问题不是“AI 值不值得做”,而是:企业如何用一套像资本投资一样严谨的方式,证明 AI 的价值,并据此决定哪些项目应该继续投入、哪些项目不应扩张

二、原文的核心结构,是一套从技术表现到经营结果的五层框架

文章提出了一套five-layer framework,并明确说明其作用是:建立一条从模型表现到财务影响的、可审计的价值链条。这套框架不仅回答“看什么”,也回答“谁负责什么”。

原文给出的五层分别如下。

Layer 1:Financial impact

这是最顶层,也是企业最终关心的结果层。原文认为,这一层用于判断 AI 是否真正交付了企业级价值,典型指标包括:

●  收入提升,例如更高转化率或更快销售周期;

●  成本下降,例如单位服务的人力投入减少;

●  利润率改善

●  总拥有成本,包括模型使用成本、云成本、供应商与许可费用等。

原文还特别强调,只有当收益与成本被放在同一本账里,ROI 才能经得住审视,并真正进入预算和战略讨论。

这一层对应的 owner,在原文中是 Finance / financial planning and analysis

Layer 2:Strategic outcomes

这一层关注 AI 是否推动了业务单元真正关心的战略性结果。与财务结果相比,这些指标更接近日常经营,颗粒度更高,也更能反映 AI 是否在关键业务议题上产生作用。原文举到的例子包括:

●  客户满意度提升;

●  准时交付改善;

●  更少的非计划停机;

●  更高的首联解决率;

●  通过 AI 定向带来的销售提升或客户留存改善。

这一层的 owner,在原文中是 Business unit general manager / strategy lead

Layer 3:Operational KPIs

这一层关注 AI 是否改善了“工作是如何被完成的”。原文把它视为业务的“日常脉搏”,典型指标包括:

●  周期时长是否缩短;

●  缺陷率、返工率是否下降;

●  服务流程中的放弃率是否下降;

●  首次解决率是否提升;

●  每单、每案或每次交易的成本是否下降。

这部分的关键不在于 AI 是否“被使用”,而在于业务流程是否因此变得更快、更顺、更有效。
这一层对应的 owner,在原文中是 Named process owner with E2E accountability。也就是说,这不是泛泛的协作责任,而是明确的端到端流程责任。

Layer 4:User adoption  &   engagement

这是原文特别强调的一层,也是许多 AI 部署中最容易被忽视的一层。作者指出,即便模型能力很强,如果用户没有在日常工作中持续使用并形成信任,价值就很难真正释放。原文甚至直接将 adoption 称为许多 AI 部署中缺失的一环

这一层的典型指标包括:

●  日活用户数量及其在不同角色中的分布;

●  有资格使用 AI 支持的任务中,有多少真正使用了 AI;

●  功能采用深度;

●  AI 输出被接受的比例,相对于被 override 或大幅修改的比例。

原文指出,当这些指标改善时,意味着 AI 正在进入真实工作流,而不是停留在偶发性实验状态;当这些指标滞后或在不同岗位间差异明显时,则往往暴露出信任问题、可用性问题或培训问题。

这一层对应的 owner,在原文中是 Product and frontline operations leaders

Layer 5:Technical performance

最底层是技术表现层,也就是原文所说的“必要但不充分”的基础层。其功能是判断 AI 系统是否在安全、质量、成本和可靠性边界内稳定运行。原文给出的指标包括:

●  幻觉率与合规/安全风险;

●  单次交互的 token 成本与调用频率;

●  输出质量与可信度;

●  负载下的响应延迟;

●  随时间变化的性能漂移。

原文明确指出,这些技术指标非常关键,但如果不与 adoption 和 operational impact 一起观察,就无法单独证明业务价值。

这一层对应的 owner,在原文中是 Data science and engineering leaders

三、原文的关键不只是“五层”,更在于把“五层”变成管理动作

如果只看到五层框架本身,很容易把这篇文章理解成一套“指标清单”。但实际上,原文更进一步讨论的是:如何让测量体系真正嵌入管理过程

文章明确提出,一个测量框架是否有效,取决于支撑它的治理机制。即使指标设计合理,如果没有嵌入领导者的绩效审视、资源分配和决策过程,其实际价值仍然会大打折扣。

原文在治理层面给出三个非常具体的抓手。

1. 固定节奏的治理 cadence

作者建议建立清晰的monthly and quarterly cadence。其目的不是增加官僚程序,而是减少噪音,用固定节奏取代临时会议、零散汇报和口径冲突。

2. 统一的 evidence pack

原文提出,组织应建立一个shared evidence pack,作为跨五层讨论的单一事实来源。这个 evidence pack 需要同时汇总收益、总拥有成本、采用情况和技术健康度,从而让不同角色基于同一套证据进行决策。

3. 明确的 decision gates

作者进一步指出,组织需要设置清晰的 decision gates。换句话说,测量的意义不只是“知道进展”,而是把进展转化为是否继续投钱、是否扩大 rollout、是否增加工程资源的依据。文章给出的典型问题包括:

●  模型是否已经足够安全和稳定,可以面对真实用户;

●  用户是否真的在真实工作流中采用;

●  运营和财务影响是否已经达到足以支持规模化的程度。

这部分实际上非常关键,因为它说明了原文不是单纯地讨论“怎么衡量”,而是在讨论如何把衡量转化为投资决策与资源配置机制

四、原文还给出了一条从试点到规模化的推进路径

为了把“五层框架”真正落地,文章还将 AI 项目推进概括为四个阶段,并强调不同阶段关注的重点不同。

1. Pilot phase

这一阶段的目标是验证技术可行性与实际可行性。团队需要在清晰的技术 KPI、安全与成本 guardrails 下,用一个范围收敛的 pilot 去验证原始价值假设是否成立,同时提前锁定后续的影响归因方式,例如 A/B 测试或分批 rollout。原文强调,这个阶段的目标不是规模化,而是获得可信的 proof。

2. MVP phase

这一阶段意味着 AI 开始进入真实工作流,但 exposure 仍然有限。与 pilot 不同,MVP 阶段的关键特征是:测量开始被直接嵌入工具本身,系统会自动追踪技术指标、用户行为和初步的流程影响;同时,人机协同的 safeguards、风险升级路径和日常监控责任也需要被明确下来。

3. Initial scaling

这是很多项目真正分出成败的阶段。原文指出,到了这一阶段,组织需要更严格地归因和评估经济性:采用不能只停留在早期拥护者,运营改善需要具有统计显著性,财务收益至少要能够覆盖总拥有成本。如果这时 ROI 仍不明显,组织应当选择 refinement 或 stop,而不是机械性地继续扩大投入。

4. Full scale

当一个部署真正进入 full scale,意味着 AI 已经从“项目”变成了“business as usual”。它被嵌入标准工作流、治理机制和预算周期之中,采用稳定,运营 KPI 持续改善,财务影响进入正式计划,风险与合规要求也被满足。到这一阶段,五层测量框架不再是专项工具,而成为日常绩效管理的一部分。

五、基于原文框架,如何从组织发展视角进一步理解这篇文章

如果从组织发展视角再往前看一步,这篇文章之所以重要,是因为它把 AI 问题从“技术应用”推进成了“组织能力建设”。至少有五点启示值得展开。

1. AI 价值兑现首先是责任设计问题

原文之所以反复强调 accountability,本质上是在提醒管理者:AI 若只有技术 owner,而没有结果 owner,就很难稳定地产生影响。特别是 Layer 2 和 Layer 3 的 owner 设计——业务负责人和端到端流程负责人——说明价值兑现必须进入正式经营责任体系。

2. 流程重构比工具部署更接近真实价值

原文对 horizontal tools 与 end-to-end workflow automation 的区分,实际上揭示了一个重要事实:很多 AI 项目的边际价值并不来自“多一个工具”,而来自“工作方式被重构”。这也是为什么 Layer 3 的 operational KPIs 在全文中处于关键位置。

3. 用户采用不是软问题,而是价值链中的硬节点

在很多组织里,adoption 常被视作培训或推广问题;但原文实际上把它放在通向业务结果的关键链路上。没有稳定 adoption,就不会有可观测的流程改善;没有流程改善,就不会有战略或财务结果。换句话说,用户信任与使用深度不是附属问题,而是价值兑现机制本身的一部分。

4. 组织能力的积累,取决于是否建立了跨层证据体系

原文中的 evidence pack 非常值得重视。它不仅是一个汇报工具,更是一种组织学习装置:它让技术表现、用户行为、流程变化和财务结果被放到同一套证据链条里,进而让组织逐步学会判断“什么样的 AI 真正有价值”。

5. AI 规模化的本质,是治理能力而不是推广能力

原文中关于 decision gates、阶段门槛和 refine-or-stop 的安排,说明规模化并不意味着全面铺开,而意味着在证据足够、责任清晰、治理到位的前提下扩大投入。从组织发展角度看,这种能力本质上不是市场推广能力,而是治理能力与资源配置能力。

六、对管理者而言,下一步更重要的是建立“从 proof 到 performance”的管理系统

文章结尾写得很清楚:下一阶段的 AI 竞争,不会由“谁实验得最多”决定,而会由“谁更能把实验转化为可衡量、可重复的绩效”决定。

如果把这一点转译成管理动作,企业至少需要回答以下几个问题:

●  我们是否已经把技术指标、采用指标、运营指标、战略指标和财务指标连成了一条链

●  每一层指标是否都有明确 owner,而不是停留在模糊协同

●  我们是否建立了固定 cadence,而不是靠项目热情推动

●  我们是否拥有统一 evidence pack,而不是各部门各讲各的

●  我们是否真的设置了“证明不了价值就不继续扩张”的 stage gates

只有这些问题被回答清楚,AI 才更可能从一次次局部试点,变成稳定的经营改进机制。

结语

回顾麦肯锡原文,这篇文章最重要的价值,并不只是提出了一个五层框架,而是给出了一个更完整的管理命题:AI 价值必须被衡量,也必须被归因,更必须被纳入治理节奏与投资决策。

从这个意义上说,AI 的竞争已经不只是模型竞争、工具竞争或场景竞争,更是组织将 proof 转化为 performance 的能力竞争。谁能更早建立这套能力,谁就更有机会把 AI 从技术潜力变成真实、持续、可审计的经营结果。

原文信息 

标题:

From promise to impact: How companies can measure—and realize—the full value of AI

来源:

https://www.mckinsey.com/capabilities/quantumblack/our-insights/from-promise-to-impact-how-companies-can-measure-and-realize-the-full-value-of-ai