从衡量到兑现:AI价值如何真正走向经营结果——麦肯锡五层框架的观察与组织发展启示-夜雨聆风

从衡量到兑现:AI价值如何真正走向经营结果——麦肯锡五层框架的观察与组织发展启示

摘要

麦肯锡于4月24日发布的《From promise to impact: How companies can measure—and realize—the full value of AI》这篇文章讨论的，并不只是“如何评估一个 AI 项目”，而是企业在 AI 应用进入深水区之后，如何建立一套能够把技术潜力转化为经营结果的管理系统。原文明确提出：AI 的潜力固然巨大，但其影响取决于 accountability；领导者需要衡量正确的指标，并且只规模化那些已经证明有效的方案。

在这一判断之下，文章给出了一个完整的管理框架：一套从technical performance贯通到 financial impact 的五层测量体系；一套由 monthly and quarterly cadence、shared evidence pack 和 decision gates 组成的治理机制；以及一条从 Pilot 到 Full scale 的项目推进路径。其核心含义在于，AI 价值不是靠技术上线自然产生的，而是需要通过严谨的衡量、清晰的责任归属和持续的治理节奏，被组织稳定地“做出来”。

从组织发展视角看，这篇文章的启发也很明确：AI 价值衡量表面上是指标设计问题，实质上是组织管理问题；而 AI 价值兑现，最终取决于企业是否具备把技术表现、用户采用、流程改善、战略结果和财务结果连接起来的能力。

一、麦肯锡原文真正要解决的，不是“AI 重不重要”，而是“AI 如何产生可验证的影响”

文章开篇给出的判断非常直接：

“AI’s potential is enormous, but its impact depends on accountability.”

这几乎可以看作全文的总论点。

原文指出，不少企业虽然已经在一个或多个业务职能中使用生成式 AI，也开始尝试 agentic AI，但相当一部分组织仍然没有看到 enterprise-wide EBIT impact。在作者看来，AI 活动与 AI 影响之间的鸿沟，非但没有缩小，反而仍在扩大。

原文对这一现象的解释也很清楚：很多组织部署 AI 的方式，more visible than valuable。例如，各类横向通用工具——聊天机器人、copilot、总结器——可以改善员工体验，也能帮助人们工作得更快，但它们正在迅速变成 table stakes，往往难以直接改变企业的损益表。相比之下，更高价值的做法，是在特定业务域中推动 end-to-end workflows 的自动化，例如理赔处理、客户服务、需求计划等。原文特别强调，这类部署“do more than accelerate work—they reshape it”。

但即使进入这些高价值场景，企业仍然常常难以证明影响。团队对“该衡量什么、如何归因”缺乏共识，结果是项目难以继续扩大，预算受到质疑，原本应该被强化的 business case 反而被不断重新审视。

因此，麦肯锡真正试图解决的问题不是“AI 值不值得做”，而是：企业如何用一套像资本投资一样严谨的方式，证明 AI 的价值，并据此决定哪些项目应该继续投入、哪些项目不应扩张。

二、原文的核心结构，是一套从技术表现到经营结果的五层框架

文章提出了一套five-layer framework，并明确说明其作用是：建立一条从模型表现到财务影响的、可审计的价值链条。这套框架不仅回答“看什么”，也回答“谁负责什么”。

原文给出的五层分别如下。

Layer 1：Financial impact

这是最顶层，也是企业最终关心的结果层。原文认为，这一层用于判断 AI 是否真正交付了企业级价值，典型指标包括：

● 收入提升，例如更高转化率或更快销售周期；

● 成本下降，例如单位服务的人力投入减少；

● 利润率改善；

● 总拥有成本，包括模型使用成本、云成本、供应商与许可费用等。

原文还特别强调，只有当收益与成本被放在同一本账里，ROI 才能经得住审视，并真正进入预算和战略讨论。

这一层对应的 owner，在原文中是 Finance / financial planning and analysis。

Layer 2：Strategic outcomes

这一层关注 AI 是否推动了业务单元真正关心的战略性结果。与财务结果相比，这些指标更接近日常经营，颗粒度更高，也更能反映 AI 是否在关键业务议题上产生作用。原文举到的例子包括：

● 客户满意度提升；

● 准时交付改善；

● 更少的非计划停机；

● 更高的首联解决率；

● 通过 AI 定向带来的销售提升或客户留存改善。

这一层的 owner，在原文中是 Business unit general manager / strategy lead。

Layer 3：Operational KPIs

这一层关注 AI 是否改善了“工作是如何被完成的”。原文把它视为业务的“日常脉搏”，典型指标包括：

● 周期时长是否缩短；

● 缺陷率、返工率是否下降；

● 服务流程中的放弃率是否下降；

● 首次解决率是否提升；

● 每单、每案或每次交易的成本是否下降。

这部分的关键不在于 AI 是否“被使用”，而在于业务流程是否因此变得更快、更顺、更有效。

这一层对应的 owner，在原文中是 Named process owner with E2E accountability。也就是说，这不是泛泛的协作责任，而是明确的端到端流程责任。

Layer 4：User adoption & engagement

这是原文特别强调的一层，也是许多 AI 部署中最容易被忽视的一层。作者指出，即便模型能力很强，如果用户没有在日常工作中持续使用并形成信任，价值就很难真正释放。原文甚至直接将 adoption 称为许多 AI 部署中缺失的一环。

这一层的典型指标包括：

● 日活用户数量及其在不同角色中的分布；

● 有资格使用 AI 支持的任务中，有多少真正使用了 AI；

● 功能采用深度；

● AI 输出被接受的比例，相对于被 override 或大幅修改的比例。

原文指出，当这些指标改善时，意味着 AI 正在进入真实工作流，而不是停留在偶发性实验状态；当这些指标滞后或在不同岗位间差异明显时，则往往暴露出信任问题、可用性问题或培训问题。

这一层对应的 owner，在原文中是 Product and frontline operations leaders。

Layer 5：Technical performance

最底层是技术表现层，也就是原文所说的“必要但不充分”的基础层。其功能是判断 AI 系统是否在安全、质量、成本和可靠性边界内稳定运行。原文给出的指标包括：

● 幻觉率与合规/安全风险；

● 单次交互的 token 成本与调用频率；

● 输出质量与可信度；

● 负载下的响应延迟；

● 随时间变化的性能漂移。

原文明确指出，这些技术指标非常关键，但如果不与 adoption 和 operational impact 一起观察，就无法单独证明业务价值。

这一层对应的 owner，在原文中是 Data science and engineering leaders。

三、原文的关键不只是“五层”，更在于把“五层”变成管理动作

如果只看到五层框架本身，很容易把这篇文章理解成一套“指标清单”。但实际上，原文更进一步讨论的是：如何让测量体系真正嵌入管理过程。

文章明确提出，一个测量框架是否有效，取决于支撑它的治理机制。即使指标设计合理，如果没有嵌入领导者的绩效审视、资源分配和决策过程，其实际价值仍然会大打折扣。

原文在治理层面给出三个非常具体的抓手。

1. 固定节奏的治理 cadence

作者建议建立清晰的monthly and quarterly cadence。其目的不是增加官僚程序，而是减少噪音，用固定节奏取代临时会议、零散汇报和口径冲突。

2. 统一的 evidence pack

原文提出，组织应建立一个shared evidence pack，作为跨五层讨论的单一事实来源。这个 evidence pack 需要同时汇总收益、总拥有成本、采用情况和技术健康度，从而让不同角色基于同一套证据进行决策。

3. 明确的 decision gates

作者进一步指出，组织需要设置清晰的 decision gates。换句话说，测量的意义不只是“知道进展”，而是把进展转化为是否继续投钱、是否扩大 rollout、是否增加工程资源的依据。文章给出的典型问题包括：

● 模型是否已经足够安全和稳定，可以面对真实用户；

● 用户是否真的在真实工作流中采用；

● 运营和财务影响是否已经达到足以支持规模化的程度。

这部分实际上非常关键，因为它说明了原文不是单纯地讨论“怎么衡量”，而是在讨论如何把衡量转化为投资决策与资源配置机制。

四、原文还给出了一条从试点到规模化的推进路径

为了把“五层框架”真正落地，文章还将 AI 项目推进概括为四个阶段，并强调不同阶段关注的重点不同。

1. Pilot phase

这一阶段的目标是验证技术可行性与实际可行性。团队需要在清晰的技术 KPI、安全与成本 guardrails 下，用一个范围收敛的 pilot 去验证原始价值假设是否成立，同时提前锁定后续的影响归因方式，例如 A/B 测试或分批 rollout。原文强调，这个阶段的目标不是规模化，而是获得可信的 proof。

2. MVP phase

这一阶段意味着 AI 开始进入真实工作流，但 exposure 仍然有限。与 pilot 不同，MVP 阶段的关键特征是：测量开始被直接嵌入工具本身，系统会自动追踪技术指标、用户行为和初步的流程影响；同时，人机协同的 safeguards、风险升级路径和日常监控责任也需要被明确下来。

3. Initial scaling

这是很多项目真正分出成败的阶段。原文指出，到了这一阶段，组织需要更严格地归因和评估经济性：采用不能只停留在早期拥护者，运营改善需要具有统计显著性，财务收益至少要能够覆盖总拥有成本。如果这时 ROI 仍不明显，组织应当选择 refinement 或 stop，而不是机械性地继续扩大投入。

4. Full scale

当一个部署真正进入 full scale，意味着 AI 已经从“项目”变成了“business as usual”。它被嵌入标准工作流、治理机制和预算周期之中，采用稳定，运营 KPI 持续改善，财务影响进入正式计划，风险与合规要求也被满足。到这一阶段，五层测量框架不再是专项工具，而成为日常绩效管理的一部分。

五、基于原文框架，如何从组织发展视角进一步理解这篇文章

如果从组织发展视角再往前看一步，这篇文章之所以重要，是因为它把 AI 问题从“技术应用”推进成了“组织能力建设”。至少有五点启示值得展开。

1. AI 价值兑现首先是责任设计问题

原文之所以反复强调 accountability，本质上是在提醒管理者：AI 若只有技术 owner，而没有结果 owner，就很难稳定地产生影响。特别是 Layer 2 和 Layer 3 的 owner 设计——业务负责人和端到端流程负责人——说明价值兑现必须进入正式经营责任体系。

2. 流程重构比工具部署更接近真实价值

原文对 horizontal tools 与 end-to-end workflow automation 的区分，实际上揭示了一个重要事实：很多 AI 项目的边际价值并不来自“多一个工具”，而来自“工作方式被重构”。这也是为什么 Layer 3 的 operational KPIs 在全文中处于关键位置。

3. 用户采用不是软问题，而是价值链中的硬节点

在很多组织里，adoption 常被视作培训或推广问题；但原文实际上把它放在通向业务结果的关键链路上。没有稳定 adoption，就不会有可观测的流程改善；没有流程改善，就不会有战略或财务结果。换句话说，用户信任与使用深度不是附属问题，而是价值兑现机制本身的一部分。

4. 组织能力的积累，取决于是否建立了跨层证据体系

原文中的 evidence pack 非常值得重视。它不仅是一个汇报工具，更是一种组织学习装置：它让技术表现、用户行为、流程变化和财务结果被放到同一套证据链条里，进而让组织逐步学会判断“什么样的 AI 真正有价值”。

5. AI 规模化的本质，是治理能力而不是推广能力

原文中关于 decision gates、阶段门槛和 refine-or-stop 的安排，说明规模化并不意味着全面铺开，而意味着在证据足够、责任清晰、治理到位的前提下扩大投入。从组织发展角度看，这种能力本质上不是市场推广能力，而是治理能力与资源配置能力。

六、对管理者而言，下一步更重要的是建立“从 proof 到 performance”的管理系统

文章结尾写得很清楚：下一阶段的 AI 竞争，不会由“谁实验得最多”决定，而会由“谁更能把实验转化为可衡量、可重复的绩效”决定。

如果把这一点转译成管理动作，企业至少需要回答以下几个问题：

● 我们是否已经把技术指标、采用指标、运营指标、战略指标和财务指标连成了一条链；

● 每一层指标是否都有明确 owner，而不是停留在模糊协同；

● 我们是否建立了固定 cadence，而不是靠项目热情推动；

● 我们是否拥有统一 evidence pack，而不是各部门各讲各的；

● 我们是否真的设置了“证明不了价值就不继续扩张”的 stage gates。

只有这些问题被回答清楚，AI 才更可能从一次次局部试点，变成稳定的经营改进机制。

结语

回顾麦肯锡原文，这篇文章最重要的价值，并不只是提出了一个五层框架，而是给出了一个更完整的管理命题：AI 价值必须被衡量，也必须被归因，更必须被纳入治理节奏与投资决策。

从这个意义上说，AI 的竞争已经不只是模型竞争、工具竞争或场景竞争，更是组织将 proof 转化为 performance 的能力竞争。谁能更早建立这套能力，谁就更有机会把 AI 从技术潜力变成真实、持续、可审计的经营结果。

原文信息

标题：

From promise to impact: How companies can measure—and realize—the full value of AI

来源：

https://www.mckinsey.com/capabilities/quantumblack/our-insights/from-promise-to-impact-how-companies-can-measure-and-realize-the-full-value-of-ai