从衡量到兑现:AI价值如何真正走向经营结果——麦肯锡五层框架的观察与组织发展启示
摘要
从组织发展视角看,这篇文章的启发也很明确:AI 价值衡量表面上是指标设计问题,实质上是组织管理问题;而 AI 价值兑现,最终取决于企业是否具备把技术表现、用户采用、流程改善、战略结果和财务结果连接起来的能力。
一、麦肯锡原文真正要解决的,不是“AI 重不重要”,而是“AI 如何产生可验证的影响”
原文指出,不少企业虽然已经在一个或多个业务职能中使用生成式 AI,也开始尝试 agentic AI,但相当一部分组织仍然没有看到 enterprise-wide EBIT impact。在作者看来,AI 活动与 AI 影响之间的鸿沟,非但没有缩小,反而仍在扩大。
二、原文的核心结构,是一套从技术表现到经营结果的五层框架
原文给出的五层分别如下。
Layer 1:Financial impact
这是最顶层,也是企业最终关心的结果层。原文认为,这一层用于判断 AI 是否真正交付了企业级价值,典型指标包括:
● 收入提升,例如更高转化率或更快销售周期;
● 成本下降,例如单位服务的人力投入减少;
● 利润率改善;
● 总拥有成本,包括模型使用成本、云成本、供应商与许可费用等。
原文还特别强调,只有当收益与成本被放在同一本账里,ROI 才能经得住审视,并真正进入预算和战略讨论。
这一层对应的 owner,在原文中是 Finance / financial planning and analysis。
Layer 2:Strategic outcomes
这一层关注 AI 是否推动了业务单元真正关心的战略性结果。与财务结果相比,这些指标更接近日常经营,颗粒度更高,也更能反映 AI 是否在关键业务议题上产生作用。原文举到的例子包括:
● 客户满意度提升;
● 准时交付改善;
● 更少的非计划停机;
● 更高的首联解决率;
● 通过 AI 定向带来的销售提升或客户留存改善。
这一层的 owner,在原文中是 Business unit general manager / strategy lead。
Layer 3:Operational KPIs
● 周期时长是否缩短;
● 缺陷率、返工率是否下降;
● 服务流程中的放弃率是否下降;
● 首次解决率是否提升;
● 每单、每案或每次交易的成本是否下降。
Layer 4:User adoption & engagement
这是原文特别强调的一层,也是许多 AI 部署中最容易被忽视的一层。作者指出,即便模型能力很强,如果用户没有在日常工作中持续使用并形成信任,价值就很难真正释放。原文甚至直接将 adoption 称为许多 AI 部署中缺失的一环。
这一层的典型指标包括:
● 日活用户数量及其在不同角色中的分布;
● 有资格使用 AI 支持的任务中,有多少真正使用了 AI;
● 功能采用深度;
● AI 输出被接受的比例,相对于被 override 或大幅修改的比例。
原文指出,当这些指标改善时,意味着 AI 正在进入真实工作流,而不是停留在偶发性实验状态;当这些指标滞后或在不同岗位间差异明显时,则往往暴露出信任问题、可用性问题或培训问题。
这一层对应的 owner,在原文中是 Product and frontline operations leaders。
Layer 5:Technical performance
● 幻觉率与合规/安全风险;
● 单次交互的 token 成本与调用频率;
● 输出质量与可信度;
● 负载下的响应延迟;
● 随时间变化的性能漂移。
原文明确指出,这些技术指标非常关键,但如果不与 adoption 和 operational impact 一起观察,就无法单独证明业务价值。
这一层对应的 owner,在原文中是 Data science and engineering leaders。
三、原文的关键不只是“五层”,更在于把“五层”变成管理动作
文章明确提出,一个测量框架是否有效,取决于支撑它的治理机制。即使指标设计合理,如果没有嵌入领导者的绩效审视、资源分配和决策过程,其实际价值仍然会大打折扣。
原文在治理层面给出三个非常具体的抓手。
1. 固定节奏的治理 cadence
作者建议建立清晰的monthly and quarterly cadence。其目的不是增加官僚程序,而是减少噪音,用固定节奏取代临时会议、零散汇报和口径冲突。
2. 统一的 evidence pack
原文提出,组织应建立一个shared evidence pack,作为跨五层讨论的单一事实来源。这个 evidence pack 需要同时汇总收益、总拥有成本、采用情况和技术健康度,从而让不同角色基于同一套证据进行决策。
3. 明确的 decision gates
● 模型是否已经足够安全和稳定,可以面对真实用户;
● 用户是否真的在真实工作流中采用;
● 运营和财务影响是否已经达到足以支持规模化的程度。
四、原文还给出了一条从试点到规模化的推进路径
1. Pilot phase
这一阶段的目标是验证技术可行性与实际可行性。团队需要在清晰的技术 KPI、安全与成本 guardrails 下,用一个范围收敛的 pilot 去验证原始价值假设是否成立,同时提前锁定后续的影响归因方式,例如 A/B 测试或分批 rollout。原文强调,这个阶段的目标不是规模化,而是获得可信的 proof。
2. MVP phase
这一阶段意味着 AI 开始进入真实工作流,但 exposure 仍然有限。与 pilot 不同,MVP 阶段的关键特征是:测量开始被直接嵌入工具本身,系统会自动追踪技术指标、用户行为和初步的流程影响;同时,人机协同的 safeguards、风险升级路径和日常监控责任也需要被明确下来。
3. Initial scaling
这是很多项目真正分出成败的阶段。原文指出,到了这一阶段,组织需要更严格地归因和评估经济性:采用不能只停留在早期拥护者,运营改善需要具有统计显著性,财务收益至少要能够覆盖总拥有成本。如果这时 ROI 仍不明显,组织应当选择 refinement 或 stop,而不是机械性地继续扩大投入。
4. Full scale
五、基于原文框架,如何从组织发展视角进一步理解这篇文章
如果从组织发展视角再往前看一步,这篇文章之所以重要,是因为它把 AI 问题从“技术应用”推进成了“组织能力建设”。至少有五点启示值得展开。
1. AI 价值兑现首先是责任设计问题
原文之所以反复强调 accountability,本质上是在提醒管理者:AI 若只有技术 owner,而没有结果 owner,就很难稳定地产生影响。特别是 Layer 2 和 Layer 3 的 owner 设计——业务负责人和端到端流程负责人——说明价值兑现必须进入正式经营责任体系。
2. 流程重构比工具部署更接近真实价值
3. 用户采用不是软问题,而是价值链中的硬节点
在很多组织里,adoption 常被视作培训或推广问题;但原文实际上把它放在通向业务结果的关键链路上。没有稳定 adoption,就不会有可观测的流程改善;没有流程改善,就不会有战略或财务结果。换句话说,用户信任与使用深度不是附属问题,而是价值兑现机制本身的一部分。
4. 组织能力的积累,取决于是否建立了跨层证据体系
5. AI 规模化的本质,是治理能力而不是推广能力
原文中关于 decision gates、阶段门槛和 refine-or-stop 的安排,说明规模化并不意味着全面铺开,而意味着在证据足够、责任清晰、治理到位的前提下扩大投入。从组织发展角度看,这种能力本质上不是市场推广能力,而是治理能力与资源配置能力。
六、对管理者而言,下一步更重要的是建立“从 proof 到 performance”的管理系统
如果把这一点转译成管理动作,企业至少需要回答以下几个问题:
● 我们是否已经把技术指标、采用指标、运营指标、战略指标和财务指标连成了一条链;
● 每一层指标是否都有明确 owner,而不是停留在模糊协同;
● 我们是否建立了固定 cadence,而不是靠项目热情推动;
● 我们是否拥有统一 evidence pack,而不是各部门各讲各的;
● 我们是否真的设置了“证明不了价值就不继续扩张”的 stage gates。
只有这些问题被回答清楚,AI 才更可能从一次次局部试点,变成稳定的经营改进机制。
结语
回顾麦肯锡原文,这篇文章最重要的价值,并不只是提出了一个五层框架,而是给出了一个更完整的管理命题:AI 价值必须被衡量,也必须被归因,更必须被纳入治理节奏与投资决策。
从这个意义上说,AI 的竞争已经不只是模型竞争、工具竞争或场景竞争,更是组织将 proof 转化为 performance 的能力竞争。谁能更早建立这套能力,谁就更有机会把 AI 从技术潜力变成真实、持续、可审计的经营结果。
原文信息
标题:
From promise to impact: How companies can measure—and realize—the full value of AI
来源:
https://www.mckinsey.com/capabilities/quantumblack/our-insights/from-promise-to-impact-how-companies-can-measure-and-realize-the-full-value-of-ai
夜雨聆风