过去两年里,几乎每家公司都在问同一个问题:我们到底有没有"用上 AI"。这个问题听起来简单,但很快就会暴露出一种尴尬——大家用的是同一个词,背后说的却是完全不同的事。一家公司说自己 AI 化了,可能只是部分员工开始用 AI 写邮件;另一家公司说自己 AI 化了,可能是核心业务流程已经被 Agent 接管。两者放在一起对比,几乎不在同一个语言体系里。
为了便于横向比较,可以把 L0 到 L5 的核心特征整理为一张总表,如表 1 所示。表中每一栏并不只是一个名称的展开,而是一句话回答"这家公司目前的 AI 状态是什么"。
L1 是大多数企业目前所处的状态。员工开始自发使用 AI,但企业本身并没有把 AI 当成一项正式能力来管理。最常见的画面是:产品经理用 AI 写 PRD 初稿,运营同学用 AI 起草活动文案,程序员用 AI 解释别人写的代码,市场部门用 AI 整理新闻摘要,HR 用 AI 生成面试问题清单,行政用 AI 写会议纪要。从单个员工的视角看,AI 极大地提升了个人效率。但从公司视角看,AI 还没有真正成为组织能力。
L1 的关键特征不是"用没用 AI",而是"AI 谁在用、用在哪里、用得怎么样,公司自己并不清楚"。AI 的使用是自下而上的,分散的,依赖个人偏好的,缺少统一标准的。换句话说,AI 在 L1 阶段几乎是不可治理的。
这种状态最大的问题不是效率,而是不可控。
L1 到 L2 的关键并不是采购更多工具,而是公司层面第一次明确地说:"我们要把 AI 用在某个具体的业务问题上,由某个具体的人负责,按某种具体的方式衡量结果。"这一步看似微小,实际上是从个人行为向组织行为的根本性转变。
L2 阶段,企业开始围绕明确的业务场景做 AI 试点。这里的"试点"不是把员工聚在一起开几次分享会,也不是临时拉一个微信群让大家集体使用某个工具,而是有问题、有人、有数据、有指标、有边界的正式项目。
一个真正意义上的 L2 试点,通常会回答以下几个问题:要解决的业务问题是什么、谁是项目负责人、能调动哪些内部数据、用什么指标衡量是否成功、在哪些环节必须保留人工复核、风险出现时如何处置。这些问题一旦被明确写下来,AI 就不再是"员工随手用一下"的对象,而是公司正式投入资源去验证的能力。
哪些场景适合作为 L2 的起点?通常需要满足几个特征:任务本身重复性高、输入输出相对明确、错误代价可控、可以做人工复核。比如客服工单的自动分类、销售线索的初步梳理、内部知识库的问答、长文档的摘要、代码注释的生成、运营数据的初步可视化解读,等等。这些场景共同的特征是:业务问题足够具体,AI 的效果可以被衡量,出错也能被及时发现。
需要强调的是,L2 的关键不是"用了 AI",而是"开始用工程化的方式验证 AI 是否能解决具体问题"。这一点决定了 L2 仍然属于试点阶段。试点的目的,是为了在投入更多资源之前,先看清楚 AI 在这家公司、这条业务、这个团队里,究竟能不能跑得通、跑得好、跑得稳。如果试点本身没有数据、没有指标、没有结论,那么不管做了多少次,都还是 L1 的延伸,谈不上 L2。
L3 是企业 AI 化的第一个真正意义上的工程门槛。在这一阶段,AI 不再是临时拉起来验证的项目,而是被正式嵌入到日常业务流程中,成为某项工作的稳定步骤。客服工单按规则进入 AI 分类、销售线索按规则交给 AI 做初筛、合同关键条款由 AI 抽取并交给法务复核、研发的代码评审中默认带有 AI 检查、月度经营分析中的数据解读由 AI 起草并由分析师审核——这些都属于 L3 的典型形态。
进入 L3 意味着 AI 第一次具备了"生产系统"的特征。它必须能稳定地承担工作量、能在出错时被识别并被修正、能与上游和下游的人工环节无缝衔接。这背后所要求的工程化能力,与 L1、L2 完全不在同一个量级。
首先,输入必须标准化。AI 的提示词不能再是员工各自手里的版本,而需要由专人维护,纳入版本管理,明确标注用途、边界和上下文要求。其次,输出必须可衡量。AI 的回答需要被结构化、可校验、可对比,方便业务系统继续处理。再次,必须有正式的评估体系。企业要清楚地知道 AI 当前的准确率、稳定性、覆盖率、错误模式以及典型失败案例。没有评估体系的 AI 流程,本质上仍然是凭直觉运行的试点,谈不上已经成熟。最后,必须有失败处理机制。AI 出错时,是返回人工处理、还是触发预设兜底逻辑、还是直接拒绝输出,必须事先定义。
L3 的局限同样需要被清楚地理解。在大多数 L3 企业里,AI 仍然停留在单个流程、单个部门、单类任务的辅助层面。AI 主要负责生成、归纳、判断这类信息处理工作,而不真正调用业务系统、修改记录、发出动作。这意味着 AI 仍然像一个非常聪明的助理,但它做不了"实际去办一件事"的工作。要让 AI 跨越这道边界,就需要进入 L4。
一个真正意义上的 L4 Agent 需要具备一组核心能力。它需要能够安全地访问公司的内部数据,包括 CRM、ERP、知识库、文件系统、业务数据库等;它需要能够调用各种工具,例如检索接口、邮件发送、报表生成、票据系统、第三方 API;它需要在受控权限下工作,知道自己可以做什么、不能做什么;它需要把每一步的输入、输出、调用、决策都记录下来,形成完整的审计日志;它需要被持续监控,方便人在异常时及时介入;它需要有清晰的人工兜底机制,确保关键决策始终能被回到人手里。
这些 Agent 看起来像数字员工,但与员工不同的是,它们的能力边界、权限、KPI 全部由企业自己显式定义。
L4 的关键在于"能执行",但并不等于"放任执行"。Agent 越接近真实业务系统,对治理的要求就越高。权限要细到具体接口、具体记录、具体操作;审计日志要可追溯到具体调用;监控要能识别异常调用与异常输出;人工兜底必须在每一类关键任务上都存在。这些机制看起来繁琐,但正是它们决定了 L4 能不能跑得稳。
需要强调的是,L4 仍然可能是一家"传统企业加上一套强 AI 系统"。换句话说,即便企业在客服、销售、研发等多个领域部署了相当成熟的 Agent,它在产品形态、组织结构、流程设计、数据接口上仍可能保留着传统公司的样子。AI 是被叠加上来的,而不是被作为前提设计的。这就是 L4 与 L5 的本质区别。
L5 是这套体系中最难达到的一个等级,也是最容易被误解的一个等级。许多公司喜欢用"AI 原生"来形容自己,但当我们试图把这个词拆开看,就会发现绝大多数所谓的 AI 原生公司,其实更接近 L3 或 L4。
L5 的本质不是 AI 工具的数量,而是企业在产品、组织、流程、数据和管理上,是不是从一开始就把 AI 当作前提来设计。这种前提会同时表现在五个层面。
如图 3 所示,把"传统企业 + AI"和"AI 原生企业"并列对比,会发现两者在五个维度上的设计前提几乎完全不同。这正是 L5 之所以是一次跃迁、而不是 L4 的延伸的原因——它要求企业在底层假设上重新设计自己。
到了 L5,AI 才真正成为企业的核心生产力,而不只是一个被叠加上的工具。组织的产能、产品的形态、业务的边界、增长的方式,都会随之被重新定义。
把 L0 到 L5 的六个等级串起来,整条演进路径上有五条关键分界线,每一条都对应一次本质性的转变,如图 2 所示。理解了这五条分界线,就理解了企业 AI 化的全部节奏。
要让企业真正实现 AI 化,终点并不是"让每个员工都用上 AI"。让每个员工都用 AI,只是 L1,是这条路真正开始的地方。终点是让 AI 成为一种可评估、可治理、可调用系统、可承担任务的组织能力;而 AI 原生企业则是在产品、组织、流程和数据的设计前提上,都围绕这种能力重新出发。
夜雨聆风