企业AI原生评级:从L0到L5

过去两年里，几乎每家公司都在问同一个问题：我们到底有没有"用上 AI"。这个问题听起来简单，但很快就会暴露出一种尴尬——大家用的是同一个词，背后说的却是完全不同的事。一家公司说自己 AI 化了，可能只是部分员工开始用 AI 写邮件；另一家公司说自己 AI 化了，可能是核心业务流程已经被 Agent 接管。两者放在一起对比，几乎不在同一个语言体系里。

一

总体分级

图 1　企业 AI 原生评级的 L0 → L5 演进路径

L0无 AI 化

L1个人工具型

L2场景试点型

L3流程生产型

L4Agent 协同型

L5AI 原生型

等级越高，台阶越陡，AI 与组织的耦合越深

为了便于横向比较，可以把 L0 到 L5 的核心特征整理为一张总表，如表 1 所示。表中每一栏并不只是一个名称的展开，而是一句话回答"这家公司目前的 AI 状态是什么"。

表 1　企业 AI 原生评级总体分级

等级

名称

核心特征

无 AI 化

AI 不在工具、流程、数据和管理制度中出现，企业仍依赖传统办公软件和人工经验。

个人工具型

员工自发使用 AI 提升个人效率，但企业并未把 AI 当作组织能力来管理，使用方式分散、不可控。

场景试点型

企业围绕明确业务场景做 AI 试点，有问题、有人、有数据、有指标、有边界，但仍属于验证阶段。

流程生产型

AI 嵌入正式业务流程，成为稳定工作步骤；具备提示词治理、评估体系、失败处理等工程化能力。

Agent 协同型

AI 能调用数据与系统、跨步骤执行任务，权限、审计、监控、人工兜底等机制齐备，像数字员工。

AI 原生型

产品、组织、流程、数据和管理方式围绕 AI 重新设计；拿掉 AI，公司基本不成立。

来源：本文整理

二

L1：个人工具型

L1 的本质：个人提效不等于组织能力

L1 是大多数企业目前所处的状态。员工开始自发使用 AI，但企业本身并没有把 AI 当成一项正式能力来管理。最常见的画面是：产品经理用 AI 写 PRD 初稿，运营同学用 AI 起草活动文案，程序员用 AI 解释别人写的代码，市场部门用 AI 整理新闻摘要，HR 用 AI 生成面试问题清单，行政用 AI 写会议纪要。从单个员工的视角看，AI 极大地提升了个人效率。但从公司视角看，AI 还没有真正成为组织能力。

L1 的关键特征不是"用没用 AI"，而是"AI 谁在用、用在哪里、用得怎么样，公司自己并不清楚"。AI 的使用是自下而上的，分散的，依赖个人偏好的，缺少统一标准的。换句话说，AI 在 L1 阶段几乎是不可治理的。

这种状态最大的问题不是效率，而是不可控。

① 数据风险

员工可能不假思索地把客户名单、合同条款、未发布的财务数据贴进消费级 AI 工具，造成无法挽回的泄漏。

② 质量风险

同一份对外材料，不同员工借助 AI 生成的结果质量参差不齐，有人写得很好，有人则把模型的幻觉直接当成事实。

③ 经验风险

员工各自摸索出的"好用提示词"留在个人手里，无法在团队中复用；当一个人离开，这部分组织资产就跟着走了。

④ 价值衡量风险

管理层无法回答一个最基本的问题："我们花了那么多时间用 AI，到底带来了多少业务收益？"

L1 到 L2 的关键并不是采购更多工具，而是公司层面第一次明确地说："我们要把 AI 用在某个具体的业务问题上，由某个具体的人负责，按某种具体的方式衡量结果。"这一步看似微小，实际上是从个人行为向组织行为的根本性转变。

三

L2：场景试点型

L2 的关键变化：AI 从个人工具变成正式试点

L2 阶段，企业开始围绕明确的业务场景做 AI 试点。这里的"试点"不是把员工聚在一起开几次分享会，也不是临时拉一个微信群让大家集体使用某个工具，而是有问题、有人、有数据、有指标、有边界的正式项目。

一个真正意义上的 L2 试点，通常会回答以下几个问题：要解决的业务问题是什么、谁是项目负责人、能调动哪些内部数据、用什么指标衡量是否成功、在哪些环节必须保留人工复核、风险出现时如何处置。这些问题一旦被明确写下来，AI 就不再是"员工随手用一下"的对象，而是公司正式投入资源去验证的能力。

哪些场景适合作为 L2 的起点？通常需要满足几个特征：任务本身重复性高、输入输出相对明确、错误代价可控、可以做人工复核。比如客服工单的自动分类、销售线索的初步梳理、内部知识库的问答、长文档的摘要、代码注释的生成、运营数据的初步可视化解读，等等。这些场景共同的特征是：业务问题足够具体，AI 的效果可以被衡量，出错也能被及时发现。

需要强调的是，L2 的关键不是"用了 AI"，而是"开始用工程化的方式验证 AI 是否能解决具体问题"。这一点决定了 L2 仍然属于试点阶段。试点的目的，是为了在投入更多资源之前，先看清楚 AI 在这家公司、这条业务、这个团队里，究竟能不能跑得通、跑得好、跑得稳。如果试点本身没有数据、没有指标、没有结论，那么不管做了多少次，都还是 L1 的延伸，谈不上 L2。

四

L3：流程生产型

L3 的核心门槛：AI 必须进入生产流程

L3 是企业 AI 化的第一个真正意义上的工程门槛。在这一阶段，AI 不再是临时拉起来验证的项目，而是被正式嵌入到日常业务流程中，成为某项工作的稳定步骤。客服工单按规则进入 AI 分类、销售线索按规则交给 AI 做初筛、合同关键条款由 AI 抽取并交给法务复核、研发的代码评审中默认带有 AI 检查、月度经营分析中的数据解读由 AI 起草并由分析师审核——这些都属于 L3 的典型形态。

进入 L3 意味着 AI 第一次具备了"生产系统"的特征。它必须能稳定地承担工作量、能在出错时被识别并被修正、能与上游和下游的人工环节无缝衔接。这背后所要求的工程化能力，与 L1、L2 完全不在同一个量级。

首先，输入必须标准化。AI 的提示词不能再是员工各自手里的版本，而需要由专人维护，纳入版本管理，明确标注用途、边界和上下文要求。其次，输出必须可衡量。AI 的回答需要被结构化、可校验、可对比，方便业务系统继续处理。再次，必须有正式的评估体系。企业要清楚地知道 AI 当前的准确率、稳定性、覆盖率、错误模式以及典型失败案例。没有评估体系的 AI 流程，本质上仍然是凭直觉运行的试点，谈不上已经成熟。最后，必须有失败处理机制。AI 出错时，是返回人工处理、还是触发预设兜底逻辑、还是直接拒绝输出，必须事先定义。

L3 的局限同样需要被清楚地理解。在大多数 L3 企业里，AI 仍然停留在单个流程、单个部门、单类任务的辅助层面。AI 主要负责生成、归纳、判断这类信息处理工作，而不真正调用业务系统、修改记录、发出动作。这意味着 AI 仍然像一个非常聪明的助理，但它做不了"实际去办一件事"的工作。要让 AI 跨越这道边界，就需要进入 L4。

五

L4：Agent员工型

L4 的关键能力：AI 开始调用系统并执行任务

如果说 L3 的 AI 是一个会写、会算、会读的实习生，那么 L4 的 AI 就开始变成企业的AI员工。Agent 不再仅仅生成文字，而是能够调用企业内部的工具与系统、读取真实业务数据、跨多个步骤完成任务、最终把结果落到具体的业务系统里。这是企业 AI 化路径上一次重要的角色升级——

AI 从"说"过渡到"做"。

一个真正意义上的 L4 Agent 需要具备一组核心能力。它需要能够安全地访问公司的内部数据，包括 CRM、ERP、知识库、文件系统、业务数据库等；它需要能够调用各种工具，例如检索接口、邮件发送、报表生成、票据系统、第三方 API；它需要在受控权限下工作，知道自己可以做什么、不能做什么；它需要把每一步的输入、输出、调用、决策都记录下来，形成完整的审计日志；它需要被持续监控，方便人在异常时及时介入；它需要有清晰的人工兜底机制，确保关键决策始终能被回到人手里。

L4 Agent 典型形态

销售 Agent读取 CRM、整理客户背景、起草沟通话术、跟踪线索状态

客服 Agent接管常见问题、调用知识库、必要时升级到人工

研发 Agent代码评审、生成测试用例、起草上线说明、提交工单

财务 Agent发票分类、对账初核、月结摘要

经营分析 Agent跨系统读数据、生成业务诊断、回答经营层临时问题

这些 Agent 看起来像数字员工，但与员工不同的是，它们的能力边界、权限、KPI 全部由企业自己显式定义。

L4 的关键在于"能执行"，但并不等于"放任执行"。Agent 越接近真实业务系统，对治理的要求就越高。权限要细到具体接口、具体记录、具体操作；审计日志要可追溯到具体调用；监控要能识别异常调用与异常输出；人工兜底必须在每一类关键任务上都存在。这些机制看起来繁琐，但正是它们决定了 L4 能不能跑得稳。

需要强调的是，L4 仍然可能是一家"传统企业加上一套强 AI 系统"。换句话说，即便企业在客服、销售、研发等多个领域部署了相当成熟的 Agent，它在产品形态、组织结构、流程设计、数据接口上仍可能保留着传统公司的样子。AI 是被叠加上来的，而不是被作为前提设计的。这就是 L4 与 L5 的本质区别。

六

L5：AI 原生型

L5 的本质：企业围绕 AI 重新设计

L5 是这套体系中最难达到的一个等级，也是最容易被误解的一个等级。许多公司喜欢用"AI 原生"来形容自己，但当我们试图把这个词拆开看，就会发现绝大多数所谓的 AI 原生公司，其实更接近 L3 或 L4。

判断 L5 的朴素标准

如果把 AI 从这家公司里拿掉，它的状态是"效率下降"，还是"基本不成立"？前者仍是传统公司加 AI；后者才有资格被称为 AI 原生。

L5 的本质不是 AI 工具的数量，而是企业在产品、组织、流程、数据和管理上，是不是从一开始就把 AI 当作前提来设计。这种前提会同时表现在五个层面。

产品 AI 原生

产品的核心价值依赖 AI 才能成立。它不是给原来的产品加一个 AI 助手，而是产品本身就只能在 AI 的能力之上存在。脱离 AI，产品的核心体验、核心场景、核心商业模式将无法继续。

组织 AI 原生

人在组织中的角色发生了根本性变化。员工不再以执行者为主，而更多承担目标设定、流程设计、结果审核与 Agent 编排的工作。组织的输出能力不再线性依赖于员工人数，而是依赖于"人 + Agent"协同后的整体产能。

流程 AI 原生

流程的默认起点是 AI，而不是人。标准化、可重复、规则清晰的任务，默认由 AI 先处理；人只在关键节点、复杂判断、异常情况下介入。这与传统流程的逻辑刚好相反——传统流程默认由人完成，AI 只是被拿来辅助。

数据 AI 原生

数据基础设施从一开始就是为 AI 调用而设计的。数据结构、字段含义、权限模型、接口规范、日志体系，统统服务于"AI 可以理解、调用、写入、形成反馈闭环"的目标。数据不只是给报表看的，更是给 Agent 用的。

管理 AI 原生

管理对象从"人"扩展为"人、Agent、流程、权限、质量、成本和错误"。管理者要看的不只是员工的产出，还包括各类 Agent 的工作状态、错误率、资源消耗、对业务的实际贡献，以及人和 Agent 之间的协同效率。

图 3　传统企业 + AI 与 AI 原生企业的结构性差异

传统企业 + AI

产品→加一个 AI 助手组织→员工 + AI 工具流程→人做事，AI 辅助数据→给报表看管理→管理人

AI 原生企业

产品→核心价值依赖 AI组织→人 + Agent 协同流程→AI 做事，人复核数据→给 Agent 用管理→管理人 + Agent

两类企业的 AI 不在同一个层面上工作

如图 3 所示，把"传统企业 + AI"和"AI 原生企业"并列对比，会发现两者在五个维度上的设计前提几乎完全不同。这正是 L5 之所以是一次跃迁、而不是 L4 的延伸的原因——它要求企业在底层假设上重新设计自己。

到了 L5，AI 才真正成为企业的核心生产力，而不只是一个被叠加上的工具。组织的产能、产品的形态、业务的边界、增长的方式，都会随之被重新定义。

七

企业 AI 化分级的关键分界线

把 L0 到 L5 的六个等级串起来，整条演进路径上有五条关键分界线，每一条都对应一次本质性的转变，如图 2 所示。理解了这五条分界线，就理解了企业 AI 化的全部节奏。

图 2　L0 到 L5 的五条关键分界线

分界线 1

L0 → L1　AI 进入员工的工作方式

分界线 2

L1 → L2　AI 从个人行为变成组织行为

分界线 3

L2 → L3　AI 从试点进入生产流程

分界线 4

L3 → L4　AI 从"说"变成"做"

分界线 5

L4 → L5　AI 从叠加变成前提

每一次跃迁的本质，是 AI 在企业中扮演的角色发生了不可逆的变化

九

总结

L0不用 AI——AI 还没进入这家公司

L1员工自己用 AI——AI 进入了员工的桌面，但还没进入公司

L2公司拿 AI 做正式试点——AI 第一次被作为公司课题对待

L3AI 进入正式业务流程——AI 成为某项工作的稳定步骤

L4AI 能调用系统、像数字员工一样执行任务——AI 从"说"变成了"做"

L5公司围绕 AI 重新设计——AI 不再是工具，而是企业的核心生产力

要让企业真正实现 AI 化，终点并不是"让每个员工都用上 AI"。让每个员工都用 AI，只是 L1，是这条路真正开始的地方。终点是让 AI 成为一种可评估、可治理、可调用系统、可承担任务的组织能力；而 AI 原生企业则是在产品、组织、流程和数据的设计前提上，都围绕这种能力重新出发。

L0 是起点，L5 是少数公司才会真正抵达的远方。但理解 L0 到 L5 的真正价值，并不是为了给企业贴一个等级标签，而是为了让管理者随时能回答两个问题：我们现在站在哪里，下一步要跨过的那条线又在哪里。