软件公司的AI改造分级L1-L4:从个人工具到经营重构(含真实案例拆解)-夜雨聆风

软件公司的AI改造分级L1-L4:从个人工具到经营重构(含真实案例拆解)

SaaS创业路线图系列 | 第245篇

【近期本号将在北京、上海举办实战研讨课，每场10家软件企业一起探讨如何将自己从L1、L2提升到L3，并在将来实现L4。欢迎了解详情：】

—==正文==—

上周我把参加腾讯SaaS改造闭门会的14家企业做了“AI改造L1-L4”分级，有几个朋友留言或私信我问分级标准是什么？

判断一家软件公司的AI改造程度要看一个核心问题：

AI在公司的价值交付中，承担了多重的责任？

软件公司的价值交付链条，大致包括：市场获客、销售转化、需求定义、产品设计、研发测试、部署交付、客户成功、续费扩容、经营管理。

我们可以把软件公司的AI组织改造分为四级：

L1，个人提效。L2，流程嵌入。L3，作业承接。L4，经营重构。

我虽然做过十多年研发，但最近8年的角色是研究软件创业和企业经营改进。我这套不是技术分级，而是经营分级。

本文将陈述这套分级方法、介绍每个级别的具体场景，并以慧算账为例为大家介绍从L2（去年的慧算账）、到L3（今年的慧算账）再到L4的差异。（慧算账是我目前见过国内SaaS公司里AI改造级别最高且上规模的公司：L3.5）。

一、软件公司AI改造L1-L4

等级	名称	AI的角色	核心定义	判断标准	关键词
L1	个人提效	AI是个人工具	员工用AI提升个人产出，但公司流程、岗位职责和组织结构基本不变	拿掉AI，原流程仍可照常运行，只是个人效率下降	个人更快
L2	流程嵌入	AI是流程节点	AI进入正式业务流程中的局部节点，但流程仍由人主导	AI已进入研发、销售、客服、交付、客户成功等流程，但人仍是流程发动机	流程更快
L3	作业承接	AI是作业系统	AI在限定场景内，承接一段可定义、可执行、可校验的作业闭环	AI能从输入、判断、执行到校验完成主要作业链条，人负责规则、审核、异常和优化	作业闭环
L4	经营重构	AI是经营系统	公司围绕稳定的AI作业闭环，重构交付方式、收费方式、组织结构和经营责任	不只是作业变了，而是收入模式、成本结构、交付组织、客户承诺一起变化	重构经营

简版如下：

等级	名称	一句话
L1	个人提效	员工用AI，提升个人效率
L2	流程嵌入	流程嵌AI，提升局部效率
L3	作业承接	AI承接作业闭环，改变交付方式
L4	经营重构	公司围绕AI作业闭环，重构经营系统

L1：个人提效

L1是最容易开始的一层。

员工开始使用AI工具，提高个人产出。研发写代码更快，产品写PRD更快，市场写内容更快，销售做客户调研更快。

但公司没有整体改变。所以L1不能被高估。

一家软件公司如果只是全员配了AI工具，只能说明它开始AI化，不能说明它已完成组织改造。

场景：研发AI coding

工程师用Claude Code、Codex、Cursor等工具写代码、改Bug、生成单元测试。

效率可能提升明显。但需求仍然由产品经理提出，架构仍然由人设计，测试仍然由测试团队把关，发布仍然走原来的流程。

L1的价值是普及AI意识。但局限是，它不会自动带来组织结果。

L1只解决了某些瓶颈问题，但对组织中的其它瓶颈熟视无睹。

很多公司会发现：员工效率都提高了，但公司研发效率、最终业绩都没有明显提高。原因就在这里。

个人提效不是组织提效。

L2：流程嵌入

L2比L1前进了一步，AI不再只是员工自用工具，而是进入公司的正式流程，成为流程中的一个节点。

这时AI开始进入公司的作业系统，但流程主导权仍在人手里。

人提出任务，人判断结果，人决定下一步；而AI则增强某个节点。

场景一：客服智能工单

客户提交问题后，AI先做分类、摘要、推荐答案，再由客服人员确认、修改、发送。

这个流程有价值。它降低了客服查资料的时间，也提升了响应速度。

但客服人员仍然是流程发动机。AI没有独立完成问题识别、知识调用、方案执行、结果校验和异常转人工的闭环。

这是L2。

场景二：研发流程中的AI审查

代码提交后，AI自动做代码审查，提示潜在Bug、规范问题、安全风险，并生成部分测试用例。

这会提升研发效率。但需求拆解、技术设计、测试策略、发布判断仍然由人主导。

AI进入了研发流程。但研发流程没有围绕AI重写。

这也是L2。

L2的价值是让AI进入正式流程。L2的局限是AI仍然只是节点，不承担完整作业责任。

很多软件公司现在正处在L2。这是很大进步，但还不是作业闭环重构。

L3：作业承接

L3是重要分水岭。这次腾讯活动上的14家企业，只有3家达到了这个段位。

从L3开始，AI不再只是流程节点，而是在限定场景内承接一段完整作业闭环。

这个闭环必须满足几个条件：有清楚的输入、明确的业务判断、有结果生成、有结果校验，也有异常处理或人工兜底。

L3不等于无人化。更准确地说：

AI成为主要作业引擎，人转向规则设计、审核、异常处理和系统优化。

所以，L3的关键是“有没有可控作业系统”。

至于完全脱离人的作业系统，我觉得它既不现实，也不必要。

不现实：目前实现难度过大；

不必要：完全不需要人的产品，如果还有海量客群，就正好在“大厂”的典型射程内，创业公司即便做出来也没有意义。

L3场景：AI承接客户交付配置

一家企业软件公司，客户提出一个标准范围内的配置需求。

AI读取客户需求、匹配产品能力、生成配置方案、调用系统完成配置、生成验收材料，并根据规则进行结果校验。

交付顾问不再逐项操作，而是审核配置结果，处理异常需求，维护规则库和模板。

因为AI承接的是一段完整交付作业，而不只是帮顾问写方案。

以前人是执行者。现在人是监督者、训练者、异常处理者和规则维护者。

L2是AI插进流程。L3是流程围绕AI重写。

这是最关键的差异。

L4：经营重构

L4必须建立在L3之上。

推出AI产品，不等于L4。

改变收费方式，也不等于L4。

真正的L4，是公司围绕稳定的AI作业闭环，重构交付方式、收费方式、组织结构和经营责任。

L4看的是经营系统变化。

场景一：从卖软件到卖结果

一家行业销售软件公司，过去按账号收费。

现在它不再只提供CRM工具，而是用AI作业系统帮助客户完成线索发现、客户画像、话术生成、触达节奏、商机推进和结果归因。

公司不再只承诺“提供系统”，而是开始承诺“有效商机数量”或“销售动作完成质量”。

收费方式也从账号费，部分转向按线索、按商机、按成交贡献收费。

这才接近L4。

前提是：背后必须有稳定的AI作业闭环。

场景二：从标准交付到AI经营单元

一家行业软件公司，围绕某个高频业务场景建立AI作业系统。

公司内部不再按传统研发、产品、交付、客户成功切割，而是组建小型经营单元：有业务负责人、有业务工程师、有客户成功和异常处理团队，也有明确毛利目标和客户结果目标。

这时AI不只是产品能力，而是经营单元的基础设施。

公司不再只考核功能上线，而是考核业务结果、交付毛利、客户续费和扩容。

这就是L4。

L3是作业闭环。L4是重构经营。

三、各级之间的依赖关系

从L1到L4这四层之间有递进关系：

演进	本质变化
L1 → L2	从个人使用，到流程采用
L2 → L3	从流程节点，到作业闭环
L3 → L4	从作业变化，到重构经营

最容易跳空的是L4。

很多公司先想新收费方式，先想AI产品包装，先想结果定价。客户会很快发现，所谓AI交付，最后还是人工顾问在背后硬扛。

如果没有L3级AI作业闭环支撑，L4只是商业叙事。

—— 这条是我在写这篇文章时才想到的。过去8年我都在讲商业SaaS，但为何能实现按业务量收费、乃至抽佣的SaaS公司凤毛麟角？

因为定价依赖产品价值、依赖公司的组织能力。身体在上一个时代，脑子提前进入下一个时代，也解决不了软件公司经营效率低下的难题。

只有从L1到L4一个个阶段做扎实，SaaS公司才真正完成了更新换代。

真正的顺序应该是：

先让AI稳定承接作业，再围绕作业闭环重构经营。

四、从L2到L3的成功案例：慧算账

这里我有个调研的具体案例——慧算账。

我每年都与慧算账创始人及CEO张述刚进行深度交流。2025年慧算账推出了“自动记账Agent”，我也写了一篇文章《改变软件范式的慧算账：不是生产力工具，而是生产力本身》详细分析。

自动记账Agent还只是L2 —— AI嵌入了工作流程。

今年我再拜访张述刚，加上在腾讯活动上听慧算账研发总经理对AI产品和产研组织改造的介绍，我看到他们已经进入L3阶段：

把 AI 嵌入“会计作业系统”。一方面通过龙虾给代记账会计团队配 AI 助理，已覆盖几百个会计，并计划扩展到销售；
另一方面用 AI 工坊（相当于财税场景的Coze）承接定制化需求，沉淀五大 Skill、SOP、行业模板。

如果说 2025 年的自动记账 Agent，证明的是 AI 可以进入会计流程中的关键节点；那么 2026 年我看到的慧算账，已经不只是“自动记一笔账”，而是在把 AI 放进一整段会计作业系统里。

这个变化先从基础事实看。

慧算账在过去 11 年沉淀了完整的财税 SaaS 和代账服务流程。过去的自动化已经很深：从发票、单据识别，到归类、财务核算、申报，很多标准场景已经自动化。在腾讯活动的现场分享中提到，他们每月大约处理 800 万张票据识别和分类，业务判断准确率约 95%；线上有 3000 多台 RPA 24 小时运行；约 90% 客户在标准场景下基本不需要会计干预。

但这恰恰暴露出新的瓶颈：标准化场景已经接近自动化天花板，真正消耗代记账会计时间的是非标场景。慧算账提到，一个会计每月服务 200-300 户已经接近瓶颈，而约 30% 的非标场景会消耗会计约 90% 的时间。L3 的机会，就出现在这里。

慧算账今年的做法不是推倒重建一套 AI 原生财税系统，而是提出“双轮战略”：第一轮，把 AI 嵌入原有 11 年系统，让一个会计从每月服务 200-300 户继续突破到 400 户甚至 450 户；第二轮，建设 AI 工坊，面向大客户和定制化需求下场交付，把非标需求沉淀成 SOP、Skill 和行业模板。

这就是 L3 与 L2 的差别。

L2 是 AI 嵌入流程，帮助人完成某个节点。自动记账 Agent 属于这一类。它已经很有价值：早期 OCR 加小模型只能做到约 70% 采纳率，没有实际生产意义；后来结合 DeepSeek 等 LLM，并基于约 100 万家企业 2 年真实记录、约 2 亿条记账数据训练后，采纳率提升到约 94%。系统能自动完成大约 90% 的记账工作，人主要处理异常、沟通和确认。（详见上面提到的本号去年文章）

但 L3 不止是“更准的节点”。L3 要让 AI 承接一段作业闭环。

慧算账今年展示的闭环已经不止记账本身。他们把龙虾/openClaw 与企业微信侧边栏结合，给每个会计配置一个“龙虾 AI 助理”。上个月已经上线约 500 个龙虾，基本覆盖会计团队；下个月还计划覆盖销售端数百人。

此外，我感到特别有价值的启示是 —— 它没有改变用户原来的工作入口。

客户仍然在企业微信里甩发票、发文件、提需求，会计仍然在熟悉的服务场景里接活，只是企微侧边栏多了一个能调用系统能力、理解上下文、串联流程的 AI 助理。

现场展示的场景也不是简单问答，而是一段段业务动作：站内发票数据自然语言查询，站外社保政策智能搜索……尤其是调账、社保、工资申报这些场景，都不是“生成一段文字”就结束，而是要识别输入、判断业务逻辑、补录关键信息、调用系统能力、生成结果，并在必要时进入人工审核。

同时，慧算账已经开始把非标交付沉淀成可复制能力。AI 工坊抽取了五类核心 skill：Web skill 、Service App skill 、文件处理 skill 、电子表格 skill 、BI 分析 skill …… 再加上标准 SOP、行业模板、子模板和客户参数模板，逐步把定制化交付变成可复用的作业能力。

这背后的经营含义很大。慧算账不是把 AI 当成一个“会计 Copilot”，而是在把会计作业拆成输入、判断、执行、校验、异常处理几段，然后用 AI 工坊、Skill、SOP、模板和既有系统 API 重新编排。

它既没有放弃原有 SaaS 底座，也没有迷信一个通用大模型可以自动完成所有工作，而是把多年积累的流程、数据、规则和客户现场经验，转化成 AI 可调用、可治理、可复用的作业系统。

财税又是一个典型的零容错场景，这使慧算账的实践更值得我们参考。

腾讯云活动现场有同行问：财务场景遇到大模型幻觉怎么办？慧算账的回答是：不能让大模型自己决定最终调什么接口，也不能把核心业务完全交给自由推理。核心业务要封装进智能体平台，SOP 和 Skill 要事先编排好，调用链要确定下来；执行时如果调用链偏离预期，就要告警；整个链路要能追踪、能回滚，否则一旦智能体执行了很多业务却无法撤回，就会变成工程和财务事故。

所以，慧算账进入 L3 的标志是它已经形成了“可控作业系统”：

第一，有真实作业入口。会计和客户仍在企业微信、客户群、票据、文件、表格、申报流程中工作，AI 没有悬浮在业务之外。

第二，有可被 AI 承接的完整作业段。发票查询、社保办理、工资申报、调账方案、大客户数据处理，都不是单点内容生成，而是从输入到结果的业务闭环。

第三，有可复用的能力沉淀。成功流程被封装为 script / skill，优秀会计的提问方式和处理经验被 review 后固化，行业模板和客户参数模板不断积累。

第四，有治理和兜底。核心调用链事先编排，异常链路告警，结果可校验，必要时人工审核，关键动作要求可回滚。

第五，人的角色发生变化。会计不再只是逐笔处理单据，而是处理异常、审核结果、捕捉客户需求、维护客户满意度；销售也可以在系统提示下承担一部分服务沟通；工程师和 AI 工坊则把新需求快速沉淀成可复用的作业能力。

这就是我为什么把慧算账放在 L3（实际上还要再高一点，能到L3.5，这个我以后文章或实战课里再细讲）。

它不是简单“给会计装了 AI 工具”，而是让 AI 在一个高频、强规则、强校验、强责任边界的财税场景中，承接了越来越多完整作业。人的价值没有消失，反而上移到规则设计、过程审核、异常处理、客户沟通和系统优化。

因此，慧算账案例给软件公司的启发是问自己：你有没有真实入口？有没有高频闭环？有没有可表达的规则？有没有结果校验？有没有异常兜底？有没有办法把一次非标交付沉淀成下一次可复用的 Skill 和 SOP？

如果没有这些，AI 再强，也只是一个更聪明的助手。

如果有这些，AI 才可能从流程节点变成主要作业引擎。

我们小结一下，慧算账的 L3 价值可以概括为一句话：

它把 AI 从“自动记账这个流程节点”，推进到“会计作业系统的一段闭环承接”。

它的核心是人机分工重构：AI 承接高频、规则密集、可校验的作业；人负责规则、审核、异常、客户关系和系统持续优化。对软件公司来说，这才是从 L2 到 L3 的真正分水岭。

五、软件公司的典型演变路线

软件公司AI改造，一般不会从L1直接跳到L4。

更常见的路线是：

第一步，全员工具化：让研发、产品、市场、销售、服务都使用AI。目的不是马上降本，而是建立基本能力和判断力。

第二步，关键流程嵌入：优先选择研发、客服、交付、客户成功等高频流程。把AI嵌入真实工作流，而不是停留在个人习惯。

第三步，选择一个作业闭环。不要一开始追求全公司AI化。先找一个高频、痛点明确、数据可得、结果可验证、错误可兜底的场景。

第四步，重构组织责任。当AI可以稳定承接作业闭环，就需要调整组织。

谁负责规则？谁负责评测？谁处理异常？……

这时会出现新的角色：AI BP、AI Builder、FDE、业务工程师、AI作业运营、小CEO（利润中心负责人）……

第五步，探索经营重构。当AI作业系统足够稳定，公司才有资格改变收费方式和客户承诺。

从卖账号到卖业务量、从卖模块到卖结果、从卖工具到参与客户运营……

这时才是L4。

（目前我手上有两个L4案例，但还不够成熟也没有通过营收规模的证明，总结规律比较困难，有机会我再做单独案例分享。）

六、结语

软件公司的AI改造，可以压缩成四句话：

L1，个人提效：AI是个人工具。L2，流程嵌入：AI是流程节点。L3，作业承接：AI是可控作业系统。L4，经营重构：AI成为经营系统的一部分。

真正的分水岭是L2到L3。因为从L3开始，AI不再只是让人更快，而是开始改变软件公司的价值交付方式。

L4则更进一步。公司不只是用AI做事，而是围绕AI作业系统，重新定义自己怎么交付、怎么收费、怎么组织、怎么承担经营责任。

所以，软件公司的AI化是一场从个人效率到流程效率，再到作业系统，最终走向经营系统的重构。

你任务自己所在的公司的AI化程度如何？欢迎投票，投票后可以看到其他公司的AI改造进度

【投票】

【相关文章】

改变软件范式的慧算账：不是生产力工具，而是生产力本身

你的产品在哪个象限？横轴~产品AI化深度 vs 纵轴~商业化高度

AI创新的哲学基础——生成整体论

【新年长文】AI产品创新：早期策略、战略投入与下场交付 —— 来自北森、千里马、Palantir在AI时代的实践与启发

【个人介绍】本文作者吴昊，SaaS领军企业前执行总裁，多家SaaS企业常年顾问，图书《SaaS创业路线图》及2.0 作者。

对实战课感兴趣的同学，请点击“阅读原文”了解详情。