乐于分享
好东西不私藏

软件公司的AI改造分级L1-L4:从个人工具到经营重构(含真实案例拆解)

软件公司的AI改造分级L1-L4:从个人工具到经营重构(含真实案例拆解)

SaaS创业路线图系列 | 第245篇

【近期本号在北京、上海举办实战研讨课,每场10家软件企业一起探讨如何将自己从L1、L2提升到L3,并在将来实现L4。欢迎了解详情:】

—==正文==—

上周我把参加腾讯SaaS改造闭门会的14家企业做了“AI改造L1-L4”分级,有几个朋友留言或私信我问分级标准是什么?

判断一家软件公司的AI改造程度要看一个核心问题:

AI在公司的价值交付中,承担了多重的责任?

软件公司的价值交付链条,大致包括:市场获客、销售转化、需求定义、产品设计、研发测试、部署交付、客户成功、续费扩容、经营管理。

我们可以把软件公司的AI组织改造分为四级:

L1,个人提效。L2,流程嵌入。L3,作业承接。L4,经营重构。

我虽然做过十多年研发,但最近8年的角色是研究软件创业和企业经营改进。我这套不是技术分级,而是经营分级。

本文将陈述这套分级方法、介绍每个级别的具体场景,并以慧算账为例为大家介绍从L2(去年的慧算账)、到L3(今年的慧算账)再到L4的差异。(慧算账是我目前见过国内SaaS公司里AI改造级别最高且上规模的公司:L3.5)。

一、软件公司AI改造L1-L4

等级
名称
AI的角色
核心定义
判断标准
关键词
L1 个人提效
AI是个人工具
员工用AI提升个人产出,但公司流程、岗位职责和组织结构基本不变
拿掉AI,原流程仍可照常运行,只是个人效率下降
个人更快
L2 流程嵌入
AI是流程节点
AI进入正式业务流程中的局部节点,但流程仍由人主导
AI已进入研发、销售、客服、交付、客户成功等流程,但人仍是流程发动机
流程更快
L3 作业承接
AI是作业系统
AI在限定场景内,承接一段可定义、可执行、可校验的作业闭环
AI能从输入、判断、执行到校验完成主要作业链条,人负责规则、审核、异常和优化
作业闭环
L4 经营重构
AI是经营系统
公司围绕稳定的AI作业闭环,重构交付方式、收费方式、组织结构和经营责任
不只是作业变了,而是收入模式、成本结构、交付组织、客户承诺一起变化
重构经营

简版如下:

等级
名称
一句话
L1 个人提效
员工用AI,提升个人效率
L2 流程嵌入
流程嵌AI,提升局部效率
L3 作业承接
AI承接作业闭环,改变交付方式
L4 经营重构
公司围绕AI作业闭环,重构经营系统

L1:个人提效

L1是最容易开始的一层。

员工开始使用AI工具,提高个人产出。研发写代码更快,产品写PRD更快,市场写内容更快,销售做客户调研更快。

但公司没有整体改变。所以L1不能被高估。

一家软件公司如果只是全员配了AI工具,只能说明它开始AI化,不能说明它已完成组织改造。

场景:研发AI coding

工程师用Claude Code、Codex、Cursor等工具写代码、改Bug、生成单元测试。

效率可能提升明显。但需求仍然由产品经理提出,架构仍然由人设计,测试仍然由测试团队把关,发布仍然走原来的流程。

L1的价值是普及AI意识。但局限是,它不会自动带来组织结果。

L1只解决了某些瓶颈问题,但对组织中的其它瓶颈熟视无睹。

很多公司会发现:员工效率都提高了,但公司研发效率、最终业绩都没有明显提高。原因就在这里。

个人提效不是组织提效。

L2:流程嵌入

L2比L1前进了一步,AI不再只是员工自用工具,而是进入公司的正式流程,成为流程中的一个节点。

这时AI开始进入公司的作业系统,但流程主导权仍在人手里。

人提出任务,人判断结果,人决定下一步;而AI则增强某个节点。

场景一:客服智能工单

客户提交问题后,AI先做分类、摘要、推荐答案,再由客服人员确认、修改、发送。

这个流程有价值。它降低了客服查资料的时间,也提升了响应速度。

但客服人员仍然是流程发动机。AI没有独立完成问题识别、知识调用、方案执行、结果校验和异常转人工的闭环。

这是L2。

场景二:研发流程中的AI审查

代码提交后,AI自动做代码审查,提示潜在Bug、规范问题、安全风险,并生成部分测试用例。

这会提升研发效率。但需求拆解、技术设计、测试策略、发布判断仍然由人主导。

AI进入了研发流程。但研发流程没有围绕AI重写。

这也是L2。

L2的价值是让AI进入正式流程。L2的局限是AI仍然只是节点,不承担完整作业责任。

很多软件公司现在正处在L2。这是很大进步,但还不是作业闭环重构。

L3:作业承接

L3是重要分水岭。这次腾讯活动上的14家企业,只有3家达到了这个段位。

从L3开始,AI不再只是流程节点,而是在限定场景内承接一段完整作业闭环。

这个闭环必须满足几个条件:有清楚的输入、明确的业务判断、有结果生成、有结果校验,也有异常处理或人工兜底。

L3不等于无人化。更准确地说:

AI成为主要作业引擎,人转向规则设计、审核、异常处理和系统优化。

所以,L3的关键是“有没有可控作业系统”。

至于完全脱离人的作业系统,我觉得它既不现实,也不必要。

不现实:目前实现难度过大;

不必要:完全不需要人的产品,如果还有海量客群,就正好在“大厂”的典型射程内,创业公司即便做出来也没有意义。

L3场景:AI承接客户交付配置

一家企业软件公司,客户提出一个标准范围内的配置需求。

AI读取客户需求、匹配产品能力、生成配置方案、调用系统完成配置、生成验收材料,并根据规则进行结果校验。

交付顾问不再逐项操作,而是审核配置结果,处理异常需求,维护规则库和模板。

因为AI承接的是一段完整交付作业,而不只是帮顾问写方案。

以前人是执行者。现在人是监督者、训练者、异常处理者和规则维护者。

L2是AI插进流程。L3是流程围绕AI重写。

这是最关键的差异。

L4:经营重构

L4必须建立在L3之上。

推出AI产品,不等于L4。

改变收费方式,也不等于L4。

真正的L4,是公司围绕稳定的AI作业闭环,重构交付方式、收费方式、组织结构和经营责任。

L4看的是经营系统变化。

场景一:从卖软件到卖结果

一家行业销售软件公司,过去按账号收费。

现在它不再只提供CRM工具,而是用AI作业系统帮助客户完成线索发现、客户画像、话术生成、触达节奏、商机推进和结果归因。

公司不再只承诺“提供系统”,而是开始承诺“有效商机数量”或“销售动作完成质量”。

收费方式也从账号费,部分转向按线索、按商机、按成交贡献收费。

这才接近L4。

前提是:背后必须有稳定的AI作业闭环。

场景二:从标准交付到AI经营单元

一家行业软件公司,围绕某个高频业务场景建立AI作业系统。

公司内部不再按传统研发、产品、交付、客户成功切割,而是组建小型经营单元:有业务负责人、有业务工程师、有客户成功和异常处理团队,也有明确毛利目标和客户结果目标。

这时AI不只是产品能力,而是经营单元的基础设施。

公司不再只考核功能上线,而是考核业务结果、交付毛利、客户续费和扩容。

这就是L4。

L3是作业闭环。L4是重构经营。

三、各级之间的依赖关系

从L1到L4这四层之间有递进关系:

演进
本质变化
L1 → L2
从个人使用,到流程采用
L2 → L3
从流程节点,到作业闭环
L3 → L4
从作业变化,到重构经营

最容易跳空的是L4。

很多公司先想新收费方式,先想AI产品包装,先想结果定价。客户会很快发现,所谓AI交付,最后还是人工顾问在背后硬扛。

如果没有L3级AI作业闭环支撑,L4只是商业叙事。

—— 这条是我在写这篇文章时才想到的。过去8年我都在讲商业SaaS,但为何能实现按业务量收费、乃至抽佣的SaaS公司凤毛麟角?

因为定价依赖产品价值、依赖公司的组织能力。身体在上一个时代,脑子提前进入下一个时代,也解决不了软件公司经营效率低下的难题。

只有从L1到L4一个个阶段做扎实,SaaS公司才真正完成了更新换代。

真正的顺序应该是:

先让AI稳定承接作业,再围绕作业闭环重构经营。

四、从L2到L3的成功案例:慧算账

这里我有个调研的具体案例——慧算账。

我每年都与慧算账创始人及CEO张述刚进行深度交流。2025年慧算账推出了“自动记账Agent”,我也写了一篇文章《改变软件范式的慧算账:不是生产力工具,而是生产力本身》详细分析。

自动记账Agent还只是L2 —— AI嵌入了工作流程。

今年我再拜访张述刚,加上在腾讯活动上听慧算账研发总经理对AI产品和产研组织改造的介绍,我看到他们已经进入L3阶段:

  • 把 AI 嵌入“会计作业系统”。一方面通过龙虾给代记账会计团队配 AI 助理,已覆盖几百个会计,并计划扩展到销售;

  • 另一方面用 AI 工坊(相当于财税场景的Coze)承接定制化需求,沉淀五大 Skill、SOP、行业模板。

如果说 2025 年的自动记账 Agent,证明的是 AI 可以进入会计流程中的关键节点;那么 2026 年我看到的慧算账,已经不只是“自动记一笔账”,而是在把 AI 放进一整段会计作业系统里。

这个变化先从基础事实看。

慧算账在过去 11 年沉淀了完整的财税 SaaS 和代账服务流程。过去的自动化已经很深:从发票、单据识别,到归类、财务核算、申报,很多标准场景已经自动化。在腾讯活动的现场分享中提到,他们每月大约处理 800 万张票据识别和分类,业务判断准确率约 95%;线上有 3000 多台 RPA 24 小时运行;约 90% 客户在标准场景下基本不需要会计干预。

但这恰恰暴露出新的瓶颈:标准化场景已经接近自动化天花板,真正消耗代记账会计时间的是非标场景。慧算账提到,一个会计每月服务 200-300 户已经接近瓶颈,而约 30% 的非标场景会消耗会计约 90% 的时间。L3 的机会,就出现在这里。

慧算账今年的做法不是推倒重建一套 AI 原生财税系统,而是提出“双轮战略”:第一轮,把 AI 嵌入原有 11 年系统,让一个会计从每月服务 200-300 户继续突破到 400 户甚至 450 户;第二轮,建设 AI 工坊,面向大客户和定制化需求下场交付,把非标需求沉淀成 SOP、Skill 和行业模板。

这就是 L3 与 L2 的差别。

L2 是 AI 嵌入流程,帮助人完成某个节点。自动记账 Agent 属于这一类。它已经很有价值:早期 OCR 加小模型只能做到约 70% 采纳率,没有实际生产意义;后来结合 DeepSeek 等 LLM,并基于约 100 万家企业 2 年真实记录、约 2 亿条记账数据训练后,采纳率提升到约 94%。系统能自动完成大约 90% 的记账工作,人主要处理异常、沟通和确认。(详见上面提到的本号去年文章)

但 L3 不止是“更准的节点”。L3 要让 AI 承接一段作业闭环。

慧算账今年展示的闭环已经不止记账本身。他们把龙虾/openClaw 与企业微信侧边栏结合,给每个会计配置一个“龙虾 AI 助理”。上个月已经上线约 500 个龙虾,基本覆盖会计团队;下个月还计划覆盖销售端数百人。

此外,我感到特别有价值的启示是 —— 它没有改变用户原来的工作入口。

客户仍然在企业微信里甩发票、发文件、提需求,会计仍然在熟悉的服务场景里接活,只是企微侧边栏多了一个能调用系统能力、理解上下文、串联流程的 AI 助理。

现场展示的场景也不是简单问答,而是一段段业务动作:站内发票数据自然语言查询,站外社保政策智能搜索……尤其是调账、社保、工资申报这些场景,都不是“生成一段文字”就结束,而是要识别输入、判断业务逻辑、补录关键信息、调用系统能力、生成结果,并在必要时进入人工审核。

同时,慧算账已经开始把非标交付沉淀成可复制能力。AI 工坊抽取了五类核心 skill:Web skill 、Service App skill 、文件处理 skill 、电子表格 skill 、BI 分析 skill …… 再加上标准 SOP、行业模板、子模板和客户参数模板,逐步把定制化交付变成可复用的作业能力。

这背后的经营含义很大。慧算账不是把 AI 当成一个“会计 Copilot”,而是在把会计作业拆成输入、判断、执行、校验、异常处理几段,然后用 AI 工坊、Skill、SOP、模板和既有系统 API 重新编排。

它既没有放弃原有 SaaS 底座,也没有迷信一个通用大模型可以自动完成所有工作,而是把多年积累的流程、数据、规则和客户现场经验,转化成 AI 可调用、可治理、可复用的作业系统。

财税又是一个典型的零容错场景,这使慧算账的实践更值得我们参考。

腾讯云活动现场有同行问:财务场景遇到大模型幻觉怎么办?慧算账的回答是:不能让大模型自己决定最终调什么接口,也不能把核心业务完全交给自由推理。核心业务要封装进智能体平台,SOP 和 Skill 要事先编排好,调用链要确定下来;执行时如果调用链偏离预期,就要告警;整个链路要能追踪、能回滚,否则一旦智能体执行了很多业务却无法撤回,就会变成工程和财务事故。

所以,慧算账进入 L3 的标志是它已经形成了“可控作业系统”:

第一,有真实作业入口。会计和客户仍在企业微信、客户群、票据、文件、表格、申报流程中工作,AI 没有悬浮在业务之外。

第二,有可被 AI 承接的完整作业段。发票查询、社保办理、工资申报、调账方案、大客户数据处理,都不是单点内容生成,而是从输入到结果的业务闭环。

第三,有可复用的能力沉淀。成功流程被封装为 script / skill,优秀会计的提问方式和处理经验被 review 后固化,行业模板和客户参数模板不断积累。

第四,有治理和兜底。核心调用链事先编排,异常链路告警,结果可校验,必要时人工审核,关键动作要求可回滚。

第五,人的角色发生变化。会计不再只是逐笔处理单据,而是处理异常、审核结果、捕捉客户需求、维护客户满意度;销售也可以在系统提示下承担一部分服务沟通;工程师和 AI 工坊则把新需求快速沉淀成可复用的作业能力。

这就是我为什么把慧算账放在 L3(实际上还要再高一点,能到L3.5,这个我以后文章或实战课里再细讲)。 

它不是简单“给会计装了 AI 工具”,而是让 AI 在一个高频、强规则、强校验、强责任边界的财税场景中,承接了越来越多完整作业。人的价值没有消失,反而上移到规则设计、过程审核、异常处理、客户沟通和系统优化。

因此,慧算账案例给软件公司的启发是问自己:你有没有真实入口?有没有高频闭环?有没有可表达的规则?有没有结果校验?有没有异常兜底?有没有办法把一次非标交付沉淀成下一次可复用的 Skill 和 SOP?

如果没有这些,AI 再强,也只是一个更聪明的助手。

如果有这些,AI 才可能从流程节点变成主要作业引擎。

我们小结一下,慧算账的 L3 价值可以概括为一句话:

它把 AI 从“自动记账这个流程节点”,推进到“会计作业系统的一段闭环承接”。

它的核心是人机分工重构:AI 承接高频、规则密集、可校验的作业;人负责规则、审核、异常、客户关系和系统持续优化。对软件公司来说,这才是从 L2 到 L3 的真正分水岭。

五、软件公司的典型演变路线

软件公司AI改造,一般不会从L1直接跳到L4。

更常见的路线是:

第一步,全员工具化:让研发、产品、市场、销售、服务都使用AI。目的不是马上降本,而是建立基本能力和判断力。

第二步,关键流程嵌入:优先选择研发、客服、交付、客户成功等高频流程。把AI嵌入真实工作流,而不是停留在个人习惯。

第三步,选择一个作业闭环。不要一开始追求全公司AI化。先找一个高频、痛点明确、数据可得、结果可验证、错误可兜底的场景。

第四步,重构组织责任。当AI可以稳定承接作业闭环,就需要调整组织。

谁负责规则?谁负责评测?谁处理异常?……

这时会出现新的角色:AI BP、AI Builder、FDE、业务工程师、AI作业运营、小CEO(利润中心负责人)……

第五步,探索经营重构。当AI作业系统足够稳定,公司才有资格改变收费方式和客户承诺。

从卖账号到卖业务量、从卖模块到卖结果、从卖工具到参与客户运营……

这时才是L4。

(目前我手上有两个L4案例,但还不够成熟也没有通过营收规模的证明,总结规律比较困难,有机会我再做单独案例分享。)

六、结语

软件公司的AI改造,可以压缩成四句话:

L1,个人提效:AI是个人工具。L2,流程嵌入:AI是流程节点。L3,作业承接:AI是可控作业系统。L4,经营重构:AI成为经营系统的一部分。

真正的分水岭是L2到L3。因为从L3开始,AI不再只是让人更快,而是开始改变软件公司的价值交付方式。

L4则更进一步。公司不只是用AI做事,而是围绕AI作业系统,重新定义自己怎么交付、怎么收费、怎么组织、怎么承担经营责任。

所以,软件公司的AI化是一场从个人效率到流程效率,再到作业系统,最终走向经营系统的重构。

你任务自己所在的公司的AI化程度如何?欢迎投票,投票后可以看到其他公司的AI改造进度

【投票】

【相关文章】

改变软件范式的慧算账:不是生产力工具,而是生产力本身

你的产品在哪个象限?横轴~产品AI化深度 vs 纵轴~商业化高度

AI创新的哲学基础——生成整体论

【新年长文】AI产品创新:早期策略、战略投入与下场交付 —— 来自北森、千里马、Palantir在AI时代的实践与启发

【个人介绍】本文作者吴昊,SaaS领军企业前执行总裁,多家SaaS企业常年顾问,图书《SaaS创业路线图》及2.0 作者。

对实战课感兴趣的同学,请点击“阅读原文”了解详情。