乐于分享
好东西不私藏

AI 自主系统时代:服务即软件

AI 自主系统时代:服务即软件

作者:Julien Bek

编译:活水智能

下一家市值万亿的公司,是一家伪装成服务公司的软件公司。

每个在做 AI 工具的创始人都在问同一个问题:等 Claude 下一个版本出来,我的产品会不会变成一个免费功能?这个担心是对的。卖工具,你就在和模型本身赛跑。但卖结果就不一样了——模型每进步一次,你的服务就更快、更便宜、更难被替代。一家公司可能每年花 1 万美元买 QuickBooks(美国主流财务软件),再花 12 万美元雇会计师来结账。下一家传奇公司,直接帮你把账结掉。

执行 vs 判断

写代码,大部分是执行。知道下一步该做什么,是判断

把需求转化成代码、测试、调试——规则再复杂,终究是规则。判断不一样,它需要经验和品味,是多年实践磨出来的直觉:下个版本做哪个功能,要不要背技术债,什么时候该不完美地发出去。

一年前,大多数 Cursor 用户把 AI 当自动补全用。现在,由 Agent 发起的任务已经超过了人类直接发起的任务。软件工程占据了所有职业中 AI 工具使用量的一半以上,其他所有行业还停留在个位数。原因很简单:软件工程主要是执行型工作,AI 已经越过了可以独立搞定大部分执行工作的门槛,把判断留给人类。软件工程是第一个到达这个临界点的行业,接下来每个行业都会到。

副驾驶 vs 自主系统

副驾驶卖工具。自主系统卖结果。

过去,AI 模型的执行力和判断力还在发展中,所以正确的路是先做副驾驶:把 AI 交给专业人士,让他们决定怎么用。Harvey 卖给律所,Rogo 卖给投行,专业人士是客户,工具让他们更高效,他们为输出负责。

现在,模型已经够聪明,在某些领域,最好的起点就是直接做自主系统。Crosby 卖给需要起草保密协议的公司,而不是卖给外部律师。WithCoverage 卖给需要买保险的 CFO,而不是卖给经纪人。客户直接买的是结果。任何行业的”工作预算”都远大于”工具预算”,自主系统从第一天起就在吃工作预算。

一个领域里执行型工作的比例越高,自主系统赢得越快。

两种模式终将融合

今天需要判断的事,明天会变成可执行的规则。随着 AI 系统在某个领域积累起足够的”什么是好判断”的专有数据,边界会持续移动,副驾驶和自主系统最终走向融合。

从副驾驶向自主系统的迁移在多个领域已经开始。但起点很重要,因为它决定了自主系统现在能在哪里赢得客户、开始积累数据,而这些数据最终会让它处理判断型工作。

切入点:从外包开始

软件每花 1 美元,服务就花 6 美元。

自主系统的总市场是某个行业所有劳动力支出的总和,包括内部自做的和外包出去的。但正确的切入点,是那些已经在外包的地方。

一项任务如果已经在外包,说明三件事:公司接受这个工作可以由外部完成;有现成预算可以替换;买方本来就在买结果。用 AI 原生服务商替换外包合同是换供应商,替换内部员工编制是组织变革,前者容易得多。

打法路径:从外包的、执行型重的任务切入,打通分发,再随着 AI 能力积累,逐步扩展到内部化的、判断型重的工作。外包任务是楔子,内部工作才是长期大市场。

Crosby 从保密协议(NDA)起步:定义清晰、以执行为主,大多数公司本来就外包给外部律师。预算现成,范围明确,ROI 立竿见影,替换几乎零摩擦。

机会地图

把各服务垂直领域按”执行—判断”光谱和”外包—内部化”比例画出来,就是一张优先级地图:

保险经纪(1400–2000 亿美元)

列表中金额最大的市场。标准商业险高度标准化,经纪人的核心价值就是在多家承保商之间比价、填表格,纯执行工作。分发层极度碎片化,数万家小经纪公司各跑各的流程,没有任何一家掌控客户关系。WithCoverage 和 Harper 是新进入者。

会计与审计(美国外包市场 500–800 亿美元)

过去五年美国流失了约 34 万名会计师,需求却在增长。75% 的注册会计师快要退休,这种结构性短缺让会计业比其他任何行业都更快接受 AI。Rillet 在做 AI 原生 ERP,Basis 起步于为会计师做副驾驶。

医疗收入周期(美国外包市场 500–800 亿美元)

一听”医疗”就以为判断型重,但计费层几乎是纯执行工作。医疗编码就是把临床病历翻译成约 7 万个标准化的 ICD-10 代码,规则再复杂,终究是规则。Anterior 目前领跑。

理赔调整(含 TPA,500–800 亿美元)

标准险种理赔对照保单条款和损失清单结算,用精算表设准备金,规则驱动。理赔员队伍在老龄化,大量外包给 Crawford、Sedgwick 这样的 TPA。Pace 在做理赔处理的自主系统,Strala 在做 AI 原生 TPA。

税务咨询(300–350 亿美元)

CPA 执照形成了监管护城河,但底层工作 80–90% 是执行型。税务自主系统每多覆盖一个司法管辖区,数据护城河就深一分。TaxGPT 是早期玩家,欧洲有 Skalar 和 Ravical。

法律交易性工作(200–250 亿美元)

合同起草、保密协议、监管申报:执行型重,常规外包。工作成果标准化,质量可验证。Harvey 是新兴领导者,正快速向自主系统迁移;Crosby 和 Lawhive 是原生自主系统新进入者。

IT 托管服务(1000 亿美元以上)

每家中小企业都在外包 IT。补丁、监控、账号管理、告警分类,数千个相同环境里循环的执行工作。现有软件层(ConnectWise、Datto)卖工具给 MSP,还没有人直接向企业卖”你的 IT 由我运行”。Edra 在做 IT 流程自动化,Serval 在做 IT 支持自动化。

供应链与采购(2000 亿美元以上)

大多数企业只认真和前 20% 的供应商谈判,长尾完全被忽视。合同流失率占采购总额的 2–5%,切入点是被遗弃的工作——没有预算证明它值得做,没有人在做,纯粹是躺着的钱。Magentic 做直接采购,AskLio 做间接采购,Tacto 做中型市场的系统平台。

招聘与人员配置(2000 亿美元以上)

列表中规模最大的服务市场。漏斗顶层(筛选、匹配、触达)是纯执行工作,促成候选人入职和评估文化契合度则是判断力。自主系统的切入点在高流量、低判断的标准化岗位。Juicebox、Mercor、Jack & Jill 是新兴全谱系玩家。

管理咨询(3000–4000 亿美元)

市场巨大,但工作以判断型为主。有趣的问题是 AI 能不能把咨询拆解——数据收集、基准测试这些执行层自动化,战略建议这类判断层保留人工?最佳打法还没人跑出来。

■ ■ ■

2025 年,增长最快的 AI 公司是副驾驶。2026 年,很多公司会尝试转型成自主系统。它们有产品,有客户。但也面临创新者窘境:卖结果意味着把客户踢出工作流程,而这正是纯自主系统公司的机会窗口。


如果你想从「理解」到「动手」设计一套高效的 AI 自主系统。

活水智能 × 开智学堂推出「AI 自主系统训练营」,42 天带你搭建第一个真正能跑的 AI 自主系统,覆盖编程、科研、营销、健康四大真实场景。

首期内测开放,名额有限,长按下方海报二维码,或点击文末「阅读原文」,即可报名。