AI应用创业总被模型内化,3次Pivot破局总结出AI场景筛选框架

AI投资，欢迎微信交流

今年和一二级投资人同行交流，100%都会讨论到AI应用被模型内化的问题，这也是大家感慨“AI应用投资难”的原因之一。

一位Enterprise AI创业者朋友马永亮Ryan，独立创业1年经历3次方向调整，每次Pivot背后的逻辑高度一致：他切的方向，要么高度依赖业务专家，AI的上限取决于使用者能力；要么太通用，本质是在模型Coding能力之上封装了表层功能，直接被大模型内化。

找到“反内化”底层逻辑后，他跳出这个框架，最终锁定AI BPO原生服务，已经验证AI直接交付结果模式。在我们的对话中，他完整分享了AI创业“踩坑”经验、AI ToB市场现状，并总结了一套很实用的ABC任务框架，用于筛选AI应用创业机会。

马永亮：曾任澜舟科技合伙人、研发副总裁，微软必应首席研发经理，在搜索、办公、AI平台等领域有十几年经验。现专注AI原生服务方向，与头部IT/ 业务流程服务公司深度共建AI落地。

3次Pivot，找到创业破局点

1. 国内AI应用公司普遍Pivot，你们创业这1年，也经历了几次Pivot？

马永亮：我们3次Pivot其实始终围绕同一内核：用AI Coding构建复杂的企业AI应用。2021-2024年，我都在给企业做AI应用，24年我在产品里定制了一些Coding能力用于金融场景问答，效果很明显。自然就想能不能让AI Coding做更复杂的事？后来3次Pivot就是这个判断的反复实践和修正。

起点(25年初）：行业AI应用，陷入“专家依赖陷阱”

我们当时基于AI Coding给医药、金融领域做AI应用，和OpenAI、Anthropic最近成立合资公司要做的事很像。但很快就遇到瓶颈——这种任务依赖业务专家，我们团队没有这类人才，很难做深。

第一次Pivot（25年6月）：创业公司发力通用水平能力，比不过模型厂商

后来弱化行业属性，只做几个应用品类——智能助手、知识库、Deep Research。当时想法很朴素：我们毕竟都是coder，可以做出比市场上更好的Coding产品。

现实是我们刚做出demo，Claude直接内置更新。大厂把Coding做成了通用基础设施，不是独立垂直赛道。创业公司做Coding Agent相当于在流沙上建城堡。

第二次Pivot(25年8月)：Agent形态+数字员工人格，大厂入场窗口很快关闭

我们用1个多月开发了原型——AI Developer和AI UI Designer，立意是“让AI不只是工具，而是承担一个角色”。AI Designer主打适配客户内部设计体系的个性化工具，产品形态和后来的Claude Design很接近，Pencil Design等创业公司当时也在做。

这个赛道很快就变成红海，比如Claude把通用设计和渲染能力内置，所有同类设计工具的差异化壁垒就消失了。基模公司、开源生态、各种垂直Coding Agent同时涌入，窗口很快关闭。

第三次Pivot（25年12月）：AI原生服务，适合创业公司的赛道

最后我们转向了AI BPO服务，产品形态是数字员工，直接交付可量化的业务结果，已在软件合规测试、内容审核场景落地验证。Agent端到端承接点击、填表、审核、比对等任务，自动化率稳定做到90%–95%。

我们发现这类任务的预算池被严重低估：企业劳动力预算是SaaS预算的10–20倍。

后浪new：第二、第三段经历都是AI工具被模型内化。今年Anthropic只要发布垂直行业插件，对应公司的股价就会应声下跌，这些插件本质都是给底层Coding Agent发指令，并不是模型厂商主观意志上“要进军哪个垂直领域”，而是模型发展的必然结果。

马永亮：是的。以前我都在调整"怎么做"——调整定位、调整产品形态、调整切入方式。但回头看，这些都是次要的，真正的问题在于"做什么"——任务类型选错了，后面再怎么调整都于事无补。任务选对了，讨论怎么做才有意义。

用ABC框架筛选AI应用赛道

2. 你提出ABC任务分类框架，具体包含什么？

马永亮：这个框架是用来判断适合创业公司切入的任务场景

A类：Advisory Work顾问型工作

A类任务依赖专业能力和业务知识，AI的价值上限取决于使用者本身的专业能力。优秀工程师用Claude Code效率翻倍，但不会写代码的人用了它也很难产生高价值内容。AI是放大器，不是替代者，法律、金融、编程都属于A类。

C类：Commodity Work商品化工作

通用问答、搜索、Deep Research、翻译都属于C类，不依赖专业背景，也不依赖企业know-how。C类的共性在于通用，不在于简单——baseline随模型变强一直在涨，但通用性属性不变，是基座模型持续内化的赛道。

B类：Business Operations Work业务运营工作

B类无法用通用知识完成，需要企业特定know-how，这些私域知识不在专家脑子里，而在流程、规则、操作里——可以被产品化沉淀。订单处理、合规审核、内容审核、人力/财务/采购操作、发版测试都属于B类，AI替代率能达到90%以上。B类场景零散、要深度绑定客户，不是基模公司的战略主线。

虽然切B类也会面临竞争，但竞对不是巨头。A、B、C类对手是谁，根本不是一个量级的比较。

「AI原生」vs 「AI+人」

3. 5月份企业AI领域集中发生了几件事，都指向比较重的类FDE模式，您经历过SaaS、AI项目、AI服务，对AI落地路径有哪些感受？

马永亮：这里面有4类玩家：模型公司、SaaS、咨询公司、AI原生公司，他们最近的动作高度一致——主流交付模式不是"AI原生"，而是"AI加人"。我认为RPE（Revenue per Employee）指标能看清AI服务公司的本质：

埃森哲：9万
Sierra：24万
Salesforce：42万
Mercor：250万
OpenAI：550万
Anthropic：900万

Sierra ARR 1.5亿美元，员工620人左右，RPE约24万美元，正好卡在埃森哲和Salesforce中间，这不是AI原生公司应该在的位置。

Sierra客户100家，Mercor客户50家，客单价都是百万美元级，但员工数Sierra是Mercor的20倍。这意味着，Sierra提供的服务里，AI能完成的比例比Mercor低得多，Sierra还在埃森哲区间（咨询模式）没出来。

AI原生服务模式核心变量

马永亮：我整理过14家AI ToB公司的数据，RPE跨度28倍——同样是AI ToB，人效比结构完全不同

AI SaaS 6家，RPE集中在30-50万美元。AI原生服务公司也是6家但内部跨度最大，从Sierra的24万到Mercor的250万。Mercor和Retell人效接近，但路径不一样：

Mercor：高客单价 × 少量客户，50个客户、30个员工，AI要完成尽可能多的工作，需要很高的AI替代率
Retell：规模化扩张，1000个客户、21个员工，这种规模必须有很高的复用杠杆

这也是我们团队验证AI原生服务模式的核心变量：

一是AI替代率：AI自主完成任务的比例占多少，低于20%没意义，只是传统服务的微优化，必须超过90%，商业模式才算成立。

二是复用杠杆：第一个客户投入100，第二个90，第三个40。如果还是线性投入，那只是给传统服务套了AI外壳。二者都达标，才能用软件扩张的速度做服务。

结果付费只是起点，更大的挑战在后面

4. 你们目前提供AI BPO服务的商业模式是什么？

马永亮：我们取消了过程付费，只看结果。定价模式直接锚定人力成本，采用结果分成：帮客户省下多少人力成本，我们分取对应收益；如果没省钱，我们自行承担过程成本。

5. 硅谷AI原生服务公司也普遍砍掉前置付费、过程付费，没达到业务结果预期不收费。不过也有部分公司收取一些fixed fee回收token硬成本

马永亮：现在行业主流是按token/credit按量计费，客户先付钱，然后赌你的Agent能跑出业务价值。B端很难接受风险前置的过程付费。实际上，按结果付费也只是起点，真正的挑战在后面：

第一，交付了结果，客户就愿意签合同吗? 不一定。结果型定价的客户决策链更长，因为本质上是把"人力预算"切出来给你。

第二，交付了结果，就能说服客户改变现有业务模式吗? 也不一定。客户现有业务流是为"人完成工作"设计的，引入数字员工意味着要调整周边流程、变更角色定义和权限。组织变革的阻力比技术更难突破。

第三，交付了结果，就能满足企业级合规要求吗? 基模API并不解决工程问题，我们投入了很多产品工程能力。

"按结果付费"是个起点，不是终点。真正能跑通AI原生服务的公司，是把定价、风险承担、组织变更、企业级工程几件事都打通的公司。

6. 我接触过几家跑通AI原生服务的公司，前期需要一定耕耘周期，但一旦跑通UE，造血能力很强

马永亮：是的。我们现在切的合规测试场景，需要真实跑3–4个月测算收益，必须量化结果。但一旦跑通，会形成多层壁垒：私有流程数据持续沉淀、自动化率不断提升、边际成本持续下降。

7. 你们的切入点和美国红杉给出的最优路径一致：强规则、高重复的外包场景。客户本身就在外包这类工作，只是换了ROI更高的服务商，落地阻力最小

马永亮：我们去年12月开始做AI BPO，红杉今年3月release文章建议从"外包 + Intelligence比例高"的任务切入，和我们的实践结论高度一致。

改写ToB付费逻辑

8. 很多人担心国内AI ToB重蹈SaaS覆辙，您在一线市场的感受和判断是怎样的？

马永亮：企业未必为"可能有用的工具"付钱，但愿意为"帮我省下来的人力成本"付钱——这两个定价逻辑完全不同。

我觉得AI原生服务是中国ToB市场真正的希望。国内对"AI替代人力"的ROI越来越敏感，很多服务型公司的利润率持续压缩；而国内企业服务行业沉淀出的供给结构，很适合用AI原生服务做杠杆，这是和美国市场不一样的地方。

9. AI原生服务要以更高的ROI去PK传统服务。海外Coding Agent成本13美元/天，相比人工编程300美元/天，降低了一个数量级。而客服Agent 93美元/天，比人工还贵一点。长线看token成本会降低，你们怎么平衡成本？

马永亮：我们现在用海外闭源模型跑一个任务，平均成本3美元，和传统人工服务相比，价格优势并不明显。

所以要优选算力成本低、AI实际替代率高、有复用杠杆的任务场景切入，再反向优化内部系统，降低推理成本。服务国内企业还可以直接切换千问、DeepSeek等开源模型，成本会大幅下降。

选择往往决定上限

10. 这次交流，我最直观的感受是你很重视“选择”，选择一个对的场景，比盲目启动开发更重要

马永亮：是的，AI应用创业最大的杠杆不在于AI技术，而在于赛道选择，选择的重要性超过50%。赛道切口直接锁定了任务的替代率、研发复用杠杆、客户的付费能力和商业模式。

11. 你曾在创业公司做高管，过去1年又独立创业，虽然都是创业，都经历了从0到1，但心态肯定有区别。过去1年最大的收获是什么？

马永亮：我整体创业经历有5年，过去1年最大的感受是：创业者不能ego太强，不能自己看好什么就选择做什么，核心团队的适配性很重要，方向可以灵活调整，但要诚实地评估自己，要承认自己可能选错。更重要的是，AI创业者要“先看清楚”，选对的事，比做对的事重要十倍。

AI Talk是后浪new新设专栏，分享AI创业者的实践和故事。欢迎推荐/自荐创业者、对接访谈对象，加我微信交流。