乐于分享
好东西不私藏

公司花了几百万买 AI Agent,然后不知道让它干什么

公司花了几百万买 AI Agent,然后不知道让它干什么

■ 说透 / SHUOTOU · 知览


SUBTITLE

不是技术不行,是没人想清楚该让它干什么


去年有一家中型金融公司,花了大概480万部署了一套AI Agent系统,从采购到上线折腾了小半年。上线第一周,CTO在管理层群里发了张截图,Agent自动生成了一份季度分析报告,格式漂亮,数据齐全,大家纷纷竖大拇指。

三个月后,有记者问他们那套系统现在干嘛呢,回答是:帮市场部的实习生回邮件,偶尔做做PPT。

480万,请了一个AI实习生。

这不是个段子。Deloitte2025年的调查说,42%的企业至少放弃过一个AI项目,每个项目平均沉没成本720万美元。RAND Corporation同年的分析更狠——80%的AI项目没能交付预期的商业价值。斯坦福2026年的AI指数报告直接写了个数字:企业AI Agent的成功率66%,但89%从来没到过生产环境。

你品品这个数字组合。成功率看着还行,但十个里面九个压根没上线。就好比你说这个厨师做菜好吃,但他一共就做了一道,剩下九道在备菜阶段就扔了。

— 01 —


那为啥会这样呢?

你得看整个决策链条是怎么转起来的。通常是这么个流程:CEO在某个行业峰会上听了一圈AI Agent的分享,回来跟CTO说咱也得搞,CTO开始选型评估,采购部门跟着跑流程,IT部门负责落地部署。每一步看着都挺专业的对吧?但你注意,整个链条里面有一个环节是缺失的——没有人认真想过这东西到底该干什么。

不是”能干什么”,是”该干什么”。

这两个问题区别大了。AI Agent的能力演示谁都看过,写代码、做分析、处理客服工单、自动化流程,什么都能来一点。但”什么都能来一点”恰恰是最危险的,因为它让决策者觉得”买了再说,总能找到用处”。然后就真的买了,然后就真的在找用处。

DATA — 企业AI Agent落地数据(2025-2026)

89% — AI Agent项目从未到达生产环境(斯坦福2026)

42% — 企业放弃过至少一个AI项目(Deloitte 2025)

$720万 — 每个被放弃AI项目的平均沉没成本

5% — 生成式AI试点产生可衡量财务回报的比例(MIT NANDA)

MIT的NANDA项目做了一个更扎心的统计:95%的生成式AI试点项目没有产生任何可衡量的财务回报。注意这个措辞,不是”回报不够高”,是”可衡量的“——就是你连算都算不出来它到底帮你赚了还是花了。

那五个害Agent项目失败的原因,Gartner总结过,排第一的不是技术问题。46%的企业说最大的坎是跟现有系统的集成,第二是输出质量不稳定,第三是没有监控工具,第四是组织内部没人”拥有”这个事,第五才是训练数据不够。

你看,五个里面四个跟技术本身没关系。

这让我想起一个老故事。ERP系统,企业资源规划,从上世纪90年代开始在全球推广,到现在三十多年了,实施失败率依然在55%到75%之间。好家伙,Hershey’s当年为了赶在千年虫之前上线ERP,结果万圣节旺季系统崩了,一亿美元的订单没处理掉,股价跌了8%。CRM系统差不多,失败率也在55%左右。

说白了企业软件这东西,从来就不是”买了就能用”的。但每一波新技术来的时候,大家好像都会集体失忆一次。

— 02 —


好,到这儿你可能觉得AI Agent就是个大泡泡。但有个反面证据咱不能假装看不见。

Klarna的AI客服Agent,上线第一个月就处理了230万次对话,分走了三分之二的客服工作量,平均解决时间从11分钟压到了2分钟以内,一年下来省了6000万美元。摩根士丹利用一家叫DevGen.AI的公司做代码审查,Agent扫了900万行遗留代码,给1.5万个开发者省了大概28万小时的工作量。

这两个不是PPT上的数字,是真金白银算出来的。

那为啥Klarna用得好,你公司用不好?

你想啊,Klarna做的是客服,这个场景有几个特点:输入输出高度标准化,成功标准很清晰(解决了还是没解决),容错空间相对大(回答不好最多让客户再转人工),而且量巨大——量大就意味着即便每次只省一点点,累积起来数字非常可观。摩根士丹利那个也是,代码审查本身就是规则驱动的,审查标准可以被编码,输出好坏可以验证。

这两个案例的共同点是:在部署之前,就已经非常清楚Agent要做什么,做到什么程度算成功,做砸了怎么兜底。

但大多数企业买Agent的时候,脑子里想的是”通用智能助手”。一个能干所有事的万能工具。这个想法本身就是错的。Agent不是员工,你不能招进来再想让它干嘛。它更像一台专用设备——你得先有一条明确的生产线,才知道该买什么设备装上去。

不是工具不行,是很多公司到现在也没想清楚,自己到底有哪条流程值得用AI去跑。

— 某企业AI顾问,2026年3月

Gartner今年4月发了一组数据,AI基础设施项目里只有28%完全达到了投资回报预期,20%直接失败。而同期全球企业在AI上的投入是6840亿美元。按RAND的80%失败率估算,里面超过5470亿美元没有产生可衡量的结果。

五千多亿美元,烧出去了,连个响都没听见。

— 03 —


其实你回头看,2025年整个AI Agent赛道的处境特别像2000年前后的企业互联网。那时候也是所有公司都在喊”上网””电子商务”,CEO在年会上说”我们必须拥抱互联网”,然后IT部门做了一个官网,放了个在线目录,宣布”数字化转型完成”。真正把互联网用出价值的是后来那批想清楚了具体场景的公司,比如亚马逊搞的不是”上网”,是”把仓储物流和用户推荐串起来”。

AI Agent现在也卡在这个位置。技术能力在那摆着,Gartner预测到2026年底40%的企业应用会嵌入Agent功能,全球Agent市场规模2025年已经到了76亿美元。钱在烧,产品在出,但大多数企业还停留在”有了锤子找钉子”的阶段。

那怎么才算”想清楚了”?其实Klarna和摩根士丹利已经给了答案——不是找AI能做什么,是找你公司里哪个环节已经在重复浪费人力,量足够大,规则足够清晰,错了能兜底。从这个环节切进去,Agent的投资回报两周就能算出来。Google Cloud那边的数据说,客服场景的投资回报周期最短,两周就能看到数字,供应链编排最长,要一年以上

但问题是,找到这个环节需要的不是CTO,是那个天天在流程里面跑的中层管理者。而这个人在大多数公司的AI采购决策链里面,是没有话语权的。

企业买AI Agent这件事,技术从来不是瓶颈。瓶颈是一个很老派的管理问题:谁来定义这个工具该干什么,谁来为它的产出负责,谁来判断它做得好不好。这三个问题在很多公司里面至今没有明确的回答。720万美元的沉没成本,买到的最贵的教训就是这个——工具再聪明,如果使用者自己没想清楚要它干嘛,那它就只能帮你回邮件。

工具再聪明,如果使用者自己没想清楚要它干嘛,那它就只能帮你回邮件。

· · ·

ZAYEN知览

说透 · SHUOTOU · 知览