一年前,AI Agent还只是很多企业内部会议的一个议题:要不要做、如何做、谁来做……
一年的时间里,有企业选择继续观望,有企业选择小步快跑,也有的企业重仓加码,建部门、投资源。
一年后的今天,第一批落地AI Agent的企业,已经开始拿出ROI数据。
来自Anthropic & Material最新的报告显示:80%的企业AI Agent已产生可量化的经济回报。
AI Agent的叙事已经不再是"预计会提升",是"已经省了多少成本、创造了多少利润"。

(回复“20260513”,获取完整报告)
但也有另一个不得不面对的事实:AI Agent"能行"的门槛比想象中高。
报告显示:无论何等规模的企业,在落地时,近一半都会遇到包括系统整合、数据/知识库质量等方面的困难。

(回复“20260513”,获取完整报告)
对于正在风风火火开展AI Agent落地的企业来说,这份报告揭示了一个非常关键的信息:AI Agent能够带来价值,但要有韧性和耐心。
一、80%的企业已实现ROI为正,率先落地的是哪些场景?
1. 客服场景:49%企业选择首先切入
报告显示,49%的企业选择将AI Agent率先引入客服场景,原因很直接:
高重复(有价值)、有历史对话数据(有基础)、流程相对标准(有可行性)、效果可量化(人工成本/响应时效/客户满意度,可衡量)。
这种场景天然适合Agent发挥。

家得宝(Home Depot,全球最大的家居建材零售商)的案例很典型:
客户打电话直接说需求,10秒内识别意图
问题解决速度比传统IVR电话菜单快4倍
多语言实时翻译
直接帮客户查库存、发起服务请求、把产品链接发到已预填的购物车
根据项目描述自动配齐材料清单(基于实时库存)
始终保留一键转人工路径
该公司的财报公开显示:
在AI Agent的50家试点门店,客户满意度提升的同时,员工满意度也显著提升,员工表示有更多精力服务到店客户,且明确确认AI Agent对线上转化率的正向贡献。
2. 代码开发场景应用最广泛——采用率达90%
代码开发场景的采用率最高,背后是一套完整的经济账。
大量企业在实践后发现,AI Agent在研发环节的投入月度净ROI可以达到2.8x到4.5x,投资回收周期6到8周。
能达到如此效果,主要得益于三个指标的显著提升:
代码审查时间缩短41%,Bug定位时间减少35%,测试覆盖率显著提升。
ROI最高的三个场景分别是遗留代码重构(4.2x)、测试覆盖率提升(3.8x)、文档生成(3.5x)。
有意思的是,有3个场景投入AI Agent ROI会很低,分别是:新功能从零开发、跨团队复杂系统设计、安全敏感模块开发。
因为这些场景的产出物需要大量人工校验。
3. 数据分析场景:60%企业认为最有影响力
60%的企业认为数据分析报告是AI Agent最具影响力的应用场景。
Suzano(苏扎诺,全球最大的商品浆生产商)运营着庞大的工业体系,工厂维护、修理和运营(MRO)需要频繁查询物料信息——螺丝、垫圈、螺母等。这些数据全部存在SAP系统中,但SAP的数据以分散的原始表形式存储,非技术人员根本无法直接查询。
员工想查一个物料,需要:
登录SAP系统
在复杂的界面中逐层导航
或者向数据团队提交查询请求,等待排期
这是一家3.5万人的企业,数据分散、访问门槛高、重复工作量大。
Suzano部署的AI Agent,会将员工用自然语言提出的问题,自动转换为SQL代码:
比如"我需要型号X的垫圈,哪个工厂有库存?"
Gemini Pro把问题翻译成SQL
SQL在BigQuery上执行,查询SAP物料数据
几秒内返回结果
查询耗时减少95%,分析师不再需要等数据团队排期,自己问Agent就能拿到初步结果。
逻辑很明确,数据分析AI Agent之所以能够广泛应用,与客服场景一致:
问的问题类型是收敛的,查询逻辑是可复用的,产出物有明确的质量标准。
区别在于,数据分析的产出物是决策参考,对准确性的要求更高。
4. IT运维与安全:40%的稳定落地
IT运维场景的采用率是40%,安全运营更高,采用率达到46%。
eSentire是一家安全运营公司(Atlas安全运营平台,提供暴露管理、托管检测与响应、事件响应等服务)。
eSentire的SOC(安全运营中心)分析师每次威胁调查平均需要5小时。流程包括:
收集初始威胁指标
形成调查假设
动态选择和执行取证工具
从多个来源收集证据
关联不同安全事件
综合分析得出结论
他们的AI Agent在部署后用1,000个真实调查案例进行了严格验证,得到以下结果:
总结这4个高频场景,不难发现这样一个规律:
ROI最高的场景的共同特征——高重复、有数据、流程标准、可量化。
二、不得不正视的现实:AI Agent的落地门槛,比想象中高
前文报告给出的“nearly half”的严峻现实可能仍显乐观。
事实上,我们在大量企业落地AI时,会发现一个更加严峻的现实:近90% 的企业AI Agent项目,POC阶段表现出色,规模化生产问题频出。
卡住的原因可以分成三类:
第一层:技术债务
数据质量差是头号拦路虎。
AI Agent的输出质量高度依赖输入数据的质量。
历史数据混乱、格式不统一、缺失率高、更新不及时——这些问题在POC阶段往往被绕过,用干净的小数据集演示,效果很好看。但一旦要对接真实业务,数据问题全部暴露。
工程能力不足是第二道坎。
把一个AI Agent跑起来不难,但要做到稳定、可监控、可回滚、可扩展,需要完整的工程体系。LLMOps流程、Prompt版本管理、输出质量监控、异常处理机制、与现有系统的集成——这些东西是AI Agent的"基础设施",没有的话小打小闹可以,出问题就是大问题。
历史系统难对接是第三关。
很多企业的核心业务系统是十年前甚至二十年前建的,接口文档不全,权限体系老旧,没有标准API。AI Agent要跟这些系统对接,往往需要大量的定制开发,周期长、风险高、不确定性大。
第二层:组织阻力
技术问题可以靠钱和人才解决,组织问题更难。
没有明确业务目标是失败的首要根因。
很多企业上AI Agent的动机是"别人都在做",或者"领导想试试"。没有回答一个基本问题:这个Agent要解决什么具体业务问题,衡量的指标是什么,ROI怎么算。没有明确目标的AI Agent项目,很容易变成"技术演示很炫酷,业务价值看不见"。
缺乏数据管理能力是第二个根因。
AI Agent能不能用好,50%取决于模型能力,50%取决于数据质量。数据在哪里、谁负责更新、谁有权访问、质量谁负责——这些问题没有答案,AI Agent就是在沙滩上建楼。
组织变革阻力是第三个根因。
AI Agent上岗,意味着某些岗位的工作方式要变,某些人的价值要重新定义。
有些企业里,老员工抵制新系统不是因为不懂,而是因为感受到威胁。
有些管理者担心Agent效率太高,暴露团队冗余。
这种阻力不会出现在项目文档里,但它真实存在,而且往往致命。
Capgemini的数据显示,71%的企业面临AI人才与文化适配机制的缺失。
不是缺会用Agent的人,是缺能把Agent融入现有组织运作的人。
第三层:过高过快的预期
POC阶段,Agent在干净的数据集上演示,效果好、成本低、速度快的结论很容易得出。
但POC阶段的成功不等于规模化成功。
数据和标注过的数据是两回事。演示场景和真实场景是两回事。少量用户和大量用户是两回事。技术可行和商业可行是两回事。
落到现实层面,对组织韧性、耐心和定力的考验才正式开始。
三、成功的企业,有哪些共性?
80%的企业已经赚到钱,90%的项目卡在路上。问题很显然不在于"能不能成",而在于"怎么才能成"。
成功的企业,有哪些共性?
分层治理:不是所有任务都适合Agent
一个关键的认知框架是把任务分层,而不是一刀切。
第一层:确定性任务,Agent独立完成。
规则明确、输入标准化、容错空间大的任务,Agent可以直接处理,不需要人介入。比如客服的常见问题回答、数据查询的SQL生成、定期报告的模板化生成。这类任务占大多数,而且自动化价值最高。
第二层:辅助决策任务,Agent提案,人审批。
输入复杂、有多种可行路径、输出需要人工判断的任务,Agent做初稿,人做最终决策。比如合同条款的风险评估、投资报告的初稿生成、市场分析的初步结论。Agent的价值是提升效率,人守住质量关。
第三层:复杂任务,人不放手。
涉及多方利益、没有明确对错、需要高度责任承担的任务,Agent可以辅助研究,但决策权留在人手里。战略决策、重大人事任命、敏感合规判断——这类任务不适合交给Agent,不是因为技术做不到,而是因为权责边界不清晰。
核心逻辑很简单:让Agent做它擅长的事,让人做他应该做的事。
分阶段落地:0到12个月的路径
成功企业的另一个共性是把落地周期拉长,分阶段推进,而不是一口气全部上线。
准备期:0到3个月。
这个阶段做三件事:选场景、定指标、建基础。
选场景的原则前面提过——高重复、数据已有、流程标准。不要一上来就做最复杂的场景,先找ROI最容易算清楚的地方切入。
定指标要具体:不是"提升效率",而是"响应时间从X缩短到Y"或者"人力成本降低Z%"。没有量化指标,就没有验收标准。
建基础包括数据治理、权限体系、监控告警。宁可慢一点,也不要在沙子上盖楼。
试点期:3到6个月。
选定一个场景、一个部门、一条业务线,做完整闭环的试点。不是做演示,是真的上线、真的用、真的考核。
试点期间最重要的是收集真实反馈:Agent哪里做得好、哪里容易出错、用户有什么不满。这些反馈会决定规模化方向。
规模化期:6到12个月。
试点跑通后,逐步扩展到更多场景和部门。规模化不是简单复制,而是根据不同场景调整Agent配置。有些场景可以复用,有些场景需要重新训练或配置。
这个阶段另一个重点是建立内部能力——培养能维护、优化、扩展Agent的团队,而不是一直依赖外部供应商。
说在最后
AI Agent已经过了"要不要做"的阶段。80%的正向ROI说明这件事值得投入,但90%的卡点说明它远没到"随便做都能成"的地步。
模型能力的上限在不断突破,但能把模型用好的企业,永远是那些基础工作做得扎实、落地路径规划清晰、对失败有准备的团队。
分层治理做好了,分阶段推进落地,选对切入场景——做到这三点,成功,没有想象中那么远。

你好,这里是诚实森林,欢迎关注,欢迎私信~
夜雨聆风