如果你这两年关注 AI,应该很容易形成一个印象:AI Agent 最热的地方,好像就是写代码。
Cursor、Replit、Lovable,各种“几句话生成一个应用”的演示,把 Agent 推到了台前。很多人第一次认真理解 Agent,也不是从论文开始,而是从“它居然能帮我改代码、跑测试、修 bug”开始。
这当然重要。
但如果只盯着编程工具,我们可能会看窄这件事。
最近 36 氪转述 CB Insights 的一份 AI Agent 报告,里面有几个信号很值得拿出来聊:AI Agent 在短短两年里,已经从实验品变成企业优先事项;从 2023 年以来,企业财报电话中提到 Agent 的次数增加了 10 倍;2025 年投融资交易数量排名前 10 的科技细分赛道里,有 5 个和 AI Agent 直接相关。
这说明 Agent 已经不只是“开发者玩具”了。
更大的变化正在发生在后台:客服、销售、IT 支持、支付、数据权限、监控治理,以及各种行业流程。
换句话说,写代码只是第一波浪。真正的战场,可能刚刚开始。
1. Agent 正从“副驾驶”变成“流程员工”
过去我们说 AI Copilot,重点往往是“帮你”。
帮你写一段文案,帮你补一段代码,帮你总结一份材料。它像一个坐在旁边的副驾驶,主驾驶还是人。
Agent 的想象空间更进一步。
它不只是回答问题,而是可以在一定边界内代表你执行任务:理解目标、拆步骤、调用工具、访问数据、记住上下文,必要时再回来请求确认。
这也是企业真正关心的部分。
企业不缺一个会聊天的 AI。它们缺的是能进入业务流程的系统:能不能处理工单?能不能跟 CRM、工单系统、知识库连接?能不能在出错前停下来?能不能留下记录,方便复盘和审计?
所以,Agent 的关键词正在从“聪明”变成“可交付”。
一个演示里很惊艳的 Agent,如果放进企业环境就乱点按钮、乱调接口、乱编结果,那就只能停在演示。
一个看起来没那么炫,但能稳定处理 30% 的重复工单,还能把不确定的问题交还给人,它反而更有商业价值。
2. 编程先火,但成本和风险已经露出来了
编程 Agent 先跑出来,并不奇怪。
代码天然结构化,反馈也清楚:能不能跑,测试过不过,bug 修没修掉,都比较容易验证。开发者又愿意尝鲜,所以这个赛道最早爆发。
CB Insights 提到,编程类 Agent 在商业化上遥遥领先。比如 Cursor 的年经常性收入被报道达到 5 亿美元,Replit 达到 1.5 亿美元。这个速度非常夸张。
但问题也随之出现。
推理模型让“氛围编程”变得流行:你给 AI 一个高层目标,它自己拆任务、写代码、改文件、跑命令。体验很爽,但背后意味着大量推理和 token 消耗。有分析提到,多步骤推理可能把输出 token 数量推高到原来的 20 倍左右。
这就会侵蚀利润。
当用户习惯了“多跑几轮、多试几次、多生成几个版本”,服务商的算力账单也在跟着涨。于是你会看到速率限制、涨价、套餐调整,甚至一些团队开始重新思考商业模式。
更现实的是,企业并不会只为“能写代码”买单。
它们更关心写完之后怎么办:有没有测试?有没有代码审查?有没有安全扫描?有没有合规检查?能不能接入现有研发流程?
所以编程 Agent 的下半场,可能不是更快地生成代码,而是把生成、测试、审查、修复、上线前检查串起来。
这也给其他行业提了个醒:Agent 不是越自由越好,能被验证、能被约束、能被纳入流程,才更值钱。
3. 语音 Agent 会先进入客服、销售和 IT 支持
如果说编程 Agent 是开发者先感受到的变化,那么语音 Agent 可能会让更多普通人直接遇到 Agent。
原因很简单:很多业务本来就是通过对话完成的。
客服要理解问题,查询订单,判断是否退款。销售要回答疑问,记录线索,安排跟进。IT 支持要排查账号、权限、设备、系统报错。
这些场景都有几个共同点:频率高、流程相对明确、数据来源固定、结果可以被检查。
这正适合 Agent 切入。
36 氪那篇文章里提到,企业正在为“通过对话而不是文本界面与 AI 互动”的未来布局。语音智能体有机会在客户服务、销售和 IT 支持里处理复杂对话,甚至实现较少人工干预。
但语音 Agent 的难点,不只是声音像不像真人。
真正的难点是:它听错了怎么办?用户情绪激动怎么办?遇到退款、赔偿、隐私、账号安全这些敏感事项怎么办?它什么时候必须转人工?每一步判断有没有记录?
这也是为什么语音智能体测试、模拟用户、对话评估会变得重要。
企业不会因为一个 Agent 声音温柔就放心把客户交给它。企业要的是稳定、可控、可追责。
所以语音 Agent 的爆发,看起来是交互方式变化,背后其实是整套服务流程的重做。
4. Agent 要做交易,支付和授权会变成基础设施
当 Agent 只是在旁边给建议,风险还比较小。
比如它告诉你哪款耳机值得买,最多是推荐错了。
但如果它开始代表你下单、续费、订酒店、买机票、调预算,事情就变了。
谁授权它花钱?最多能花多少?能不能分场景限制?出了错谁负责?商家怎么知道这个 Agent 真的代表你?平台怎么留下完整记录?
这些问题解决不了,Agent 就很难进入真正的商业闭环。
所以,AI 原生支付轨道、数字钱包、支出限制、授权协议,会成为 Agent 生态里的基础设施。
36 氪文章里也提到,Stripe 与 OpenAI 推出过代理式商业协议,目标是提供买家、AI Agent 和企业之间的标准化通信框架,让 Agent 能代表用户完成购买。
这件事的意义不只是“AI 能帮你购物”。
更大的意义是:Agent 开始从信息层走向交易层。
信息层解决“告诉我什么”。交易层解决“替我完成什么”。
一旦跨过这条线,Agent 就不再只是效率工具,而会进入金融、风控、身份、权限、审计这些更硬的领域。
这也是为什么我觉得,未来几年 Agent 最重要的竞争,未必都发生在模型参数上。
谁能把授权、支付、风控和体验做顺,谁才可能真正吃到交易场景的价值。
5. 数据权限,会成为企业软件的新战场
Agent 想要有用,必须接触数据。
一个销售 Agent,如果不知道客户历史沟通记录、合同状态、产品库存,就只能说空话。
一个 IT Agent,如果不能访问设备信息、权限系统、故障日志,也只能停留在“请你重启试试”。
一个企业知识 Agent,如果不能跨 Slack、飞书、Notion、邮件、网盘、CRM 检索,就很难回答真正的问题。
但数据不是想拿就能拿。
36 氪文章里举了一个例子:Salesforce 曾为 Slack API 设置新的速率限制,阻止外部应用批量访问或长期存储聊天数据。你可以把它理解成一个信号:当 Agent 变得越来越强,数据入口就会变得越来越敏感。
软件巨头会保护自己的数据地盘。初创公司需要跨系统访问数据。企业又希望自己拥有数据主动权。
这三方会形成新的拉扯。
未来企业买 Agent,可能不会只问“你模型用的是哪家”。它还会问:
你怎么接我的数据?
权限怎么分层?
员工离职后数据怎么处理?
调用记录能不能审计?
敏感信息会不会被带出系统?
这听起来很琐碎,但恰恰是 Agent 真正落地的门槛。
模型能力越强,数据边界越重要。
6. 可观测性和治理,会从配角变成刚需
很多人试 Agent,最怕的不是它不会做,而是它“看起来会做”。
它可能一本正经地编一个答案,可能调用错工具,可能在错误页面继续执行,可能把一个小错误扩散成一串错误。
在个人使用里,这叫体验不好。
在企业流程里,这叫运营事故。
所以 Agent 的监控、评估、回放、审计,会成为必备能力。
它每一步做了什么,为什么这么做,调用了哪个工具,拿到了什么数据,在哪个节点出现不确定性,有没有请求人工确认,这些都要能看见。
这就是所谓可观测性。
36 氪文章提到,AI Agent 的可靠性仍然是主要挑战,那些会失败、幻觉或行为不可预测的智能体,会立刻造成运营问题。市场上也已经出现面向 Agent 可观测性、评估和治理的早期融资。
这说明一个很现实的问题:
Agent 越接近真实工作,越不能只靠“相信它”。
人类员工需要培训、权限、绩效、复盘,Agent 也一样需要边界、监控、评估和责任链。
以后企业里可能会出现一种新岗位:不是直接使用 AI,而是管理一群 AI Agent,观察它们的表现,调参数、改流程、设权限、做复盘。
听起来没那么科幻,却很可能更接近真实未来。
普通人该怎么看这轮机会
如果把这些信号放在一起,会发现一个清晰变化:
AI Agent 的竞争,正在从“谁更聪明”转向“谁更能进入真实流程”。
对普通人来说,判断一个 Agent 机会,不妨看三个问题。
第一,它是不是高频重复?
客服问答、销售跟进、财务报销、代码审查、内容分发、数据整理,这些重复工作更容易先被 Agent 改造。
第二,它是不是需要连接多个系统?
如果一个任务只是在聊天框里生成一段文字,那门槛不高。如果它要连接邮箱、表格、CRM、知识库、支付、工单系统,价值就会上来。
第三,它是不是需要监督和合规?
越是有权限、有金钱、有客户、有数据的流程,越需要可控 Agent。这里会产生工具、服务、咨询、部署、运维、评测等一整套需求。
所以,对个人和小团队来说,不一定非要做一个通用 Agent 平台。
更现实的机会,可能是帮某个行业把 Agent 接进流程里:
帮小公司部署私有化知识库 Agent。
帮销售团队做线索整理和自动跟进。
帮内容团队做选题、资料整理、排版发布。
帮开发团队把代码生成、测试、审查、安全扫描串起来。
帮传统企业把客服和内部 IT 支持先自动化一部分。
这些事情听起来不如“改变世界”响亮,但它们更接近客户愿意付钱的地方。
写代码之后,Agent 才刚进场
AI Agent 最早让大众兴奋,是因为它会写代码。
但它真正改变工作,可能不是从代码编辑器结束,而是从一个个业务流程开始。
客服工单、销售线索、IT 运维、支付授权、数据治理、行业系统,这些地方没有那么适合做炫酷演示,却有真实预算、真实痛点,也有真实约束。
这就是 Agent 接下来最值得看的地方。
一个 Agent 成熟的标志,不是它说得多像人,也不是它在 demo 里跑得多快。
而是企业敢把哪一步工作交给它。
能交出去的那一步,才是真正的战场。
夜雨聆风