AI Agent 的 6 个新信号:写代码之后,真正的战场来了

如果你这两年关注 AI，应该很容易形成一个印象：AI Agent 最热的地方，好像就是写代码。

Cursor、Replit、Lovable，各种“几句话生成一个应用”的演示，把 Agent 推到了台前。很多人第一次认真理解 Agent，也不是从论文开始，而是从“它居然能帮我改代码、跑测试、修 bug”开始。

这当然重要。

但如果只盯着编程工具，我们可能会看窄这件事。

最近 36 氪转述 CB Insights 的一份 AI Agent 报告，里面有几个信号很值得拿出来聊：AI Agent 在短短两年里，已经从实验品变成企业优先事项；从 2023 年以来，企业财报电话中提到 Agent 的次数增加了 10 倍；2025 年投融资交易数量排名前 10 的科技细分赛道里，有 5 个和 AI Agent 直接相关。

这说明 Agent 已经不只是“开发者玩具”了。

更大的变化正在发生在后台：客服、销售、IT 支持、支付、数据权限、监控治理，以及各种行业流程。

换句话说，写代码只是第一波浪。真正的战场，可能刚刚开始。

1. Agent 正从“副驾驶”变成“流程员工”

过去我们说 AI Copilot，重点往往是“帮你”。

帮你写一段文案，帮你补一段代码，帮你总结一份材料。它像一个坐在旁边的副驾驶，主驾驶还是人。

Agent 的想象空间更进一步。

它不只是回答问题，而是可以在一定边界内代表你执行任务：理解目标、拆步骤、调用工具、访问数据、记住上下文，必要时再回来请求确认。

这也是企业真正关心的部分。

企业不缺一个会聊天的 AI。它们缺的是能进入业务流程的系统：能不能处理工单？能不能跟 CRM、工单系统、知识库连接？能不能在出错前停下来？能不能留下记录，方便复盘和审计？

所以，Agent 的关键词正在从“聪明”变成“可交付”。

一个演示里很惊艳的 Agent，如果放进企业环境就乱点按钮、乱调接口、乱编结果，那就只能停在演示。

一个看起来没那么炫，但能稳定处理 30% 的重复工单，还能把不确定的问题交还给人，它反而更有商业价值。

2. 编程先火，但成本和风险已经露出来了

编程 Agent 先跑出来，并不奇怪。

代码天然结构化，反馈也清楚：能不能跑，测试过不过，bug 修没修掉，都比较容易验证。开发者又愿意尝鲜，所以这个赛道最早爆发。

CB Insights 提到，编程类 Agent 在商业化上遥遥领先。比如 Cursor 的年经常性收入被报道达到 5 亿美元，Replit 达到 1.5 亿美元。这个速度非常夸张。

但问题也随之出现。

推理模型让“氛围编程”变得流行：你给 AI 一个高层目标，它自己拆任务、写代码、改文件、跑命令。体验很爽，但背后意味着大量推理和 token 消耗。有分析提到，多步骤推理可能把输出 token 数量推高到原来的 20 倍左右。

这就会侵蚀利润。

当用户习惯了“多跑几轮、多试几次、多生成几个版本”，服务商的算力账单也在跟着涨。于是你会看到速率限制、涨价、套餐调整，甚至一些团队开始重新思考商业模式。

更现实的是，企业并不会只为“能写代码”买单。

它们更关心写完之后怎么办：有没有测试？有没有代码审查？有没有安全扫描？有没有合规检查？能不能接入现有研发流程？

所以编程 Agent 的下半场，可能不是更快地生成代码，而是把生成、测试、审查、修复、上线前检查串起来。

这也给其他行业提了个醒：Agent 不是越自由越好，能被验证、能被约束、能被纳入流程，才更值钱。

3. 语音 Agent 会先进入客服、销售和 IT 支持

如果说编程 Agent 是开发者先感受到的变化，那么语音 Agent 可能会让更多普通人直接遇到 Agent。

原因很简单：很多业务本来就是通过对话完成的。

客服要理解问题，查询订单，判断是否退款。销售要回答疑问，记录线索，安排跟进。IT 支持要排查账号、权限、设备、系统报错。

这些场景都有几个共同点：频率高、流程相对明确、数据来源固定、结果可以被检查。

这正适合 Agent 切入。

36 氪那篇文章里提到，企业正在为“通过对话而不是文本界面与 AI 互动”的未来布局。语音智能体有机会在客户服务、销售和 IT 支持里处理复杂对话，甚至实现较少人工干预。

但语音 Agent 的难点，不只是声音像不像真人。

真正的难点是：它听错了怎么办？用户情绪激动怎么办？遇到退款、赔偿、隐私、账号安全这些敏感事项怎么办？它什么时候必须转人工？每一步判断有没有记录？

这也是为什么语音智能体测试、模拟用户、对话评估会变得重要。

企业不会因为一个 Agent 声音温柔就放心把客户交给它。企业要的是稳定、可控、可追责。

所以语音 Agent 的爆发，看起来是交互方式变化，背后其实是整套服务流程的重做。

4. Agent 要做交易，支付和授权会变成基础设施

当 Agent 只是在旁边给建议，风险还比较小。

比如它告诉你哪款耳机值得买，最多是推荐错了。

但如果它开始代表你下单、续费、订酒店、买机票、调预算，事情就变了。

谁授权它花钱？最多能花多少？能不能分场景限制？出了错谁负责？商家怎么知道这个 Agent 真的代表你？平台怎么留下完整记录？

这些问题解决不了，Agent 就很难进入真正的商业闭环。

所以，AI 原生支付轨道、数字钱包、支出限制、授权协议，会成为 Agent 生态里的基础设施。

36 氪文章里也提到，Stripe 与 OpenAI 推出过代理式商业协议，目标是提供买家、AI Agent 和企业之间的标准化通信框架，让 Agent 能代表用户完成购买。

这件事的意义不只是“AI 能帮你购物”。

更大的意义是：Agent 开始从信息层走向交易层。

信息层解决“告诉我什么”。交易层解决“替我完成什么”。

一旦跨过这条线，Agent 就不再只是效率工具，而会进入金融、风控、身份、权限、审计这些更硬的领域。

这也是为什么我觉得，未来几年 Agent 最重要的竞争，未必都发生在模型参数上。

谁能把授权、支付、风控和体验做顺，谁才可能真正吃到交易场景的价值。

5. 数据权限，会成为企业软件的新战场

Agent 想要有用，必须接触数据。

一个销售 Agent，如果不知道客户历史沟通记录、合同状态、产品库存，就只能说空话。

一个 IT Agent，如果不能访问设备信息、权限系统、故障日志，也只能停留在“请你重启试试”。

一个企业知识 Agent，如果不能跨 Slack、飞书、Notion、邮件、网盘、CRM 检索，就很难回答真正的问题。

但数据不是想拿就能拿。

36 氪文章里举了一个例子：Salesforce 曾为 Slack API 设置新的速率限制，阻止外部应用批量访问或长期存储聊天数据。你可以把它理解成一个信号：当 Agent 变得越来越强，数据入口就会变得越来越敏感。

软件巨头会保护自己的数据地盘。初创公司需要跨系统访问数据。企业又希望自己拥有数据主动权。

这三方会形成新的拉扯。

未来企业买 Agent，可能不会只问“你模型用的是哪家”。它还会问：

你怎么接我的数据？

权限怎么分层？

员工离职后数据怎么处理？

调用记录能不能审计？

敏感信息会不会被带出系统？

这听起来很琐碎，但恰恰是 Agent 真正落地的门槛。

模型能力越强，数据边界越重要。

6. 可观测性和治理，会从配角变成刚需

很多人试 Agent，最怕的不是它不会做，而是它“看起来会做”。

它可能一本正经地编一个答案，可能调用错工具，可能在错误页面继续执行，可能把一个小错误扩散成一串错误。

在个人使用里，这叫体验不好。

在企业流程里，这叫运营事故。

所以 Agent 的监控、评估、回放、审计，会成为必备能力。

它每一步做了什么，为什么这么做，调用了哪个工具，拿到了什么数据，在哪个节点出现不确定性，有没有请求人工确认，这些都要能看见。

这就是所谓可观测性。

36 氪文章提到，AI Agent 的可靠性仍然是主要挑战，那些会失败、幻觉或行为不可预测的智能体，会立刻造成运营问题。市场上也已经出现面向 Agent 可观测性、评估和治理的早期融资。

这说明一个很现实的问题：

Agent 越接近真实工作，越不能只靠“相信它”。

人类员工需要培训、权限、绩效、复盘，Agent 也一样需要边界、监控、评估和责任链。

以后企业里可能会出现一种新岗位：不是直接使用 AI，而是管理一群 AI Agent，观察它们的表现，调参数、改流程、设权限、做复盘。

听起来没那么科幻，却很可能更接近真实未来。

普通人该怎么看这轮机会

如果把这些信号放在一起，会发现一个清晰变化：

AI Agent 的竞争，正在从“谁更聪明”转向“谁更能进入真实流程”。

对普通人来说，判断一个 Agent 机会，不妨看三个问题。

第一，它是不是高频重复？

客服问答、销售跟进、财务报销、代码审查、内容分发、数据整理，这些重复工作更容易先被 Agent 改造。

第二，它是不是需要连接多个系统？

如果一个任务只是在聊天框里生成一段文字，那门槛不高。如果它要连接邮箱、表格、CRM、知识库、支付、工单系统，价值就会上来。

第三，它是不是需要监督和合规？

越是有权限、有金钱、有客户、有数据的流程，越需要可控 Agent。这里会产生工具、服务、咨询、部署、运维、评测等一整套需求。

所以，对个人和小团队来说，不一定非要做一个通用 Agent 平台。

更现实的机会，可能是帮某个行业把 Agent 接进流程里：

帮小公司部署私有化知识库 Agent。

帮销售团队做线索整理和自动跟进。

帮内容团队做选题、资料整理、排版发布。

帮开发团队把代码生成、测试、审查、安全扫描串起来。

帮传统企业把客服和内部 IT 支持先自动化一部分。

这些事情听起来不如“改变世界”响亮，但它们更接近客户愿意付钱的地方。

写代码之后，Agent 才刚进场

AI Agent 最早让大众兴奋，是因为它会写代码。

但它真正改变工作，可能不是从代码编辑器结束，而是从一个个业务流程开始。

客服工单、销售线索、IT 运维、支付授权、数据治理、行业系统，这些地方没有那么适合做炫酷演示，却有真实预算、真实痛点，也有真实约束。

这就是 Agent 接下来最值得看的地方。

一个 Agent 成熟的标志，不是它说得多像人，也不是它在 demo 里跑得多快。

而是企业敢把哪一步工作交给它。

能交出去的那一步，才是真正的战场。