Agent 已经会接活,但还没到能放心托付。真正的门槛,不在模型,而在工作流、交易、成本和责任。
一、Agent 产品密集发布,为什么都在抢?
过去两年,AI 行业已经见过太多“发布潮”。模型发布、应用发布、插件发布,每一轮都像新纪元。
但最近这一轮 Agent 热度,有一个不一样的地方:它不再只讲“我能回答什么”,而是在讲“我能接管什么”。
编程助手、企业流程 Agent、支付 Agent、工厂运维 Agent、开源桌面 Agent、智能体开发 SDK、协议和规范工具,在短时间内密集出现。这里的“密集”不是一个严格市场统计口径,而是近期产品信号的集中呈现:Claude Code、Kimi Code、GitHub Spec Kit、Hivemind 这类工具在抢开发者工作流;OpenAI Agents SDK、Anthropic MCP 在抢 Agent 开发标准;支付宝 AI 支付、TokenPay 在补交易链路;NVIDIA、戴尔、联想等玩家则在承接推理和企业部署需求。它们看起来分散,却指向同一个变化:AI 正在从聊天窗口,钻进真实工作流。
《科创板日报》在报道 AI 基础设施订单时引用的判断很直接:AI 使用模式正从“生成式查询”向“代理式行动”加速演进。戴尔在最近一个财季披露,AI 服务器收入同比暴涨 757%,达到 161 亿美元;当季 AI 相关订单 244 亿美元,积压 AI 服务器订单达到 513 亿美元。联想也披露,AI 相关收入同比增长 84%,占集团总收入比重升至 38%[1]。
这些数字表面上是服务器订单,背后其实是一个需要拆开的因果问题。服务器订单增长不能简单等同于 Agent 已经大规模部署,它也可能来自训练集群扩张、云厂商提前备货和传统 AIGC 推理需求。但如果 AI 从“回答问题”变成“持续执行任务”,它消耗的就不只是模型 API,而是服务器、电力、液冷、网络、企业系统集成和运维预算。也就是说,硬件订单更像 Agent 化需求的前置信号,而不是已被验证的结果。
所以,这轮 Agent 发布潮不是“又一批聊天机器人”。它更像 AI 产品化进入第二阶段。
第一阶段,产品争的是模型入口:谁回答得更准,谁生成得更快,谁多模态更强。第二阶段,产品争的是派活入口:谁能进入企业流程,谁能调用工具,谁能被授权,谁能验收结果,谁能在出错时留下审计链路。
换句话说,Agent 已经开始“能派活”。但距离“能托付”,还差一整套制度化基础设施。
二、从聊天到派活,中间隔着什么?
要理解这轮变化,先要把几个容易混在一起的词拆开。
Chatbot 是回答问题。你问,它答。
Copilot 是辅助操作。你写代码、做表、改文档,它在旁边补全、建议、生成草稿。
Agent 则更进一步:它会围绕一个目标,拆任务、调工具、读结果、再决定下一步。一个更准确的说法是 Agentic workflow:不是单个“聪明回复”,而是一串可执行、可检查、可回滚的任务流。
这就是“嘴炮”和“打工”的差别。
一个聊天机器人可以告诉你“应该如何修复 bug”。一个编程 Agent 要能打开仓库、读文件、改代码、跑测试、看报错、继续修。一个客服机器人可以回答退货规则。一个交易 Agent 要能识别用户意图、确认授权、调用商家接口、完成支付、处理失败和退款。
这也是为什么 Agent 产品开始同时长出三类“手脚”。
第一类是工具手脚。OpenAI 的 Function Calling、Agents SDK,Anthropic 的 Claude Code 和 MCP,都在解决同一个工程问题:模型如何安全地调用外部工具。OpenAI 更偏平台化,希望通过 SDK、沙箱、审批、追踪等能力,让开发者搭 Agent 系统更容易;Anthropic 则把 Claude Code 做成更完整的产品闭环,强调“收集上下文、采取行动、验证结果、重复”的循环[3][6]。
第二类是流程手脚。Agent 不只是调用一个 API,而是要嵌入企业流程。比如信贷审核要经过 KYC、资料核验、风险评分、审批留痕;工厂运维要连接设备状态、故障定位、工单系统和维修记录。这类流程不是“模型知道答案”就能解决,它需要把企业原本的人、系统、权限和验收标准重新接起来。
第三类是交易手脚。Agent 一旦从“建议你买”走到“帮你下单”,问题就完全变了:谁授权?花多少钱?商家怎么确认?用户怎么撤销?出了错谁负责?支付宝 AI 支付、AI 钱包和 TokenPay 这类案例之所以重要,不是因为支付本身新鲜,而是因为它把 Agent 从信息助手推向了经济行为参与者[2]。
所以,Agent 的产品化并不是“模型变聪明了”这一件事。它是模型能力、工作流接口、交易信任和硬件部署同时成熟到一个临界点。
这也是为什么很多产品会在同一时间爆发。
当模型能持续推理,工具协议开始标准化,企业愿意试点,支付和身份体系开始接入,服务器厂商看到新需求,Agent 才真正从 demo 变成产品。
三、巨头、开源和硬件厂商,各自在抢什么?
这场竞争看上去是 OpenAI、Anthropic、Kimi、GitHub、NVIDIA、支付宝等玩家同时下场。其实它们抢的不是同一块蛋糕。
OpenAI 和 Anthropic 抢的是 Agent 的上游入口。
OpenAI 的优势在于平台化。它通过模型、API、SDK、沙箱和开发者生态,试图让更多应用长在自己的底座上。它的逻辑像云平台:我给你基础设施,你来搭业务。它更关心的是开发者能不能快速拼出 Agent,多少工作流会接到自己的模型和工具链上。
Anthropic 的优势在于产品化和可靠性叙事。Claude Code 的关键不是“它也能写代码”,而是它让用户逐渐愿意把更长、更复杂的任务交给模型。Anthropic 在对 Agent 自主性的研究中提到,Claude Code 的最长运行会话时长在几个月内几乎翻倍,从不到 25 分钟增加到超过 45 分钟;更有经验的用户也更倾向于不审查每一个动作[3]。这类指标很有意思,因为它衡量的不是模型考试分数,而是人类愿意放手多久。
所以两家的差异不只是“开放”与“封闭”。OpenAI 更像在卖积木和施工规范,成功标志是生态里长出更多 Agent;Anthropic 更像在卖一个已经能上手干活的工位,成功标志是用户愿意把任务交给 Claude Code 跑得更久、更深。前者的风险是开发者生态热闹但落地质量参差不齐,后者的风险是产品体验更完整但可扩展边界取决于 Anthropic 自己的路线。
GitHub、Kimi、Hivemind 和各类编程 Agent 抢的是开发者工作流入口。
编程是 Agent 最先成熟的领域,不是偶然。代码天然结构化,有版本控制,有测试,有可回滚机制,有明确的验收标准。Agent 写错了可以跑测试,失败了可以看报错,再改。相比医疗诊断、金融投顾、法律建议,编程场景的“错误成本”和“验证机制”都更适合 Agent[4]。
这解释了为什么编程 Agent 爆发得最快。Claude Code、Codex 类产品、Kimi Code、GitHub 的规范化工具,本质上都在争夺同一个位置:未来开发者派活给 AI 的入口。
硬件厂商抢的是 Agent 的基础设施预算。
当 Agent 从偶尔问答变成持续行动,推理需求会大幅增加。训练阶段烧钱,大家已经熟悉;但 Agent 时代的推理也不便宜。一个能持续读文件、调用工具、生成代码、验证结果的 Agent,背后可能是大量 token、长上下文、并发任务和企业级部署。它的负载特征也不同于一次性问答:任务链越长,模型读取上下文、调用工具、等待外部系统返回、再验证结果的次数越多,推理成本和延迟都会被放大。
这就是戴尔、联想、NVIDIA 等厂商在 Agent 热潮中被重新定价的原因。AI 服务器、电力、液冷、机柜级交付、数据中心互联,不再只是模型训练的后勤,而是 Agent 商业化的硬地板[1]。不过,这里必须保留一层谨慎:当前服务器订单增长更多说明企业正在为 AI 推理能力预留基础设施,并不能直接证明 Agent 已经全面铺开。真正的验证信号,还要看企业级 Agent 的部署密度、任务完成率、API 调用结构和续费情况。
支付和交易平台抢的是 Agent 的商业闭环。
如果 Agent 只能帮你写一段话,它只是生产力工具。如果 Agent 能帮你完成一笔交易,它就进入了商业系统。支付宝相关报道提到,其 AI 支付基建已处理 3 亿笔交易,并通过 ACT 协议、AI 钱包、TokenPay 等能力支持智能体场景[2]。这个数字来自媒体报道口径,公开材料中没有进一步拆出统计周期、是否全部来自 AI 支付场景、以及通用智能体覆盖的计算方式,所以不能被直接理解为“Agent 已经贡献了 3 亿笔独立交易”,更适合用来说明支付基础设施已经开始承接 Agent 交易需求,而不是直接当作市场规模结论。它的价值在于:把“模型建议”变成“可确认、可授权、可结算”的行动。
这些玩家合在一起,才构成 Agent 的完整产业链。
模型厂商提供脑子,工具平台提供手,企业系统提供工作场,支付平台提供钱包,硬件厂商提供体力。任何一层缺失,Agent 都很难从“能演示”变成“能上岗”。
四、数字员工最难的不是聪明,而是算账
“AI Agent 会取代打工人”这个说法太顺口,也太粗糙。
企业真正关心的不是它像不像人,而是它值不值得雇。
这笔账至少有四层。
第一层是单位任务成本。
一个 Agent 完成任务,可能要消耗模型调用、上下文读取、工具执行、向量检索、日志存储、人工复核和失败重试。单次对话便宜,不代表完整任务便宜。尤其是长链条任务,模型每多走一步,成本和错误概率都会累积。
这也是为什么企业部署 Agent 后,常常会遇到一个尴尬问题:看起来自动化了,但费用上来了。优刻得董事长季昕华在接受采访时提到,企业老板有两大焦虑:员工是否真正用起来,以及用了以后成本上升但效率提升不明显;报道中还提到有公司每周 AI 花费六十多万元,每月近三百万元,效果尚未完全显现[1]。这里必须把它当成个案,而不是行业平均值:公开报道没有披露该公司的行业、规模、使用场景和费用结构,不能外推成“企业用 Agent 普遍每月花数百万元”。它的意义只在于提醒一件事:一旦进入高频调用、多人使用或私有化部署,AI 成本就会从“创新预算”进入老板的经营账本;至于金融、制造、客服等行业的典型成本,还要看任务频次、模型选择、部署方式和人工复核比例。
第二层是稳定性成本。
人类员工会犯错,但组织知道怎么管理人:培训、审批、抽检、追责。Agent 犯错时,如果没有日志、权限边界、回滚机制和人工兜底,错误就可能从一个任务扩散到业务流程。
Gartner 在 2025 年 6 月给过一个早期预警:到 2027 年底,超过 40% 的 Agentic AI 项目可能因成本高、商业价值不清或风控不足而被取消。这个数字不应被当作一年后的实时取消率,而应被当作一条风险线索:企业讨论 Agent 时,真正反复出现的问题仍是成本、价值和风控,而不是“模型会不会说话”[9]。这不是说 Agent 没价值,而是说很多项目会死在“能力之外”的问题上。
第三层是组织改造成本。
Agent 不是插进企业就能用。它需要数据治理、流程重构、权限配置、员工培训和评估标准。一些企业案例会强调 Agent 把审核、运维、客服等流程从几十分钟压缩到几分钟甚至更短[8],但这些收益并不只来自模型,背后往往有流程梳理、系统接入和场景约束。
如果企业只买一个“通用 Agent”,却不改流程、不整理数据、不设置验收标准,它很容易变成另一个昂贵的聊天窗口。
第四层是责任成本。
这可能是 Agent 真正进入核心业务前最硬的门槛。
一个人类员工做错事,企业有劳动关系、岗位职责、审批制度和追责流程。一个 Agent 做错事,责任如何分配?模型厂商、应用开发者、企业客户、最终用户、支付平台、商家,谁承担哪一段?
这也是支付 Agent 和企业 Agent 的关键差别。写代码出错可以回滚,客服回答错了可以补救,但 Agent 自动付款、自动审批、自动调度设备,就必须提前定义授权边界和责任链条。
所以,“Agent 会不会取代打工人”不是一个足够好的问题。
更准确的问题是:哪些工作已经被拆成可授权、可执行、可验收、可追责的任务?这些任务才最先被 Agent 接管。
换句话说,AI 最先替代的不是“人”,而是组织里那些已经足够标准化、可验证、低风险的动作。
人类岗位的变化,也不会简单变成“消失”。更可能是重心迁移:从重复执行,转向定义目标、监督过程、验收结果和约束 Agent。
拿客服运营举例,Agent 可以先接管知识库检索、工单分类、标准回复生成、退款规则校验这些动作;但什么客户算高风险、哪些投诉需要升级、服务口径要不要调整、异常案例如何复盘,仍然需要人来定义目标和验收结果。再看设备运维:Agent 可以读取传感器异常、比对历史故障、生成工单和推荐备件,但停不停产线、是否召回某批设备、维修责任算供应商还是厂内流程,仍然要由人和制度判断。信贷审核也是类似:资料核验、字段比对、风险提示可以交给 Agent,但授信策略、异常审批和责任签字不会自动消失。所谓岗位迁移,就是把人从“逐条处理”推向“设计规则、盯住异常、管理系统”。
五、开源能绕过巨头吗?能,但不是自动发生
每一轮 AI 基础设施变化,都会出现一个问题:开源能不能绕过闭源巨头?
Agent 时代,这个问题更复杂。
开源的机会是真实的。
DeepSeek、Qwen、Kimi 等开源或开放模型,让创业者和企业不必完全依赖闭源 API。开源桌面 Agent、开源编排框架、开放协议和本地部署工具,也在降低试错成本。比如阿里已公开披露累计开源超 300 个模型、衍生模型数量逾 17 万个,这说明开源不只是“便宜替代”,而是在开发者社区里形成了持续迭代和二次开发网络[5]。对于中国市场尤其如此:本地化部署、数据不出域、私有化交付、行业定制,都是开源生态更容易切入的地方[5][6]。在政务、金融、制造这类场景里,企业往往不只是问模型性能,而是问数据能不能留在本地、流程能不能按行业规则改、审计日志能不能满足合规要求。开源模型和本地化 Agent 工具的独特优势,正是在这些“不能直接接云端黑盒”的场景里放大。
开源在 Agent 里的第一层价值,是便宜。
第二层价值,是可控。企业可以改模型、改工具链、改部署方式,把 Agent 放进自己的系统和安全边界里。
第三层价值,是快。开源社区可以围绕具体场景快速试错,比如桌面操作、代码生成、浏览器自动化、数据分析、企业知识库。闭源产品往往要等平台开放接口和官方路线图,开源团队则可以先把浏览器控制、文件读写、企业知识库检索、私有模型接入这些模块拼起来,在小场景里快速验证“能不能跑通”。比如 OpenClaw、CoPaw 这类开源或开放 Agent 工具的价值,不在于一开始就替代 Claude Code,而在于开发者可以把它们拆开、改造、接入自己的模型和业务系统[6]。这类速度不一定立刻带来大规模收入,但能帮助创业团队更快找到可交付场景。
如果只看局部场景,开源确实可能形成独立生态。比如一个制造企业只需要本地设备巡检 Agent,一个银行只需要内部知识库和审批流 Agent,一个政务客户只要求数据不出域、日志可审计、模型可私有化部署,那么“开源模型 + 本地工具链 + 服务商交付”就可能比闭源通用平台更合适。它不一定赢在通用智能,而是赢在可控、可改、可交付。
但这些优势不等于开源会自然形成完整闭环。
因为 Agent 的壁垒未必在模型本身。
第一个壁垒是数据。真正能干活的 Agent,需要懂企业内部文档、流程、历史工单、客户记录和权限体系。这些数据不在开源社区里。
第二个壁垒是分发。闭源巨头掌握 ChatGPT、Claude、GitHub、Office、云平台等入口。Agent 如果要成为日常工作入口,分发位置非常关键。
第三个壁垒是信任。企业愿意让 Agent 看什么、改什么、提交什么、付款多少,不取决于模型是不是开源,而取决于权限、审计、合规和责任机制。
第四个壁垒是商业模式。开源项目能带来声量,但持续维护一个可靠 Agent 系统,需要模型推理成本、工程团队、客户支持和安全投入。智谱 CEO 张鹏曾提到,开源也需要通过企业版、商业 API 或云服务形成商业化路径[5]。Agent 生态同样如此。
所以,开源不是闭源巨头的简单替代品。它更像一把楔子:能撬开垂直场景、私有化部署和成本敏感市场,但要真正形成独立生态,还要补上数据、分发、交易和信任四块短板。
这也意味着,未来 Agent 市场未必是一家通吃。
对中国 AI 从业者来说,最现实的突围路径不是重新造一个全球通用入口,而是“开源模型 + 本地化部署 + 垂直场景”。开源模型降低底座成本,本地化部署解决数据和合规顾虑,垂直场景负责把行业流程、权限边界和验收标准做深。金融、政务、制造、客服这类场景,未必最适合全球通用 Agent 一把梭,反而更适合懂本地流程的人把 Agent 做成可交付方案。
更可能出现三层结构:通用模型和平台入口由少数巨头掌握;企业级编排、权限、审计和工作流由中间层软件厂商补齐;垂直行业 Agent 则由懂行业数据和流程的人做深。
六、从能派活到能托付,还差三道门
把过去几年的技术演进和最近的产品发布放在一起看,会得到一个更清楚的判断:Agent 的历史路径,正在从“能力证明”走向“制度证明”。
AutoGPT 时代证明的是:模型可以尝试自主规划。
Function Calling 和 MCP 证明的是:模型可以调用工具。
Claude Code、Codex、Kimi Code 这类产品证明的是:在编程等可验证场景里,Agent 已经能接一部分复杂任务。
支付宝 AI 支付、企业流程 Agent 和硬件订单证明的是:Agent 正在接入交易、企业流程和基础设施预算。
但这些还不等于它已经是可靠打工人。
真正的“打工人”,不是能做一次演示,而是能被组织稳定管理。它要过三道门。
第一道门,是可审计。
Agent 做了什么、为什么这么做、调用了哪些工具、看了哪些数据、谁给了权限、结果如何验证,都必须留下记录。没有审计,就没有企业级托付。
第二道门,是可授权。
不同任务需要不同权限。读文档、改代码、发邮件、下订单、付款、审批合同,风险完全不同。Agent 必须像员工一样有岗位边界,而不是拿到一个万能 token 就到处行动。
第三道门,是可计价。
企业最终会问:一个任务交给 Agent,成本是多少?比人便宜多少?比 SaaS 自动化强在哪里?失败率多少?复核成本多少?如果这些算不清,Agent 项目就会停在试点和演示。
这三道门,决定了 Agent 从“能派活”到“能托付”的距离。
对于普通读者,这意味着“AI 替代人”的故事要换一种看法。未来几年,最容易被 Agent 改造的,不一定是最复杂的岗位,而是最容易被拆成标准动作、最容易验收、最容易追责的流程。
对于创业者,机会也不一定在“做一个更通用的 Agent”。更现实的机会在两个地方:一是帮企业把流程变成 Agent 能执行的任务;二是帮 Agent 补上权限、审计、支付、评估、回滚这些基础设施[7]。
对于中国 AI 从业者,支付宝这类支付基础设施、产业场景、私有化部署和开源模型,会形成一个有本土特色的 Agent 落地路径。它不一定复制 OpenAI 或 Anthropic 的路线,而可能从更具体的交易、办公、制造、客服、政企流程里长出来。
七、接下来该看什么信号?
Agent 已经从“能聊”进入“能派活”。但它还没有普遍进入“能托付”。
接下来判断这轮热潮是不是可持续,不要只看发布了多少新产品,也不要只看模型分数。更应该看三个信号。
第一,真实付费场景是否扩大。
不是试点,不是 demo,不是免费流量,而是企业愿意持续付费,并能说清楚为什么付费。可以重点看三类指标:Claude Code、Codex、Kimi Code 这类编程 Agent 的付费留存和企业席位扩张;客服、营销、运维、信贷审核等垂直 Agent 的续费率;以及企业是否从“买工具”转向按结果、按任务或按流程付费。
第二,可审计工作流是否成为标配。
如果 Agent 产品开始普遍提供权限管理、审批流、日志、回滚、评估、人工复核和责任边界,它就不再只是“聪明工具”,而是在进入组织制度。可追踪的信号包括:OpenAI Agents SDK、Anthropic Claude Code/MCP、GitHub 规范化工具、企业低代码平台是否把权限、审计和回滚做成默认能力,而不是交给客户自己拼。
第三,单位任务成本是否下降。
这是最硬的指标。可以观察模型 API 价格、长上下文成本、企业私有化部署成本、Agent 任务失败率和人工复核比例是否同步下降。只要这些指标降不下来,大量项目就会停在“看起来很先进,但老板不续费”的阶段。
第四,责任归属是否被产品化。
真正可托付的 Agent,不能只在介绍页写“安全可靠”,而要把责任边界做进产品里:哪些动作必须人工确认,哪些动作可以自动执行,错误后由谁复核,日志保存多久,客户、模型厂商、应用开发者和平台之间如何分责。可观察的产品信号包括:Agents SDK 里的审批和追踪是否默认开启,Claude Code 这类编程 Agent 是否把权限、diff、测试和回滚做成固定流程,支付 Agent 是否在每次扣款前保留用户确认与商户凭证。如果这些规则开始出现在合同、控制台、审计报告和行业规范中,Agent 才算真正跨过“能托付”的门槛。
所以,AI Agent 从“嘴炮”进化为“打工人”了吗?
答案是:它已经学会接活,但还没完全学会承担责任。
这不是泼冷水。恰恰相反,这说明 Agent 的竞争才刚进入真正重要的阶段。过去大家比谁的模型更聪明,接下来要比谁能把聪明变成可审计、可授权、可支付、可计价的工作。
等到这套基础设施成熟,AI Agent 才不只是屏幕里的助手,而会成为组织里一个新的劳动力接口。
那一天,打工人的问题不会是“AI 会不会替代我”。
更现实的问题会是:我能不能成为那个会定义任务、验收结果、管理 Agent 的人。
参考文献
[1] AI Agent从“能聊天”到“会干活” 整机厂商订单爆发 (https://www.jwview.com/jingwei/html/m/06-06/673868.shtml)
[2] Agent经济最后一块版图,支付宝填上了 (https://finance.sina.cn/2026-05-27/detail-inhzikrs9307404.d.html)
[3] Measuring AI agent autonomy in practice | Anthropic (https://www.anthropic.com/news/measuring-agent-autonomy)
[4] How enterprises are building AI agents in 2026 | Claude (https://claude.com/blog/how-enterprises-are-building-ai-agents-in-2026)
[5] 鏖战2025年,大模型围着开源转 (https://www.thepaper.cn/newsDetail_forward_32254429)
[6] AI智能体加速落地 距离“放心放手”还有多远? (https://www.stdaily.com/web/gdxw/2026-03/16/content_486129.html)
[7] 当AI Agent蜕变为“新劳动力”,万亿级市场重构正式启幕 (https://www.jiemian.com/article/14233794.html)
[8] AI Agent元年启幕 赋能千行百业重塑产业新生态 (https://www.cnii.com.cn/gxxww/rmydb/202601/t20260123_709970.html)
[9] Gartner Predicts Over 40% of Agentic AI Projects Will Be Canceled by End of 2027 (https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027)
恭喜你完成今日份的 AI 进化!里程碑已达成:🚩
别忘了顺手解锁 "点赞+在看+转发" 隐藏成就。
记得点亮 星标,防止由于算法调皮导致咱们"走散"。
撤了,明天同一时间见!👋

夜雨聆风