AI Agent还不是打工人

Agent 已经会接活，但还没到能放心托付。真正的门槛，不在模型，而在工作流、交易、成本和责任。

一、Agent 产品密集发布，为什么都在抢？

过去两年，AI 行业已经见过太多“发布潮”。模型发布、应用发布、插件发布，每一轮都像新纪元。

但最近这一轮 Agent 热度，有一个不一样的地方：它不再只讲“我能回答什么”，而是在讲“我能接管什么”。

编程助手、企业流程 Agent、支付 Agent、工厂运维 Agent、开源桌面 Agent、智能体开发 SDK、协议和规范工具，在短时间内密集出现。这里的“密集”不是一个严格市场统计口径，而是近期产品信号的集中呈现：Claude Code、Kimi Code、GitHub Spec Kit、Hivemind 这类工具在抢开发者工作流；OpenAI Agents SDK、Anthropic MCP 在抢 Agent 开发标准；支付宝 AI 支付、TokenPay 在补交易链路；NVIDIA、戴尔、联想等玩家则在承接推理和企业部署需求。它们看起来分散，却指向同一个变化：AI 正在从聊天窗口，钻进真实工作流。

《科创板日报》在报道 AI 基础设施订单时引用的判断很直接：AI 使用模式正从“生成式查询”向“代理式行动”加速演进。戴尔在最近一个财季披露，AI 服务器收入同比暴涨 757%，达到 161 亿美元；当季 AI 相关订单 244 亿美元，积压 AI 服务器订单达到 513 亿美元。联想也披露，AI 相关收入同比增长 84%，占集团总收入比重升至 38%^[1]。

这些数字表面上是服务器订单，背后其实是一个需要拆开的因果问题。服务器订单增长不能简单等同于 Agent 已经大规模部署，它也可能来自训练集群扩张、云厂商提前备货和传统 AIGC 推理需求。但如果 AI 从“回答问题”变成“持续执行任务”，它消耗的就不只是模型 API，而是服务器、电力、液冷、网络、企业系统集成和运维预算。也就是说，硬件订单更像 Agent 化需求的前置信号，而不是已被验证的结果。

所以，这轮 Agent 发布潮不是“又一批聊天机器人”。它更像 AI 产品化进入第二阶段。

第一阶段，产品争的是模型入口：谁回答得更准，谁生成得更快，谁多模态更强。第二阶段，产品争的是派活入口：谁能进入企业流程，谁能调用工具，谁能被授权，谁能验收结果，谁能在出错时留下审计链路。

换句话说，Agent 已经开始“能派活”。但距离“能托付”，还差一整套制度化基础设施。

二、从聊天到派活，中间隔着什么？

要理解这轮变化，先要把几个容易混在一起的词拆开。

Chatbot 是回答问题。你问，它答。

Copilot 是辅助操作。你写代码、做表、改文档，它在旁边补全、建议、生成草稿。

Agent 则更进一步：它会围绕一个目标，拆任务、调工具、读结果、再决定下一步。一个更准确的说法是 Agentic workflow：不是单个“聪明回复”，而是一串可执行、可检查、可回滚的任务流。

这就是“嘴炮”和“打工”的差别。

一个聊天机器人可以告诉你“应该如何修复 bug”。一个编程 Agent 要能打开仓库、读文件、改代码、跑测试、看报错、继续修。一个客服机器人可以回答退货规则。一个交易 Agent 要能识别用户意图、确认授权、调用商家接口、完成支付、处理失败和退款。

这也是为什么 Agent 产品开始同时长出三类“手脚”。

第一类是工具手脚。OpenAI 的 Function Calling、Agents SDK，Anthropic 的 Claude Code 和 MCP，都在解决同一个工程问题：模型如何安全地调用外部工具。OpenAI 更偏平台化，希望通过 SDK、沙箱、审批、追踪等能力，让开发者搭 Agent 系统更容易；Anthropic 则把 Claude Code 做成更完整的产品闭环，强调“收集上下文、采取行动、验证结果、重复”的循环^[3]^[6]。

第二类是流程手脚。Agent 不只是调用一个 API，而是要嵌入企业流程。比如信贷审核要经过 KYC、资料核验、风险评分、审批留痕；工厂运维要连接设备状态、故障定位、工单系统和维修记录。这类流程不是“模型知道答案”就能解决，它需要把企业原本的人、系统、权限和验收标准重新接起来。

第三类是交易手脚。Agent 一旦从“建议你买”走到“帮你下单”，问题就完全变了：谁授权？花多少钱？商家怎么确认？用户怎么撤销？出了错谁负责？支付宝 AI 支付、AI 钱包和 TokenPay 这类案例之所以重要，不是因为支付本身新鲜，而是因为它把 Agent 从信息助手推向了经济行为参与者^[2]。

所以，Agent 的产品化并不是“模型变聪明了”这一件事。它是模型能力、工作流接口、交易信任和硬件部署同时成熟到一个临界点。

这也是为什么很多产品会在同一时间爆发。

当模型能持续推理，工具协议开始标准化，企业愿意试点，支付和身份体系开始接入，服务器厂商看到新需求，Agent 才真正从 demo 变成产品。

三、巨头、开源和硬件厂商，各自在抢什么？

这场竞争看上去是 OpenAI、Anthropic、Kimi、GitHub、NVIDIA、支付宝等玩家同时下场。其实它们抢的不是同一块蛋糕。

OpenAI 和 Anthropic 抢的是 Agent 的上游入口。

OpenAI 的优势在于平台化。它通过模型、API、SDK、沙箱和开发者生态，试图让更多应用长在自己的底座上。它的逻辑像云平台：我给你基础设施，你来搭业务。它更关心的是开发者能不能快速拼出 Agent，多少工作流会接到自己的模型和工具链上。

Anthropic 的优势在于产品化和可靠性叙事。Claude Code 的关键不是“它也能写代码”，而是它让用户逐渐愿意把更长、更复杂的任务交给模型。Anthropic 在对 Agent 自主性的研究中提到，Claude Code 的最长运行会话时长在几个月内几乎翻倍，从不到 25 分钟增加到超过 45 分钟；更有经验的用户也更倾向于不审查每一个动作^[3]。这类指标很有意思，因为它衡量的不是模型考试分数，而是人类愿意放手多久。

所以两家的差异不只是“开放”与“封闭”。OpenAI 更像在卖积木和施工规范，成功标志是生态里长出更多 Agent；Anthropic 更像在卖一个已经能上手干活的工位，成功标志是用户愿意把任务交给 Claude Code 跑得更久、更深。前者的风险是开发者生态热闹但落地质量参差不齐，后者的风险是产品体验更完整但可扩展边界取决于 Anthropic 自己的路线。

GitHub、Kimi、Hivemind 和各类编程 Agent 抢的是开发者工作流入口。

编程是 Agent 最先成熟的领域，不是偶然。代码天然结构化，有版本控制，有测试，有可回滚机制，有明确的验收标准。Agent 写错了可以跑测试，失败了可以看报错，再改。相比医疗诊断、金融投顾、法律建议，编程场景的“错误成本”和“验证机制”都更适合 Agent^[4]。

这解释了为什么编程 Agent 爆发得最快。Claude Code、Codex 类产品、Kimi Code、GitHub 的规范化工具，本质上都在争夺同一个位置：未来开发者派活给 AI 的入口。

硬件厂商抢的是 Agent 的基础设施预算。

当 Agent 从偶尔问答变成持续行动，推理需求会大幅增加。训练阶段烧钱，大家已经熟悉；但 Agent 时代的推理也不便宜。一个能持续读文件、调用工具、生成代码、验证结果的 Agent，背后可能是大量 token、长上下文、并发任务和企业级部署。它的负载特征也不同于一次性问答：任务链越长，模型读取上下文、调用工具、等待外部系统返回、再验证结果的次数越多，推理成本和延迟都会被放大。

这就是戴尔、联想、NVIDIA 等厂商在 Agent 热潮中被重新定价的原因。AI 服务器、电力、液冷、机柜级交付、数据中心互联，不再只是模型训练的后勤，而是 Agent 商业化的硬地板^[1]。不过，这里必须保留一层谨慎：当前服务器订单增长更多说明企业正在为 AI 推理能力预留基础设施，并不能直接证明 Agent 已经全面铺开。真正的验证信号，还要看企业级 Agent 的部署密度、任务完成率、API 调用结构和续费情况。

支付和交易平台抢的是 Agent 的商业闭环。

如果 Agent 只能帮你写一段话，它只是生产力工具。如果 Agent 能帮你完成一笔交易，它就进入了商业系统。支付宝相关报道提到，其 AI 支付基建已处理 3 亿笔交易，并通过 ACT 协议、AI 钱包、TokenPay 等能力支持智能体场景^[2]。这个数字来自媒体报道口径，公开材料中没有进一步拆出统计周期、是否全部来自 AI 支付场景、以及通用智能体覆盖的计算方式，所以不能被直接理解为“Agent 已经贡献了 3 亿笔独立交易”，更适合用来说明支付基础设施已经开始承接 Agent 交易需求，而不是直接当作市场规模结论。它的价值在于：把“模型建议”变成“可确认、可授权、可结算”的行动。

这些玩家合在一起，才构成 Agent 的完整产业链。

模型厂商提供脑子，工具平台提供手，企业系统提供工作场，支付平台提供钱包，硬件厂商提供体力。任何一层缺失，Agent 都很难从“能演示”变成“能上岗”。

四、数字员工最难的不是聪明，而是算账

“AI Agent 会取代打工人”这个说法太顺口，也太粗糙。

企业真正关心的不是它像不像人，而是它值不值得雇。

这笔账至少有四层。

第一层是单位任务成本。

一个 Agent 完成任务，可能要消耗模型调用、上下文读取、工具执行、向量检索、日志存储、人工复核和失败重试。单次对话便宜，不代表完整任务便宜。尤其是长链条任务，模型每多走一步，成本和错误概率都会累积。

这也是为什么企业部署 Agent 后，常常会遇到一个尴尬问题：看起来自动化了，但费用上来了。优刻得董事长季昕华在接受采访时提到，企业老板有两大焦虑：员工是否真正用起来，以及用了以后成本上升但效率提升不明显；报道中还提到有公司每周 AI 花费六十多万元，每月近三百万元，效果尚未完全显现^[1]。这里必须把它当成个案，而不是行业平均值：公开报道没有披露该公司的行业、规模、使用场景和费用结构，不能外推成“企业用 Agent 普遍每月花数百万元”。它的意义只在于提醒一件事：一旦进入高频调用、多人使用或私有化部署，AI 成本就会从“创新预算”进入老板的经营账本；至于金融、制造、客服等行业的典型成本，还要看任务频次、模型选择、部署方式和人工复核比例。

第二层是稳定性成本。

人类员工会犯错，但组织知道怎么管理人：培训、审批、抽检、追责。Agent 犯错时，如果没有日志、权限边界、回滚机制和人工兜底，错误就可能从一个任务扩散到业务流程。

Gartner 在 2025 年 6 月给过一个早期预警：到 2027 年底，超过 40% 的 Agentic AI 项目可能因成本高、商业价值不清或风控不足而被取消。这个数字不应被当作一年后的实时取消率，而应被当作一条风险线索：企业讨论 Agent 时，真正反复出现的问题仍是成本、价值和风控，而不是“模型会不会说话”^[9]。这不是说 Agent 没价值，而是说很多项目会死在“能力之外”的问题上。

第三层是组织改造成本。

Agent 不是插进企业就能用。它需要数据治理、流程重构、权限配置、员工培训和评估标准。一些企业案例会强调 Agent 把审核、运维、客服等流程从几十分钟压缩到几分钟甚至更短^[8]，但这些收益并不只来自模型，背后往往有流程梳理、系统接入和场景约束。

如果企业只买一个“通用 Agent”，却不改流程、不整理数据、不设置验收标准，它很容易变成另一个昂贵的聊天窗口。

第四层是责任成本。

这可能是 Agent 真正进入核心业务前最硬的门槛。

一个人类员工做错事，企业有劳动关系、岗位职责、审批制度和追责流程。一个 Agent 做错事，责任如何分配？模型厂商、应用开发者、企业客户、最终用户、支付平台、商家，谁承担哪一段？

这也是支付 Agent 和企业 Agent 的关键差别。写代码出错可以回滚，客服回答错了可以补救，但 Agent 自动付款、自动审批、自动调度设备，就必须提前定义授权边界和责任链条。

所以，“Agent 会不会取代打工人”不是一个足够好的问题。

更准确的问题是：哪些工作已经被拆成可授权、可执行、可验收、可追责的任务？这些任务才最先被 Agent 接管。

换句话说，AI 最先替代的不是“人”，而是组织里那些已经足够标准化、可验证、低风险的动作。

人类岗位的变化，也不会简单变成“消失”。更可能是重心迁移：从重复执行，转向定义目标、监督过程、验收结果和约束 Agent。

拿客服运营举例，Agent 可以先接管知识库检索、工单分类、标准回复生成、退款规则校验这些动作；但什么客户算高风险、哪些投诉需要升级、服务口径要不要调整、异常案例如何复盘，仍然需要人来定义目标和验收结果。再看设备运维：Agent 可以读取传感器异常、比对历史故障、生成工单和推荐备件，但停不停产线、是否召回某批设备、维修责任算供应商还是厂内流程，仍然要由人和制度判断。信贷审核也是类似：资料核验、字段比对、风险提示可以交给 Agent，但授信策略、异常审批和责任签字不会自动消失。所谓岗位迁移，就是把人从“逐条处理”推向“设计规则、盯住异常、管理系统”。

五、开源能绕过巨头吗？能，但不是自动发生

每一轮 AI 基础设施变化，都会出现一个问题：开源能不能绕过闭源巨头？

Agent 时代，这个问题更复杂。

开源的机会是真实的。

DeepSeek、Qwen、Kimi 等开源或开放模型，让创业者和企业不必完全依赖闭源 API。开源桌面 Agent、开源编排框架、开放协议和本地部署工具，也在降低试错成本。比如阿里已公开披露累计开源超 300 个模型、衍生模型数量逾 17 万个，这说明开源不只是“便宜替代”，而是在开发者社区里形成了持续迭代和二次开发网络^[5]。对于中国市场尤其如此：本地化部署、数据不出域、私有化交付、行业定制，都是开源生态更容易切入的地方^[5]^[6]。在政务、金融、制造这类场景里，企业往往不只是问模型性能，而是问数据能不能留在本地、流程能不能按行业规则改、审计日志能不能满足合规要求。开源模型和本地化 Agent 工具的独特优势，正是在这些“不能直接接云端黑盒”的场景里放大。

开源在 Agent 里的第一层价值，是便宜。

第二层价值，是可控。企业可以改模型、改工具链、改部署方式，把 Agent 放进自己的系统和安全边界里。

第三层价值，是快。开源社区可以围绕具体场景快速试错，比如桌面操作、代码生成、浏览器自动化、数据分析、企业知识库。闭源产品往往要等平台开放接口和官方路线图，开源团队则可以先把浏览器控制、文件读写、企业知识库检索、私有模型接入这些模块拼起来，在小场景里快速验证“能不能跑通”。比如 OpenClaw、CoPaw 这类开源或开放 Agent 工具的价值，不在于一开始就替代 Claude Code，而在于开发者可以把它们拆开、改造、接入自己的模型和业务系统^[6]。这类速度不一定立刻带来大规模收入，但能帮助创业团队更快找到可交付场景。

如果只看局部场景，开源确实可能形成独立生态。比如一个制造企业只需要本地设备巡检 Agent，一个银行只需要内部知识库和审批流 Agent，一个政务客户只要求数据不出域、日志可审计、模型可私有化部署，那么“开源模型 + 本地工具链 + 服务商交付”就可能比闭源通用平台更合适。它不一定赢在通用智能，而是赢在可控、可改、可交付。

但这些优势不等于开源会自然形成完整闭环。

因为 Agent 的壁垒未必在模型本身。

第一个壁垒是数据。真正能干活的 Agent，需要懂企业内部文档、流程、历史工单、客户记录和权限体系。这些数据不在开源社区里。

第二个壁垒是分发。闭源巨头掌握 ChatGPT、Claude、GitHub、Office、云平台等入口。Agent 如果要成为日常工作入口，分发位置非常关键。

第三个壁垒是信任。企业愿意让 Agent 看什么、改什么、提交什么、付款多少，不取决于模型是不是开源，而取决于权限、审计、合规和责任机制。

第四个壁垒是商业模式。开源项目能带来声量，但持续维护一个可靠 Agent 系统，需要模型推理成本、工程团队、客户支持和安全投入。智谱 CEO 张鹏曾提到，开源也需要通过企业版、商业 API 或云服务形成商业化路径^[5]。Agent 生态同样如此。

所以，开源不是闭源巨头的简单替代品。它更像一把楔子：能撬开垂直场景、私有化部署和成本敏感市场，但要真正形成独立生态，还要补上数据、分发、交易和信任四块短板。

这也意味着，未来 Agent 市场未必是一家通吃。

对中国 AI 从业者来说，最现实的突围路径不是重新造一个全球通用入口，而是“开源模型 + 本地化部署 + 垂直场景”。开源模型降低底座成本，本地化部署解决数据和合规顾虑，垂直场景负责把行业流程、权限边界和验收标准做深。金融、政务、制造、客服这类场景，未必最适合全球通用 Agent 一把梭，反而更适合懂本地流程的人把 Agent 做成可交付方案。

更可能出现三层结构：通用模型和平台入口由少数巨头掌握；企业级编排、权限、审计和工作流由中间层软件厂商补齐；垂直行业 Agent 则由懂行业数据和流程的人做深。

六、从能派活到能托付，还差三道门

把过去几年的技术演进和最近的产品发布放在一起看，会得到一个更清楚的判断：Agent 的历史路径，正在从“能力证明”走向“制度证明”。

AutoGPT 时代证明的是：模型可以尝试自主规划。

Function Calling 和 MCP 证明的是：模型可以调用工具。

Claude Code、Codex、Kimi Code 这类产品证明的是：在编程等可验证场景里，Agent 已经能接一部分复杂任务。

支付宝 AI 支付、企业流程 Agent 和硬件订单证明的是：Agent 正在接入交易、企业流程和基础设施预算。

但这些还不等于它已经是可靠打工人。

真正的“打工人”，不是能做一次演示，而是能被组织稳定管理。它要过三道门。

第一道门，是可审计。

Agent 做了什么、为什么这么做、调用了哪些工具、看了哪些数据、谁给了权限、结果如何验证，都必须留下记录。没有审计，就没有企业级托付。

第二道门，是可授权。

不同任务需要不同权限。读文档、改代码、发邮件、下订单、付款、审批合同，风险完全不同。Agent 必须像员工一样有岗位边界，而不是拿到一个万能 token 就到处行动。

第三道门，是可计价。

企业最终会问：一个任务交给 Agent，成本是多少？比人便宜多少？比 SaaS 自动化强在哪里？失败率多少？复核成本多少？如果这些算不清，Agent 项目就会停在试点和演示。

这三道门，决定了 Agent 从“能派活”到“能托付”的距离。

对于普通读者，这意味着“AI 替代人”的故事要换一种看法。未来几年，最容易被 Agent 改造的，不一定是最复杂的岗位，而是最容易被拆成标准动作、最容易验收、最容易追责的流程。

对于创业者，机会也不一定在“做一个更通用的 Agent”。更现实的机会在两个地方：一是帮企业把流程变成 Agent 能执行的任务；二是帮 Agent 补上权限、审计、支付、评估、回滚这些基础设施^[7]。

对于中国 AI 从业者，支付宝这类支付基础设施、产业场景、私有化部署和开源模型，会形成一个有本土特色的 Agent 落地路径。它不一定复制 OpenAI 或 Anthropic 的路线，而可能从更具体的交易、办公、制造、客服、政企流程里长出来。

七、接下来该看什么信号？

Agent 已经从“能聊”进入“能派活”。但它还没有普遍进入“能托付”。

接下来判断这轮热潮是不是可持续，不要只看发布了多少新产品，也不要只看模型分数。更应该看三个信号。

第一，真实付费场景是否扩大。

不是试点，不是 demo，不是免费流量，而是企业愿意持续付费，并能说清楚为什么付费。可以重点看三类指标：Claude Code、Codex、Kimi Code 这类编程 Agent 的付费留存和企业席位扩张；客服、营销、运维、信贷审核等垂直 Agent 的续费率；以及企业是否从“买工具”转向按结果、按任务或按流程付费。

第二，可审计工作流是否成为标配。

如果 Agent 产品开始普遍提供权限管理、审批流、日志、回滚、评估、人工复核和责任边界，它就不再只是“聪明工具”，而是在进入组织制度。可追踪的信号包括：OpenAI Agents SDK、Anthropic Claude Code/MCP、GitHub 规范化工具、企业低代码平台是否把权限、审计和回滚做成默认能力，而不是交给客户自己拼。

第三，单位任务成本是否下降。

这是最硬的指标。可以观察模型 API 价格、长上下文成本、企业私有化部署成本、Agent 任务失败率和人工复核比例是否同步下降。只要这些指标降不下来，大量项目就会停在“看起来很先进，但老板不续费”的阶段。

第四，责任归属是否被产品化。

真正可托付的 Agent，不能只在介绍页写“安全可靠”，而要把责任边界做进产品里：哪些动作必须人工确认，哪些动作可以自动执行，错误后由谁复核，日志保存多久，客户、模型厂商、应用开发者和平台之间如何分责。可观察的产品信号包括：Agents SDK 里的审批和追踪是否默认开启，Claude Code 这类编程 Agent 是否把权限、diff、测试和回滚做成固定流程，支付 Agent 是否在每次扣款前保留用户确认与商户凭证。如果这些规则开始出现在合同、控制台、审计报告和行业规范中，Agent 才算真正跨过“能托付”的门槛。

所以，AI Agent 从“嘴炮”进化为“打工人”了吗？

答案是：它已经学会接活，但还没完全学会承担责任。

这不是泼冷水。恰恰相反，这说明 Agent 的竞争才刚进入真正重要的阶段。过去大家比谁的模型更聪明，接下来要比谁能把聪明变成可审计、可授权、可支付、可计价的工作。

等到这套基础设施成熟，AI Agent 才不只是屏幕里的助手，而会成为组织里一个新的劳动力接口。

那一天，打工人的问题不会是“AI 会不会替代我”。

更现实的问题会是：我能不能成为那个会定义任务、验收结果、管理 Agent 的人。

参考文献

[1] AI Agent从“能聊天”到“会干活” 整机厂商订单爆发 (https://www.jwview.com/jingwei/html/m/06-06/673868.shtml)

[2] Agent经济最后一块版图，支付宝填上了 (https://finance.sina.cn/2026-05-27/detail-inhzikrs9307404.d.html)

[3] Measuring AI agent autonomy in practice | Anthropic (https://www.anthropic.com/news/measuring-agent-autonomy)
[4] How enterprises are building AI agents in 2026 | Claude (https://claude.com/blog/how-enterprises-are-building-ai-agents-in-2026)

[5] 鏖战2025年，大模型围着开源转 (https://www.thepaper.cn/newsDetail_forward_32254429)

[6] AI智能体加速落地距离“放心放手”还有多远？ (https://www.stdaily.com/web/gdxw/2026-03/16/content_486129.html)

[7] 当AI Agent蜕变为“新劳动力”，万亿级市场重构正式启幕 (https://www.jiemian.com/article/14233794.html)

[8] AI Agent元年启幕赋能千行百业重塑产业新生态 (https://www.cnii.com.cn/gxxww/rmydb/202601/t20260123_709970.html)

[9] Gartner Predicts Over 40% of Agentic AI Projects Will Be Canceled by End of 2027 (https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027)

恭喜你完成今日份的 AI 进化！里程碑已达成：🚩

别忘了顺手解锁 "点赞+在看+转发" 隐藏成就。

记得点亮星标，防止由于算法调皮导致咱们"走散"。

撤了，明天同一时间见！👋