过去一年,AI Agent 的讨论重点还常常停留在“能不能自动完成任务”。但从 OpenAI Codex、GitHub Copilot 到 Figma AI credits 的一组新动作看,企业真正要关心的问题正在变化:
不是 Agent 能不能做事,而是企业能不能把 Agent 纳入采购、权限、成本、风控和审计体系。
这也是 AI Agent 从“个人效率工具”走向“企业生产系统”的关键分水岭。
Codex:从写代码,走向知识工作的“交付物生产系统”
OpenAI 对 Codex 的定位正在明显扩展。
根据 OpenAI 公布的信息,Codex 每周活跃用户已经超过 500 万。更值得注意的是,非开发者用户已经占到约 20%,并且增长速度是开发者用户的 3 倍以上。这意味着 Codex 不再只是程序员的编码助手,而是在进入分析师、市场、运营、设计、研究、投资、投行等知识工作场景。
OpenAI 新推出的角色插件也强化了这个方向:
• 数据分析插件:连接 Snowflake、Databricks Genie、Hex、Tableau 等工具,用于指标解释、报告和仪表盘; • 创意生产插件:连接 Figma、Canva、Shutterstock、Picsart、Fal 等工具,把 brief 转成可评审资产; • 销售插件:连接 Salesforce、HubSpot、Slack、Outreach 等系统,用于客户洞察、会前准备、跟进和记录更新; • 产品设计插件:把早期想法转成可评审原型,并能衔接 Figma、Canva 等工具; • 投资与投行业务插件:接入 Moody’s、FactSet、S&P、PitchBook 等信息源,辅助研究、估值和材料生产。
这批角色插件覆盖 62 个常用应用和 110 项技能。它释放出的信号很清楚:Agent 的企业价值,不只是“生成一段内容”,而是把企业已有工具、上下文和流程串起来,稳定地产出工作交付物。
对企业来说,这意味着 Agent 的采购对象会从“模型能力”转向“角色能力包”:分析岗买的是数据分析与报告能力,市场岗买的是创意生产能力,销售岗买的是客户推进能力。
Copilot:把 Agent 放进 SDK、自动化、沙箱和应用生态
如果说 Codex 的重点是“让更多角色用上 Agent”,GitHub Copilot 的一组更新则更像是在补齐企业落地的基础设施。
1. Copilot SDK GA:Agent 能力开始可嵌入
GitHub Copilot SDK 已经正式 GA。开发者可以把 Copilot 背后的 agentic engine 嵌入自己的应用、服务和开发工具中,获得规划、工具调用、文件编辑、流式输出、多轮会话等能力。
这件事的意义在于:企业不用每次都从零搭建 Agent 编排层,而是可以基于稳定 API,把 Agent 能力嵌入内部系统、CI/CD 工具、开发平台或客户产品。
SDK 还支持:
• 自定义工具和 MCP; • 细粒度系统提示词定制; • OpenTelemetry tracing; • GitHub OAuth、GitHub Apps、环境 token、BYOK 等认证方式; • 云端和远程会话; • tool use 前后、会话启动、MCP 调用、权限请求等 hook。
这些能力的共同指向是:Agent 不再只是一个聊天入口,而是可以被纳入企业已有软件工程体系的可编程组件。
2. Copilot cloud agent automations:Agent 开始进入定时任务和事件触发
Copilot cloud agent 新增 automations 后,可以按计划或响应仓库事件自动运行。例如:
• 自动给新 issue 分类; • 每晚检查 main 分支失败测试,尝试修复并提交 draft PR; • 每周生成 release notes 并发起 PR。
企业管理员可以配置触发条件、可用工具和模型。每个 automation 作用域限定在单个仓库,能读写代码、开 PR、更新 issue;模型 token 用量按创建者计费。
这就把 Agent 从“人唤起一次”推进到“流程自动运行”。但同时,企业也必须回答:谁创建?谁授权?能改什么?消耗多少?失败后谁负责?
3. Copilot sandbox:安全执行环境成为标配
GitHub 还发布了 Copilot 的本地和云端沙箱公开预览。
本地沙箱允许 Copilot 发起的 shell 命令在受限文件系统、网络和系统能力下执行;云端沙箱则提供由 GitHub 托管的隔离、临时 Linux 环境,并继承组织已有的 Copilot cloud agent 策略。
这说明企业部署 Agent 时,真正的瓶颈已经不只是模型效果,而是执行环境:
• 能不能限制 Agent 访问哪些文件? • 能不能控制网络访问? • 能不能把策略统一下发? • 能不能让多个任务并行运行但互不污染?
没有沙箱,Agent 越强,风险越大;有了沙箱,Agent 才可能进入更高频、更自动化的企业流程。
4. Agent apps:Agent 生态开始平台化
GitHub 还推出了 agent apps:来自合作伙伴的 AI agents 可以像 GitHub App 一样从 Marketplace 安装,并通过 issue 分配、PR 评论 @mention、Agents UI 提示词等入口进入工作流。
第一批 agent apps 来自 Amplitude、Bright Security、Endor Labs、LaunchDarkly、Miro、Sonar、PagerDuty、Packfiles、Octopus Deploy 等。
这意味着 Agent 生态会从“单个大模型助手”走向“平台化应用市场”:安全 Agent、部署 Agent、监控 Agent、产品分析 Agent,都可以在同一个开发工作流里被调用和治理。
Figma AI credits:设计 AI 开始进入预算和成本管理
Figma 的 AI credits 则从另一个角度说明同一件事:AI 能力要进入企业,最终必须被计量、分配和管控。
Figma AI 采用 credits 体系。不同计划和席位包含不同月度额度:
• Starter:每日 150 credits,上限 500 credits/月; • Professional full seat:3,000 credits/月; • Organization full seat:3,500 credits/月; • Enterprise full seat:4,250 credits/月; • Dev、Collab、View 等席位通常为 500 credits/月。
超出席位额度后,管理员可以购买额外 credits:
• ongoing subscription:按月购买计划级 credits 池; • pay-as-you-go:按实际超额使用计费,当前费率为 0.03 美元/credit。
管理员还可以控制哪些用户能使用付费 credits,Enterprise 计划还支持按 billing group 管理。
这套机制说明,设计场景里的 AI 不再是“免费试用的小功能”,而是开始进入企业预算、席位、权限和用量治理。
企业落地看的是“三个可”
Codex、Copilot、Figma AI credits 看似处在不同领域:知识工作、软件研发、设计协作。但它们共同指向同一个阶段:AI Agent 进入“可采购、可治理、可审计”的企业落地周期。
1. 可采购:从模型订阅到岗位能力包
企业不会只为“一个聪明模型”长期买单,而是会为可落地的岗位能力买单:
• 分析岗位:数据解释、报表、仪表盘; • 研发岗位:代码修改、测试修复、PR 生成; • 设计岗位:素材生成、原型探索、设计资产生产; • 销售岗位:客户洞察、会议准备、跟进闭环。
采购对象会越来越接近业务结果,而不是模型参数。
2. 可治理:权限、沙箱、策略和预算成为默认要求
当 Agent 能读文件、跑命令、改代码、开 PR、调用外部工具时,治理就不是可选项。
企业至少需要四类治理能力:
• 身份治理:谁在调用 Agent?代表谁执行? • 权限治理:Agent 能访问哪些工具、文件和数据? • 执行治理:命令在哪里跑?是否隔离?是否有策略边界? • 成本治理:一次任务消耗多少 token、credits 或计算资源?
Copilot 的 SDK hook、OpenTelemetry tracing、沙箱、cloud agent policy,Figma 的 credits 与管理员控制,都是在补这块基础设施。
3. 可审计:Agent 的每一步都要能复盘
企业真正敢把 Agent 放进流程,前提是能审计:
• Agent 接收了什么指令; • 调用了哪些工具; • 修改了哪些文件; • 产生了哪些费用; • 谁批准了敏感操作; • 失败后如何回滚和追责。
未来企业评估 Agent 产品,很可能不只看“回答得好不好”,而是看日志、链路追踪、权限边界、成本账单和失败恢复机制是否完整。
结语
AI Agent 的上半场,是“看它能不能干活”。
下半场,是“企业能不能放心让它干活”。
Codex 的角色插件、Copilot 的 SDK/自动化/沙箱/agent apps、Figma 的 AI credits,分别从能力、执行环境和成本治理三个方向,补齐了企业落地的关键拼图。
真正值得关注的趋势是:AI Agent 正在从单点效率工具,变成企业可以采购、治理、审计的生产力基础设施。
而这,才是 Agent 进入企业主流程的开始。
夜雨聆风