
AI 编程工具进入工作台阶段:Codex 与 Copilot 都在争夺 Agent 的日常入口
过去一年,AI 编程工具的主战场一直围绕模型能力:谁更会写代码,谁更懂仓库,谁能一次完成更长的任务。
但 2026 年 6 月 2 日,OpenAI 和 GitHub 几乎同时给出了另一个信号:下一阶段的竞争,重点不只是模型有多强,而是谁能把 Agent 放进日常工作流里,并让人类稳定地管理它的产出。
OpenAI 发布了 Codex 的新能力,强调 role-specific plugins、Sites 和 annotations;GitHub 则扩展 Copilot App 技术预览,并更新 Copilot CLI,加入 canvas、云端会话、云端自动化、定时提示、语音输入和 rubber duck 等能力。
这些功能看起来分散,实际指向同一个方向:AI 编程工具正在从“对话式助手”变成“可编排工作台”。
一、Codex 不再只围绕开发者
OpenAI 这次对 Codex 的定位很明确:Codex 起步于软件开发,但正在进入更多知识工作场景。
根据 OpenAI 6 月 2 日的官方发布,Codex 当前每周用户已超过 500 万;非开发者用户约占整体用户的 20%,并且增长速度超过开发者用户的 3 倍。OpenAI 同时推出了面向不同角色的插件、可分享的 Sites 预览,以及可以直接指向具体内容修改的 annotations。
这几个变化很关键。
插件解决的是“上下文从哪里来”的问题。分析师、市场团队、销售团队、产品设计团队并不总是从代码仓库开始工作,他们的上下文可能在 Salesforce、HubSpot、Slack、Google Docs、Coda、Figma、Tableau 或 Snowflake 里。Codex 如果要成为真正的工作入口,就必须理解这些工具里的业务语境。
Sites 解决的是“产出放在哪里”的问题。很多工作并不适合只落在一段聊天记录、一个 Markdown 文件或一张表格里。OpenAI 举的例子包括客户复盘页、财务模型场景规划器、产品发布资料中心。这类产物更像一个可以持续更新的轻量应用,而不是一次性文件。
Annotations 解决的是“如何修改”的问题。第一版内容生成出来之后,人类真正需要的是精确反馈:改这个导航栏字体、核对这条论断来源、把这张图表标签改清楚。注释式修改把反馈从“重新写一遍”变成“在具体对象上修补”。
这说明 Codex 的重点正在从“能不能生成代码”转向“能不能把工作对象接住,并持续迭代”。
二、GitHub Copilot App 把 Agent 工作变成可见对象
GitHub 在同一天扩展了 Copilot App 技术预览:现已面向已有 Copilot Pro、Pro+、Business 和 Enterprise 客户开放。
更值得关注的是新加入的 canvases。GitHub 把 canvas 描述为人和 Agent 共用的工作表面:Agent 可以更新 canvas,人类也可以在同一个表面上编辑、重排、批准或调整方向。
这不是单纯的 UI 改版,而是 Agent 产品形态的一次转向。
过去我们和 AI 编程工具协作,经常要在聊天记录里追踪它做了什么:它改了哪个文件,当前计划到哪一步,哪些测试失败,哪些 diff 值得看。任务越长,聊天记录越像噪声。
Canvas 的意义在于把 Agent 的中间状态外显。计划、PR、浏览器会话、终端、迁移清单、事故处理、表格、仪表盘,都可以成为一个可检查的工作对象。Agent 不再只是“在后台说它完成了”,而是把进度体现在对象本身的变化上。
这对工程团队很重要。因为真正阻碍 Agent 进入生产工作流的,往往不是它不会写代码,而是人类很难判断它是否真的做对了。
当进度、证据和可操作状态从聊天记录里搬到结构化界面上,Agent 才更容易被审查、复盘和接管。
三、CLI 也开始支持“定时与复核”
GitHub Copilot CLI 的更新同样值得放在一起看。
6 月 2 日的 GitHub Changelog 显示,Copilot CLI 新增了实验性终端界面、rubber duck、`/every` 与 `/after` 定时提示、语音输入等能力。
实验性终端界面加入了 tabs,开发者可以在 CLI 内查看 session、issues、pull requests 和 gists。语音输入让开发者可以用本地语音识别输入提示词。Rubber duck 则像一个内置复核 Agent,会检查当前计划、设计、实现或测试中的盲点,并把反馈交回主 Agent。
其中最值得注意的是 `/every` 和 `/after`。
这两个命令让 CLI 不只是一次性对话工具,而是可以在当前会话里安排任务:例如每 30 分钟运行一次前端测试,或者 2 小时后生成近期变更文档。它把 Agent 从“我问你答”推进到“按时间持续执行”。
这和 GitHub Copilot App 的云端自动化、OpenAI Codex 的可重复工作流,本质上是同一条线:Agent 需要从临时助手变成可安排、可追踪、可复核的工作单元。
四、为什么这是 AI 编程工具的关键转折
AI 编程工具最初的核心卖点是补全和生成代码。后来它们变成聊天助手,可以解释仓库、修 bug、写测试、处理 PR 评论。
现在,产品形态又走到下一步:它们开始争夺“工作台”。
工作台和聊天窗口的区别在于三件事。
第一,工作台有持久对象。任务、计划、页面、PR、浏览器状态、终端结果、自动化日程,都不应该只藏在聊天历史里。
第二,工作台有权限和边界。Agent 可以读哪些系统、改哪些文件、触发哪些流程、花多少预算,都需要被产品化管理。
第三,工作台有复核机制。人类不是只看最终答案,而是要检查中间状态、证据链、diff、测试和运行结果。
OpenAI 的 plugins、Sites、annotations,GitHub 的 canvases、cloud sessions、cloud automations、CLI schedules,都是在补这三件事。
这也意味着,未来评价 AI 编程工具不能只问“代码写得怎么样”。还要问:
- 它能不能接入真实工作上下文?
- 它能不能把产出变成可维护对象?
- 它能不能让人类低成本复核?
- 它能不能支持团队级权限、成本和审计?
- 它能不能把一次性任务沉淀成可复用流程?
谁先把这些问题解决好,谁就更可能成为团队日常工作入口。
五、对开发者和团队的直接影响
对个人开发者来说,今天可以开始调整使用方式:不要只把 AI 当成“问答窗口”,而要把它当成一个可以持续推进任务的协作者。
比如,写代码时可以让 Agent 先给计划,再让另一个复核角色找盲点;长任务可以拆成多个会话;周期性检查可以交给定时提示;前端改动要让 Agent 在浏览器里验证,而不是只看代码。
对团队来说,更重要的是治理。
当 Agent 可以连接更多工具、运行更多自动化、生成更多可分享页面时,它的价值会变大,风险也会变大。团队需要提前定义哪些任务适合 Agent 自动推进,哪些任务必须人工批准,哪些系统只允许只读访问,哪些产出必须留下来源和复核记录。
这不是保守,而是规模化使用 AI 编程工具的前提。
结语
6 月 2 日这组更新给出了一个清晰判断:AI 编程工具正在从“会写代码的聊天机器人”,演进为“围绕 Agent 协作设计的工作台”。
OpenAI Codex 试图把插件、Sites 和注释变成跨角色工作入口;GitHub Copilot 则把 App、CLI、canvas、云端会话和自动化串成更贴近工程团队的 Agent 工作环境。
下一阶段的竞争不会只发生在模型榜单上,而会发生在真实工作流里。
谁能让 Agent 的上下文更完整、产出更可见、过程更可控、复核更省力,谁就更接近成为团队默认的 AI 工作入口。
参考资料
- OpenAI, "Codex for every role, tool, and workflow", 2026-06-02
- GitHub Changelog, "Expanded technical preview availability for the GitHub Copilot app", 2026-06-02
- GitHub Changelog, "Copilot CLI: Improved UI, rubber duck, prompt scheduling, and voice input", 2026-06-02
夜雨聆风