
5 月 7 日,OpenAI 在 X 上宣布:Codex 现在可以直接在 macOS 和 Windows 的 Chrome 中工作。
这条推文很短,但信息量并不小。OpenAI 给出的三个关键词是:Chrome、后台、并行。
原文大意是:Codex 现在能更好地处理 Chrome 里的应用和网站,并且可以在后台跨多个标签页并行工作,不会接管你的浏览器。想要开始使用,只需要在 Codex 应用中安装 Chrome 插件。
这不是“又多了一个浏览器插件”那么简单
过去,我们谈 AI 编程助手,默认场景往往是代码编辑器、终端、仓库和文档。它们擅长读代码、改代码、跑测试,也能解释错误日志。
但很多真实的软件工作并不只发生在代码里。
你要打开后台管理系统确认一个字段;要在网页里复现一个用户路径;要在多个标签页之间比对文档、控制台、表单和结果;要测试一个功能是不是真的在浏览器里跑通。
这些动作以前通常需要人把“浏览器里发生了什么”翻译给 AI:截图、复制文字、描述页面状态,然后再等 AI 给建议。
Codex 进入 Chrome,意味着这个边界正在往前推。
更重要的是:它能在后台并行
OpenAI 特别提到,Codex 现在可以在后台跨标签页并行工作,并且不会接管你的浏览器。
第一,后台工作意味着它不必一直占用你的主操作流。你可以继续使用浏览器,而 Codex 在另一些标签页里完成它的任务。
第二,跨标签页并行意味着它不是单线程地“看一个页面、做一个动作、等一个结果”。在复杂任务里,它可以同时处理多个网页上下文,例如文档、测试页面、管理后台、搜索结果或 issue 页面。
第三,不接管浏览器很关键。AI 代理要真正进入日常工作,必须减少打断感。一个工具越强,如果越容易抢走你的鼠标、焦点和窗口,它就越难被长期使用。
一个真实的小例子:查价、价保、联系客服
为了验证这个能力是不是只停留在演示里,我让 Codex 通过 Chrome 打开京东,帮我看看最近买的大米有没有降价。
这个任务听起来很生活化,但它其实包含了几个真实浏览器工作流里很典型的动作:读取登录后的订单页、识别最近订单、打开商品详情页、比对价格、进入价保页面、提交价保申请,最后还要和客服沟通。

Codex 先打开“我的订单”,在最近订单中找到了 5 月 1 日购买的一款大米:柴火大院五常生态香米 5kg2 袋。订单实付价约为 79.82 元。随后它打开同一个商品链接,确认当前页面中选中的仍是同一规格“优选款 5kg2 袋”,页面显示到手价为 70 元。

从人的直觉看,这就是降价了。于是我让它继续申请价保。Codex 打开京东“价格保护”页面,定位到同一笔订单,点击“申请价保”。但系统返回的结果并不是退差价,而是提示“当前无差价”,并把状态改成“已申请”。
这里就出现了真实网站里很常见的复杂性:页面价格、订单实付价、平台价保系统的判价口径,并不一定完全一致。
Codex 继续打开价保规则,帮我核对为什么 79.82 元到 70 元却没有差价。规则里写得很清楚:如果当前低价来自秒杀、抢购、限时补贴、限时折扣等特殊活动,可能不支持价格保护。商品页里的 70 元正好处在“京东秒杀”的展示区,因此价保系统没有按这个到手价进行补差判断。
接下来我让它联系京东客服。Codex 先通过帮助中心进入在线客服;遇到登录验证时,它没有继续代替我操作,而是停下来让我完成验证。验证通过后,它继续选择相关订单,转到“价保、发票问题”,把订单卡片和问题描述发给客服:


“同一商品同一规格,订单实付约 79.82 元,当前商品页显示到手价 70 元,但价保页面提示当前无差价,请人工核查是否可以补差。”
客服最后的回复也印证了前面的判断:如果是平台活动导致的价格差,通常不支持退差;未拆封时可以考虑退货。


这个例子很小,但它展示了 Chrome 插件的价值:Codex 不只是帮我“查一个价格”,而是在真实网页里连续完成了一串动作,并在关键节点停下来让我确认。它能读页面、点按钮、切换标签页、引用订单信息、解释规则,还能把客服沟通整理成清楚的问题。
更重要的是,它没有把浏览器自动化伪装成魔法。遇到登录验证、订单信息发送、客服沟通这种涉及个人账号和交易信息的节点,它需要用户介入或确认。这种边界感,恰恰是 AI 代理进入真实生活和工作场景时最重要的部分。
为什么这一步值得我们关注?
很多 AI 工具的第一阶段,是回答问题。
第二阶段,是生成内容。
第三阶段,是进入工具链,替你完成一部分操作。
Codex 进入 Chrome,属于第三阶段的一部分。它不再只是在旁边给建议,而是开始进入开发者每天真正使用的界面:浏览器、标签页、网页应用和后台流程。
这会让 AI 代理更接近真实工作,也会让产品设计面临新的问题:什么时候该让 AI 自主执行,什么时候必须停下来请用户确认?怎样让它高效,同时又不让用户失去掌控感?怎样在并行执行时,把每个动作解释清楚?
这些问题,可能比“它能不能点按钮”更重要。
小结
OpenAI 这条推文表面上是在宣布 Codex 支持 Chrome 插件;更深一层看,它是在把 AI 编程助手带进浏览器工作流。
当 Codex 可以在后台并行处理多个标签页,开发者与 AI 的协作方式就会变得更像“分工”,而不只是“提问和回答”。
从编辑器到浏览器,从代码到网页,从建议到执行,AI 开发工具正在悄悄换一个位置。
而这一次,它打开的是 Chrome。
夜雨聆风