Codex 官方 Chrome 插件上线:AI 终于能操作你登录过的网站了

导读OpenAI 给 Codex 装了一个 Chrome 插件。装上之后，AI 不再只是陪你聊天写代码，而是可以直接打开你的浏览器，操作你已经登录的网站。这听起来像是一个小功能更新，但它可能正在改变"AI 能帮你做什么"的边界。

你有没有算过，每天有多少时间花在了浏览器的重复操作上？

打开后台填表单、切换标签页复制数据、登录各种系统查信息、把网页内容整理成表格……这些活儿不累，但特别耗时间。更烦的是，很多 AI 工具虽然能读网页，但一遇到登录墙就束手无策——要么拿到的是登录页面，要么直接报错。你还得自己动手。

2026 年 5 月 8 日，OpenAI 给 Codex 发布了一个官方 Chrome 扩展。装上之后，Codex 可以直接调用你本机上已经登录的 Chrome 浏览器。你在哪些网站是登录状态，它就能访问哪些网站。不需要重新登录，不需要配置 Cookie，不用写一行脚本。它像是一个新来的实习生，坐在你旁边的工位上，帮你处理浏览器里的琐事。

这不是"让 AI 打开网页"，而是让 AI 进入你的工作现场

很多人第一次听说 Codex Chrome 插件，会把它理解成"让 AI 打开网页"。这个说法太窄了。

准确地说，它解决的是一个长期存在的边界问题：AI 能读代码、能改文件、能跑命令，但一进入真实的网页环境，遇到登录、验证码、企业 SSO、内部后台，就很难继续。Codex Chrome 扩展的价值，正是让 AI 能在你本机 Chrome 的登录上下文里工作。

OpenAI 官方文档把这个功能定位为"让 Codex 使用 Chrome 处理需要登录态的浏览器任务"。也就是说，当你已经登录了 Salesforce、Gmail、公司后台或某个数据看板，Codex 可以在得到授权后读取页面、填写表单、更新记录、跨标签页处理任务。

这和普通的网页摘要插件完全不同，也不是一个简单的"浏览器侧边栏聊天"。它的重点是让 Codex 进入真实的浏览器环境，读取或操作需要登录态的网站。

换句话说，Codex 不再只是在代码仓库里写 patch，它开始进入"真实网页工作流"。

从 RPA 到 Agent：网页自动化正在换一种方式做

传统的网页自动化，比如 RPA 工具或 Playwright、Selenium 脚本，思路是"先录制流程，再反复运行"。你需要预先定义每一个步骤：点击哪里、输入什么、等待多久。页面结构一变，流程就可能中断。

Codex Chrome 插件走的是另一条路：Agent + 浏览器 + 自然语言。

你不用先录制一套流程，也不用写脚本。直接告诉 Codex："打开这个后台，把前 20 条订单数据整理成表格"，或者"访问这个页面，检查配置是否生效"。它会现场理解页面，现场生成操作，现场执行任务。

一个典型的使用场景可能是这样：

改完前端代码后，让 Codex 打开测试环境的后台，验证数据展示是否正确
收到用户反馈后，让它复现登录后的用户路径，查看报错信息，再回到代码里定位问题
根据会议记录，让它更新 CRM 或项目管理系统里的客户信息
把多个登录后才能看到的后台页面内容汇总成一份报告

更关键的是，它的操作是在后台进行的。Codex 会在 Chrome 里新开标签页，并给这些标签页加上高亮边框和任务分组。你可以继续写代码、看文档、刷网页，它在旁边默默完成任务。完成之后，把结果汇总发给你。

这种"并行协作"的体验，和传统 RPA 的"独占式执行"完全不同。

怎么装上、怎么用上：一条完整的路径

安装过程比想象中简单。OpenAI 官方给出的路径是从 Codex App 内部发起，而不是让你去 Chrome 商店自己搜。

具体步骤：

打开 Codex 桌面应用，进入 Plugins 菜单
找到 Chrome 插件，点击安装
按引导跳转到 Chrome 应用商店，添加扩展
确认 Chrome 工具栏里的 Codex 扩展显示"Connected"
回到 Codex 的 Computer Use 设置里，把 Google Chrome 开关打开

配置完成后，新建一个 Codex 线程。使用时有两种方式：

点击输入框左侧的加号，选择插件，再选择 Chrome
更快捷的方式：直接在输入框里输入 @Chrome，然后描述你要做的事

比如："@Chrome 打开 Salesforce，根据这份通话记录更新客户账户信息。" Codex 会启动 Chrome，访问对应页面，读取内容，执行操作，最后把结果返回给你。

需要注意的是，这个功能目前存在区域限制。官方文档显示欧盟和英国暂未开放，部分亚洲地区也可能无法直接使用。如果在 Chrome 商店找不到扩展，可能需要切换网络环境后再试。

安全问题不是附加项，而是核心设计

让 AI 操作你已经登录的浏览器，能力很强，风险也很高。你的浏览器里可能有邮箱、CRM、后台系统、财务数据、内部文档。一旦权限失控，后果不言而喻。

OpenAI 在这方面的设计，至少做了四层控制：

第一层，新网站默认需要确认。 Codex 在访问每个新域名前会弹出提示，你可以选择"只允许本次使用"、"始终允许这个网站"或"拒绝"。不会默认全开。

第二层，支持白名单和黑名单管理。 在 Computer Use 设置里，你可以把常用工作网站加入 allowlist，减少重复确认；把敏感网站加入 blocklist，彻底禁止访问。

第三层，浏览历史被标记为高风险。 官方明确提醒，浏览历史可能包含内部 URL、搜索词、登录设备活动等敏感信息。如果允许 Codex 使用浏览历史，相关记录会进入任务上下文，且没有"永远允许"的选项。

第四层，敏感操作保留人工确认。 涉及付款、转账、删除生产数据、发布内容、导出敏感信息这类关键动作，建议只让 Codex 准备和核对，不要让它直接提交。

还有一个关键细节：OpenAI 官方说明不会从这个扩展单独保存完整的 Chrome 操作记录。但当浏览活动变成本次 Codex 上下文的一部分时，它会被处理和保存。这意味着你让 Codex 看了什么、操作了什么，理论上会进入 OpenAI 的服务器。

给普通用户一个务实的建议：能不用真实登录态，就不用真实登录态；必须用时，把权限收窄到当前任务。

这对谁有用？对什么场景有用？

Codex Chrome 插件不是万能钥匙。它的价值集中在特定类型的任务上。

对开发者来说，最直观的改变是"开发-调试-验证"的闭环被缩短了。以前改完代码，你需要手动打开浏览器、登录后台、检查页面状态。现在 Codex 可以帮你完成验证环节，甚至能在发现异常后，自己回到代码里尝试修复，再继续验证。

对产品经理和运营来说，它能把一些"网页杂活"自动化：整理后台数据、批量核对信息、在不同系统之间搬运内容。不需要懂代码，不需要搭 RPA，用自然语言描述需求即可。

对需要处理大量网页信息的人来说，它解决了"登录墙"这个老大难问题。知乎热榜、微信公众号文章、需要账号才能查看的行业报告，Codex 可以直接用你已登录的状态去访问和整理。

但也有一些场景它暂时做不好。从早期用户的反馈来看，速度是个问题——它不像演示视频里那么丝滑，需要较长时间的思考才会执行下一步。另外，部分网站的安全策略会拦截自动化操作，这种情况下 Codex 会卡死，且无法清楚解释是哪一条策略导致的。

还有一个值得关注的变化：这款插件的发布，对市面上众多 browser use 类工具形成了直接冲击。当官方提供了免费或订阅内嵌的浏览器自动化能力，第三方工具的付费意愿可能会被稀释。不过，对于使用 Claude、Cursor 等非 Codex 生态的用户，第三方方案如 Open Browser Use（OBU）仍然提供了跨平台的替代选择。

写在最后：浏览器是数字工位，AI 终于走了进来

浏览器是我们绝大多数人的数字工位。写文章要开后台，做产品要查数据，写代码要验证页面，做运营要来回切换系统。每天大量时间，都消耗在这些"打开-登录-查找-复制-粘贴-关闭"的循环里。

Codex Chrome 插件的意义，不在于让 AI 多了一项"打开网页"的技能，而在于它让 AI 开始真正进入这个工位，处理那些你本可以不做、但又不得不做的琐事。

它还不够完美。有区域限制、有速度问题、有安全策略不透明的烦恼。但它指向的方向很清晰：AI 正在从"代码助手"变成"工程工作流助手"，从"回答你的问题"变成"替你完成任务"。

如果你的工作里有大量浏览器操作，不妨装上试试。至少，以后整理后台数据、核对页面信息这类活儿，你可以派一个 Agent 去跑，自己继续做真正需要思考的事。

参考资料

OpenAI 官方文档：Codex Chrome extension：https://developers.openai.com/codex/app/chrome-extension
OpenAI 官方文档：Codex Plugins：https://developers.openai.com/codex/plugins
OpenAI Codex GitHub 仓库：https://github.com/openai/codex