世行笔记·AI前沿
OpenAI 发布 Codex 重大更新。

核心功能更新
1. 电脑控制
Codex 现已支持在 macOS 上直接操作用户电脑。通过独立的虚拟光标,AI 可查看屏幕内容、执行点击和输入操作,且支持多代理并行运行,不干扰用户当前工作。
该功能适用于前端样式调试、应用测试,以及操作无 API 接口的本地软件。目前该功能已在 macOS 端上线,欧盟及英国地区将在后续开放。
2. 内置浏览器
Codex 桌面端新增浏览器组件,支持在页面内直接批注,为前端和游戏开发提供可视化调试能力。据官方介绍,未来将扩展至完整的浏览器控制能力。
3. 图像生成
集成 gpt-image-1.5 模型后,Codex 现可生成和迭代图像,支持产品概念图、设计稿及游戏素材制作,实现代码与视觉设计的同平台协作。
4. 插件生态扩展
此次更新新增 90 余个插件,涵盖 Atlassian Rovo(JIRA)、CircleCI、CodeRabbit、GitLab Issues、Microsoft 365、Neon(Databricks)、Remotion、Render 等工具,覆盖项目管理、CI/CD 流程及办公协作场景。
5. 开发者工作流优化
针对开发者需求,新版本增加以下功能:
• GitHub PR 评论处理
• 多终端标签页支持
• SSH 远程开发机连接(Alpha)
• 侧边栏文件预览(支持 PDF、表格、PPT、文档格式)
• 任务摘要面板,用于追踪执行计划与产出物
6. 自动化与记忆
自动化功能支持复用历史对话线程,Codex 可自主安排未来任务并定时唤醒执行,适用于跨日甚至跨周的长周期任务,如自动合并 PR、跟进跨平台对话等。
记忆功能(Memory Preview)允许 Codex 保存用户偏好、历史修正及上下文信息,后续任务可直接调用已积累的知识,减少重复沟通成本。
此外,Codex 现可根据项目上下文、插件数据及历史记忆,主动生成工作建议,例如识别待处理的文档评论并整合相关代码库与协作工具信息,生成优先级任务列表。
上线时间与适用范围
目前,上述功能已向 ChatGPT 桌面端登录用户推送。其中,个性化建议与记忆功能将陆续向 Enterprise、Edu 及欧盟/英国用户开放;电脑控制功能暂限于 macOS,其他系统版本及欧盟/英国支持将在后续更新中提供。
夜雨聆风