AI圈今天炸锅了!OpenAI 和 Anthropic 同一天放大招 🚀

AI 圈上演了一出"神仙打架":
OpenAI 发布 Codex 大更新 + Anthropic 发布 Claude Opus 4.7
同一天,两个王炸同时落地。这剧情,连编剧都不敢这么写。
OpenAI Codex:你的 AI 同事,现在能"看见"你的屏幕了
先说 OpenAI 的这波更新。
他们把 Codex 做成了一个真正的 AI 工作搭档——不只是帮你敲代码,而是能帮你操作整台电脑。
🎮 它现在能控制你的屏幕了
Codex 新增了后台计算机控制(Background Computer Use)功能。
翻译成人话:它可以像真人一样,看你的屏幕、移动鼠标、点击按钮、在输入框里打字。
这意味着什么?
以前没有 API 的软件,现在可以让它帮你操作 前端开发改界面,不用自己反复刷新看效果了 测试 App,不用手动点来点去
多个 AI agent 还能同时在你的 Mac 上并行工作,互不干扰。你在写代码,它在帮你跑测试,各干各的,效率翻倍。
🖼️ 还能直接生成图片
Codex 现在接入了 GPT-Image-1.5,可以直接在对话中生成图片。
配合截图和代码,做产品概念图、UI 设计稿、游戏原型——一个窗口全搞定。
不用再切换到 Midjourney 或 DALL-E 生成图片,再粘贴回来,一个工作流搞定。
📅 记忆你的习惯,还能"预约"工作
这次最实用的功能预览:记忆(Memory)。
Codex 现在能记住:
你的个人偏好(比如"代码风格用双引号") 之前给过的修正(比如"这个函数要加错误处理") 花时间收集的信息(比如"我们的 API 地址是 xxx")
下次再开始任务,不用重复铺垫了。感觉就像是和一个老同事合作,而不是每次都从零开始。
更狠的是:它能给自己排班。
你下班前给它布置任务:"明天早上跑一下测试,看看有没有报错",它真的会在指定时间自己爬起来执行,第二天早上给你汇报结果。
这才是真正的 24 小时 AI 打工人。
🔌 90+ 新插件,生态大扩张
开发者狂喜时刻到了 👇
Codex 新增了 90 多个插件,包括:
我的感受:Superpowers 插件能直接在 Codex 里用,这意味着我们之前的工作流程可以无缝衔接了——细思极恐。
💻 开发工作流全面升级
新版 Codex 的开发体验提升了不少:
- GitHub PR 评论处理
:AI 帮你处理 review 意见,不用一个个手动回复 - 多终端标签页
:同时跑多个命令,不用开一堆窗口 - SSH 连接远程开发机
:在 Codex 里直接操作服务器 - PDF/表格/幻灯片预览
:直接在侧边栏看文件,不用跳出去 - 总结面板
:追踪 AI 的计划、来源和产出物,清楚知道它在干什么
Anthropic Claude Opus 4.7:专业任务,找它准没错
如果说 Codex 是在"扩边界",那 Claude Opus 4.7 就是在"挖深度"。
Anthropic 把 Opus 4.7 打造成了专业工作的顶级助手——编程、视觉、金融分析,样样都行。
🔧 编程能力质的飞跃
先看官方性能对比图👇

重点来了:Opus 4.7 在越难的任务上提升越大——这才是真正实力的体现。
用户的实际反馈:
复杂、长时间运行的任务,可以放心交给它了 严格遵守指令,不偷懒不跳步 自己验证输出结果再汇报
⚠️ 一个小提醒:因为它太听话了,以前给老模型写的 prompt 可能需要重新调校——它会字面理解你的指令。
👁️ 视觉能力暴涨 3 倍
图片分辨率提升到 2576 像素(长边) 约 375 万像素,是之前的 3 倍多
适合场景:
读取密集型截图(比如 UI 稿) 提取复杂图表数据 像素级精确的设计参考
💼 专业分析更靠谱
在金融分析任务上,Opus 4.7 不仅基准测试得分最高,实际表现也很稳👇

官方横跨多个领域的测试数据,Opus 4.7 全面领先。
实际表现:
产出的分析报告更严谨 演示更专业 跨任务整合能力更强
还在 GDPval-AA(第三方经济知识工作评估)上达到了最高水平,覆盖金融、法律等多个领域。
🧠 跨会话记忆
Opus 4.7 现在能记住文件系统中的重要笔记,跨多会话工作。
这一点和 Codex 的 Memory 功能想到一块去了——看来"记忆能力"是今年 AI 的标配了。
🛡️ 内置网络安全防护
这次还有个重要更新:Opus 4.7 内置了网络安全防护。
能自动检测和拦截高风险网络攻击请求。
如果你是安全研究人员,可以申请加入 Cyber Verification Program。
📊 安全评估表现
安全团队给 Opus 4.7 的评价是:"基本良好对齐,值得信任"。

从图里可以看到,Opus 4.7 的不当行为评分比 Opus 4.6 和 Sonnet 4.6 都有改善。
⚡ 其他实用升级
- 更精细的努力控制
:新增 xhigh(超高)级别,在 high 和 max 之间,Claude Code 默认级别已提升为xhigh - 任务预算(公开测试版)
:控制 AI 的代币消耗,优化长时间运行的资源分配 /ultrareview指令:像认真审阅代码的同事一样帮你找 bug,Pro 和 Max 用户免费试用 3 次
💰 加量不加价
这是好消息:Opus 4.7 定价和 Opus 4.6 完全一样
目前已在所有 Claude 产品和主流云平台可用:Anthropic API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry。
效率对比:Opus 4.7 vs Opus 4.6
官方还放出了一张效率对比图👇

这张图展示了在不同努力级别下,Opus 4.7 相比 Opus 4.6 的效率和产出平衡——更强了,也更划算了。
总结:同一天,两条不同的路
昨天这波更新,两个公司走了不同的路:
| 定位 | ||
| 核心突破 | ||
| 亮点 | ||
| 记忆 | ||
| 适合人群 | ||
| 平台 |
我的判断:
如果你想让 AI 操作电脑、处理日常重复工作——选 Codex 如果你需要 AI 接手高难度专业任务——选 Opus 4.7 如果两个都想体验——都装上,让它们协同工作才是王道 😏
AI 军备竞赛,还在继续。
你们更看好哪个? 评论区聊聊 👇
参考来源:
OpenAI Codex 发布页面 Anthropic Claude Opus 4.7 发布页面
夜雨聆风