AI圈今天又现＂神仙打架＂:OpenAI向左,Anthropic向右:同一天,两条完全不同的路!

AI圈今天炸锅了！OpenAI 和 Anthropic 同一天放大招 🚀

AI 圈上演了一出"神仙打架"：

OpenAI 发布 Codex 大更新 + Anthropic 发布 Claude Opus 4.7

同一天，两个王炸同时落地。这剧情，连编剧都不敢这么写。

OpenAI Codex：你的 AI 同事，现在能"看见"你的屏幕了

先说 OpenAI 的这波更新。

他们把 Codex 做成了一个真正的 AI 工作搭档——不只是帮你敲代码，而是能帮你操作整台电脑。

🎮 它现在能控制你的屏幕了

Codex 新增了后台计算机控制（Background Computer Use）功能。

翻译成人话：它可以像真人一样，看你的屏幕、移动鼠标、点击按钮、在输入框里打字。

这意味着什么？

以前没有 API 的软件，现在可以让它帮你操作
前端开发改界面，不用自己反复刷新看效果了
测试 App，不用手动点来点去

多个 AI agent 还能同时在你的 Mac 上并行工作，互不干扰。你在写代码，它在帮你跑测试，各干各的，效率翻倍。

🖼️ 还能直接生成图片

Codex 现在接入了 GPT-Image-1.5，可以直接在对话中生成图片。

配合截图和代码，做产品概念图、UI 设计稿、游戏原型——一个窗口全搞定。

不用再切换到 Midjourney 或 DALL-E 生成图片，再粘贴回来，一个工作流搞定。

📅 记忆你的习惯，还能"预约"工作

这次最实用的功能预览：记忆（Memory）。

Codex 现在能记住：

你的个人偏好（比如"代码风格用双引号"）
之前给过的修正（比如"这个函数要加错误处理"）
花时间收集的信息（比如"我们的 API 地址是 xxx"）

下次再开始任务，不用重复铺垫了。感觉就像是和一个老同事合作，而不是每次都从零开始。

更狠的是：它能给自己排班。

你下班前给它布置任务："明天早上跑一下测试，看看有没有报错"，它真的会在指定时间自己爬起来执行，第二天早上给你汇报结果。

这才是真正的 24 小时 AI 打工人。

🔌 90+ 新插件，生态大扩张

开发者狂喜时刻到了 👇

Codex 新增了 90 多个插件，包括：

插件	用途
Atlassian Rovo	JIRA 项目管理
CircleCI	CI/CD 持续集成
CodeRabbit	代码审查
GitLab Issues	GitLab 问题追踪
Microsoft Suite	Office 全家桶
Superpowers	你没看错，就这个！
Remotion	视频生成
Render	部署服务

我的感受：Superpowers 插件能直接在 Codex 里用，这意味着我们之前的工作流程可以无缝衔接了——细思极恐。

💻 开发工作流全面升级

新版 Codex 的开发体验提升了不少：

GitHub PR 评论处理
：AI 帮你处理 review 意见，不用一个个手动回复
多终端标签页
：同时跑多个命令，不用开一堆窗口
SSH 连接远程开发机
：在 Codex 里直接操作服务器
PDF/表格/幻灯片预览
：直接在侧边栏看文件，不用跳出去
总结面板
：追踪 AI 的计划、来源和产出物，清楚知道它在干什么

Anthropic Claude Opus 4.7：专业任务，找它准没错

如果说 Codex 是在"扩边界"，那 Claude Opus 4.7 就是在"挖深度"。

Anthropic 把 Opus 4.7 打造成了专业工作的顶级助手——编程、视觉、金融分析，样样都行。

🔧 编程能力质的飞跃

先看官方性能对比图👇

重点来了：Opus 4.7 在越难的任务上提升越大——这才是真正实力的体现。

用户的实际反馈：

复杂、长时间运行的任务，可以放心交给它了
严格遵守指令，不偷懒不跳步
自己验证输出结果再汇报

⚠️ 一个小提醒：因为它太听话了，以前给老模型写的 prompt 可能需要重新调校——它会字面理解你的指令。

👁️ 视觉能力暴涨 3 倍

图片分辨率提升到 2576 像素（长边）
约 375 万像素，是之前的 3 倍多

适合场景：

读取密集型截图（比如 UI 稿）
提取复杂图表数据
像素级精确的设计参考

💼 专业分析更靠谱

在金融分析任务上，Opus 4.7 不仅基准测试得分最高，实际表现也很稳👇

官方横跨多个领域的测试数据，Opus 4.7 全面领先。

实际表现：

产出的分析报告更严谨
演示更专业
跨任务整合能力更强

还在 GDPval-AA（第三方经济知识工作评估）上达到了最高水平，覆盖金融、法律等多个领域。

🧠 跨会话记忆

Opus 4.7 现在能记住文件系统中的重要笔记，跨多会话工作。

这一点和 Codex 的 Memory 功能想到一块去了——看来"记忆能力"是今年 AI 的标配了。

🛡️ 内置网络安全防护

这次还有个重要更新：Opus 4.7 内置了网络安全防护。

能自动检测和拦截高风险网络攻击请求。

如果你是安全研究人员，可以申请加入 Cyber Verification Program。

📊 安全评估表现

安全团队给 Opus 4.7 的评价是："基本良好对齐，值得信任"。

从图里可以看到，Opus 4.7 的不当行为评分比 Opus 4.6 和 Sonnet 4.6 都有改善。

⚡ 其他实用升级

更精细的努力控制
：新增 xhigh（超高）级别，在 high 和 max 之间，Claude Code 默认级别已提升为 xhigh
任务预算（公开测试版）
：控制 AI 的代币消耗，优化长时间运行的资源分配
/ultrareview 指令
：像认真审阅代码的同事一样帮你找 bug，Pro 和 Max 用户免费试用 3 次

💰 加量不加价

这是好消息：Opus 4.7 定价和 Opus 4.6 完全一样

类型	价格
输入	$5 / 百万 Token
输出	$25 / 百万 Token

目前已在所有 Claude 产品和主流云平台可用：Anthropic API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry。

效率对比：Opus 4.7 vs Opus 4.6

官方还放出了一张效率对比图👇

这张图展示了在不同努力级别下，Opus 4.7 相比 Opus 4.6 的效率和产出平衡——更强了，也更划算了。

总结：同一天，两条不同的路

昨天这波更新，两个公司走了不同的路：

	OpenAI Codex	Claude Opus 4.7
定位	AI 工作搭档	专业任务专家
核心突破	操作电脑、多模态、记忆	编程能力、视觉精度、专业分析
亮点	90+ 插件生态	基准测试全面领先
记忆	跨会话 + 预约任务	文件系统笔记记忆
适合人群	想让 AI 帮干"杂活"	需要 AI 做"精细活"
平台	Codex 桌面应用	所有 Claude 平台

我的判断：

如果你想让 AI 操作电脑、处理日常重复工作——选 Codex
如果你需要 AI 接手高难度专业任务——选 Opus 4.7
如果两个都想体验——都装上，让它们协同工作才是王道 😏

AI 军备竞赛，还在继续。

你们更看好哪个？ 评论区聊聊 👇

参考来源：

OpenAI Codex 发布页面
Anthropic Claude Opus 4.7 发布页面