乐于分享
好东西不私藏

OpenAI 凭借 GPT 5.5 重夺前沿地位

OpenAI 凭借 GPT 5.5 重夺前沿地位

AI 前沿从来不会长时间保持稳定——而这一周,摆锤又正在向 OpenAI 摆回去。该公司的新模型 GPT 5.5“土豆”刚刚以一次榜单跃升和一次强烈的风向变化,为一整周的大规模发布画上句号……而这一切恰好发生在 Anthropic 正经历数月来最糟糕的一周,面对速率限制和质量投诉的时候。

今天的 AI 快报:

  • OpenAI 凭借 GPT 5.5 重夺前沿地位

  • 每天早晨用 Claude 获取一份报纸简报

  • AI 领域生产力提升最大的人也最担心

  • 新的 AI 工具等更多内容

🥔 OpenAI 凭借 GPT 5.5 重夺前沿地位

图片来源:Images 2.0 / The Rundown

OpenAI 刚刚发布了 GPT-5.5(代号“土豆”),这是该公司期待已久的升级版本,被定位为“一种全新的智能等级”——在整个行业的基准测试中登顶,并在 AI 模型前沿上超过了 Anthropic。

  • 5.5 在一系列面向公开模型的推理、智能体、计算机使用和编程测试中创下新高,其中一些分数可与 Claude Mythos 相媲美。

  • 该模型在保持与 5.4 相同速度的同时提升了效率,OpenAI 表示,它使用 Codex 和 5.5 重写了自己的 GPU 代码,以改进基础设施。

  • GPT-5.5 在 API 的定价为每百万输入/输出 token 分别 5 美元和 30 美元,OpenAI 将其描述为“成本仅为同类前沿编程模型的一半”。

  • 5.5 正在向各档 ChatGPT 计划以及 Codex 推出,提供思考版和专业版,而 OpenAI 也持续强调其新发布产品拥有“慷慨的使用额度”。

在 Anthropic 主导数月之后,风向又一次发生了变化——OpenAI 正在迅速推出强大的新升级,重新点燃了此前几次发布中似乎有些淡去的魔力。随着 Anthropic 现在陷入速率限制和质量下降的投诉之中,这对萨姆·奥特曼及其团队来说,是情绪面上非常重要的一周。

AI 训练
📰 每天早晨用 Claude 获取一份报纸简报

概要:在这份指南中,你将学会如何把你的每日更新变成一份个性化报纸。这很有用,因为它会给你一份按重要性排序的简报,包含最重要的故事、待办事项和日程准备内容。

分步操作:

  • 在 Claude 或 Claude Cowork 中,确保 Slack、Notion、Gmail 和日历都已经连接好

  • 输入提示词:“根据我过去 24 小时来自 Slack、Notion、Gmail 和日历的更新,创建一份静态版《晨报》。按重要性排序,并把它格式化成一份报纸,包含头条新闻、行动事项和日程准备”

  • 查看第一版草稿并给出反馈。收紧排序、布局和重点。然后让 Claude 把这个工作流变成一个技能

  • 在 Claude Cowork 中,创建一个每天早晨运行该技能的循环任务

专业提示:让其他智能体去收集外部新闻,并把它们放进一个 Notion 数据库。然后把这个技能作为编辑,把所有内容整理成一份日报。

📊 AI 领域生产力提升最大的人也最担心

图片来源:Anthropic

Anthropic 发布了对其 8.1 万名 Claude 用户调查的后续研究,聚焦经济影响。研究发现,那些因 AI 获得最大生产力提升的人,同时也最担心因此失去工作,尤其是职业生涯早期的工作者。

  • 这项调查把 Anthropic 的经济指数使用数据(哪些工作最依赖 Claude)与 80,508 名劳动者对于 AI 如何重塑其岗位的看法结合了起来。

  • 那些工作中最常使用 Claude 的劳动者表达出的 AI 替代焦虑,是那些最少使用 Claude 的劳动者的 3 倍,而工程师群体的焦虑最为明显。

  • 大多数受访者表示,AI 带来的收益主要落在他们自己身上,表现为任务更快完成和更多空闲时间,但同时也导致了工作范围扩大和工作量增加。

  • 职业生涯早期的受访者表达了最强烈的替代担忧,这也印证了 Anthropic 之前发出的信号:美国应届毕业生的招聘正在放缓。

传统观点认为,对 AI 的恐慌会来自使用程度较低的人群,但这些结果恰恰相反,焦虑反而来自那些从工具中获益最多的人。尽管生产力提升明显,但 AI 的整体情绪从未像现在这样低落——而且似乎也看不到多少缓和这种紧张关系的解决办法。

🛠️ 热门 AI 工具

  • 🥔 GPT 5.5 —— OpenAI 全新评分最高的旗舰 AI 模型

  • ⚙️ Ultrareview —— 用于运行多智能体代码审查的 Claude Code 命令

  • 🏥 面向临床医生的 ChatGPT —— 面向经验证的美国医生免费提供的临床版本

  • ⚙️ Qwen3.6-27B —— 阿里巴巴全新的 270 亿参数模型,在编程能力上超过了自己的前代版本

📰 今天 AI 领域的其他一切

  • Band 推出了多智能体系统缺失的基础设施层。任何智能体。任何环境。点击查看实际演示。*

  • Anthropic 发布了一份复盘报告,将 Claude Code 的质量投诉追溯到三个独立的漏洞,并因这些问题为订阅用户重置了使用限制。

  • OpenAI 推出了面向临床医生的 ChatGPT,这是一款面向经验证美国医疗工作者的免费工具,其中 GPT-5.4 在 HealthBench Pro 上取得了 59.0 分,超过了医生和 Opus 4.7。

  • Meta 向员工发送了一份内部备忘录,通知他们公司将在 5 月裁员 10%,理由是 AI 效率提升以及其他投资需求。

  • 据报道,Elon Musk 的 SpaceX 正在与法国 AI 初创公司 Mistral 洽谈,准备在其最近与编程初创公司 Cursor 达成合作之后,再建立一个三方合作关系。

  • 腾讯开源了 Hy3 预览版,这是其在重建后的训练栈上推出的首个模型,在智能体式编程和搜索智能体评分方面可与顶尖开源模型竞争。

信息来源:Rundown AI