乐于分享
好东西不私藏

OpenAI发布GPT-5.5:Token成本暴降至1/35,AI模型终于开始"省钱"了

OpenAI发布GPT-5.5:Token成本暴降至1/35,AI模型终于开始"省钱"了

OpenAI发布GPT-5.5:Token成本暴降至1/35,AI模型终于开始”省钱”了

北京时间2026年4月24日,OpenAI正式推出GPT-5.5——”迄今为止最智能、最直观的AI模型”。最让行业震动的不是能力有多强,而是成本降了多少:在英伟达GB200 NVL72系统上运行,百万Token成本降至前代的「三十五分之一」


引子

英伟达工程师在内测时说了一句话:”「失去GPT-5.5,就像被截肢。」

这话听着夸张,但你看完这篇就知道,真不夸张。

4月24日凌晨(北京时间),OpenAI扔出了今年AI圈的又一颗核弹——GPT-5.5。官方定位很直白:”面向真实工作的全新智能层级”,也是”迈向在计算机上完成工作的全新方式的重要一步”。

能力上全面超越对手,成本上直接降到前代的1/35。这已经不是”挤牙膏”了,这是直接把牙膏管踩扁了。


核心升级:三大突破

1. Agent能力——终于不用手把手教了

GPT-5.5最大的变化,是从”你需要告诉它每一步怎么做”,变成了**”你说个大概,它自己搞定”**。

具体来说:

  • 理解模糊、复杂的多部分指令
  • 自主进行任务规划
  • 自主调用工具
  • 自主检查结果并持续推进
  • 直到任务完成

这意味着什么?以前你用AI写代码,得一步一步下指令:”先创建项目,再安装依赖,然后写一个登录页面……”现在你只需要说:”帮我搭一个用户管理系统,带登录、注册和权限控制。”然后——它自己干。

图源:搜狐

在代码编写调试、在线研究、数据分析、创建文档和电子表格、操作软件以及在不同工具间切换等场景中,GPT-5.5都能独立完成。

2. 性能数据全面碾压

第三方基准测试,GPT-5.5的成绩单:

基准测试
GPT-5.5成绩
说明
Terminal-Bench 2.0
「82.7%」
衡量复杂终端操作能力
SWE-Bench Pro
「58.6%」
软件工程基准测试
Artificial Analysis Intelligence Index
「第一」
第三方10项eval加权平均,同等输出token量下智能得分最高
GeneBench
「领先」
科研基准测试

OpenAI在官方博客中直接贴出了与Claude Opus 4.7、Gemini 3.1 Pro等竞品的对比数据,结论很直白:「全面超越」

这不是OpenAI自己说的,是第三方评测的结果。

3. 成本——这才是最狠的

如果说能力升级是”意料之中”,那成本降低就是”意料之外”。

关键数据:

  • 「百万Token成本降至前代的1/35」(基于GB200 NVL72系统)
  • 「每兆瓦Token输出量提升50倍」
  • Token生成速度提升「超过20%」
  • 每个Token的延迟与前代「持平」

OpenAI和英伟达做了深度联合设计,GPT-5.5针对GB200/GB300 NVL72系统进行了专门优化。模型更大了,但速度没慢,成本还降了。

图源:搜狐

这是什么概念?

以前你跑一个复杂任务要花100块钱的Token,现在只要不到3块钱。对于企业用户来说,这直接决定了AI项目到底是”烧钱实验”还是”能赚钱的生意”。


定价:贵了,但更值了

GPT-5.5的API定价:

  • 「标准版」:输入 $5/百万Token
  • 「Pro版」:输入 $30/百万Token(比GPT-5.4翻了三倍)

听起来贵了三倍?别急——因为完成相同任务所需的Token数量大幅减少,「实际总成本反而更低」

这就像买贵但更省油的豪车,算总账反而划算。

开放情况

  • GPT-5.5:已向ChatGPT Plus、Pro用户以及OpenAI编程产品Codex的付费用户开放
  • GPT-5.5 Pro:向Pro、Business、Enterprise用户开放
  • API:即将上线

行业影响

对英伟达的直接影响

GPT-5.5和英伟达的深度绑定,意味着什么?

OpenAI的模型越强,对英伟达GPU的需求就越大。这两家公司的关系已经超越了”供应商-客户”,变成了**”联合定义下一代AI基础设施”的战略合作伙伴**。

所以你看,为什么英伟达股价能在同一天创历史新高?因为GPT-5.5每帮用户省下一分钱算力成本,就意味着同样的算力预算可以跑更多任务——而更多任务意味着更多的GPU需求。

正反馈循环。

对国产大模型的影响

DeepSeek-V4预览版也在同一天上线,拥有百万字超长上下文,深度适配国产芯片。但说实话,在Agent能力和综合性能上,与GPT-5.5还有明显差距。

中国大模型的优势在于:更便宜、更懂中文场景、本土化更强。但在硬核性能上,追赶的路还很长。

对普通用户意味着什么

如果你用ChatGPT Plus,现在就能用到GPT-5.5。最直接的感受是:「你说得更模糊了,它干得更漂亮了」

  • 让AI帮你写报告?它自己查资料、自己整理数据、自己写出来
  • 让AI帮你分析数据?它自己拉数据、自己做图表、自己出结论
  • 让AI帮你写代码?它自己调试、自己测试、自己跑通

判断

GPT-5.5的核心意义,不在于”又强了一点”,而在于它正在把AI从**”聊天工具”变成”工作伙伴”**。

当Token成本降到足够低,当Agent能力足够强,AI就不再是一个你需要”用”的工具,而是一个你可以”交给它”的助手。

这个转折点,可能就在2026年。

但也要清醒地看到:GPT-5.5依然不完美。复杂任务中的幻觉问题、长上下文中的信息丢失、多步推理中的逻辑断裂——这些bug还在。只是修复的速度,似乎比出现问题的速度更快。


你觉得GPT-5.5能帮你干多少活?转发分享你的使用体验。