GPT-5.6 Sol 发布:当 AI 开始"深度思考",还学会了"分身术"
这不是一个模型,而是一个家族。
GPT-5.6 包含三个型号:Sol(旗舰模型)、Terra(均衡模型)和 Luna(快速廉价模型)。OpenAI 同时引入了全新的命名体系——数字代表代数,Sol/Terra/Luna 代表能力层级。
这意味着什么?意味着每个型号可以独立迭代,不再绑在一起升级。
但真正值得关注的,是旗舰型号 Sol 带来的三个突破。
一、一个新的"思考模式"
GPT-5.6 Sol 引入了一个最大推理努力模式(max reasoning effort)。
简单说,就是给模型更多的"思考时间"。
过去的 AI 模型,回答速度很快,但深度有限。你问一个复杂问题,它几秒钟就给出答案——但这个答案可能只是"快速直觉",而不是"深度推理"。
现在,Sol 可以在需要的时候停下来,慢慢想。
这听起来像是一个很小的改动,但它的意义可能比你想的大得多。
为什么?因为推理深度决定了 AI 能解决什么问题。
一个只能"快速回答"的模型,适合聊天、写邮件、做摘要。但一个能"深度思考"的模型,可以做代码架构设计、可以做基因组分析、可以做复杂的安全漏洞研究。
这是两个完全不同的能力维度。
OpenAI 在官方博客中透露,GPT-5.6 Sol 在 Terminal-Bench 2.1(测试命令行工作流的基准)上刷新了最佳成绩。在 GeneBench v1(基因组学和定量生物学分析基准)上,它比 GPT-5.5 取得了更好的结果,而且使用的 token 更少。
更少的 token,更好的结果,更深的推理。
这就是效率。
二、"分身术":Ultra Mode
第二个突破,是 Ultra Mode。
这不是一个模型的升级,而是一种工作方式的升级。
Ultra Mode 超越了单个 Agent 的能力边界,通过调用子智能体(subagents)来加速复杂任务。
什么意思?
想象一下,你让一个 AI 帮你完成一个大型软件开发项目。
旧模式:一个 AI 从头到尾做所有事——分析需求、写代码、测试、修 bug。它很强,但它只有一个"大脑"。
新模式:一个 AI 变成"项目经理",它把任务拆分成多个子任务,然后派出多个"子智能体"并行工作。一个写前端,一个写后端,一个做测试。最后再由"项目经理"整合。
这就是 Ultra Mode 的核心逻辑。
OpenAI 没有公开 Ultra Mode 的具体技术细节,但从描述来看,这标志着 AI Agent 从"单兵作战"向"团队协作"的又一次迈进。
前几天我们刚写过,AI Agent 正在从 1.0 走向 2.0——多智能体协作时代。现在,OpenAI 亲自下场,把这个方向变成了产品功能。
三、网络安全:最强能力,最强防护
第三个突破,也是最有争议的一个——网络安全。
GPT-5.6 Sol 被 OpenAI 称为"迄今最强大的网络安全模型"。
在 ExploitBench² 基准测试中,Sol 仅用约 1/3 的输出 token,就达到了与 Mythos Preview(此前被 NSA 局长指控攻破机密系统的模型)相当的性能。
这意味着什么?意味着 Sol 在网络安全方面的效率,是此前最强模型的三倍。
但 OpenAI 非常清楚,网络安全是一把双刃剑。
一个能帮防御者找漏洞的模型,同样能帮攻击者找漏洞。
所以 OpenAI 做了一个非常重要的声明:
GPT-5.6 Sol 没有达到"网络临界(Cyber Critical)"阈值。
在针对 Chromium 和 Firefox 的测试中,Sol 能识别 bug 和利用原语(exploit primitives)——这些都是攻击的"积木块"——但它没有自主产生完整的全链攻击(full-chain exploit)。
换句话说,Sol 能帮你找到墙上的裂缝,但它不会自动帮你造一把钥匙穿过去。
这是有意的安全设计。
OpenAI 为此构建了一个分层防护体系:
- 模型层:Sol 经过训练,会拒绝有害的网络协助请求,即使用户试图伪装意图或进行 jailbreak
- 实时层:生成过程中,实时分类器会监控输出,高风险情况下会暂停生成,由更大的推理模型审查
- 账户层:标记的活动会触发跨对话的账户级审查,区分持续性恶意行为和合法的安全研究
- 访问控制:分层访问,不是所有人都能用到最强能力
这套体系花了多少成本?
OpenAI 投入了超过 70 万 A100 等效 GPU 小时用于自动化红队测试,专门寻找通用 jailbreak 攻击。
70 万 GPU 小时。
这是什么概念?相当于用一台 A100 显卡不间断跑 80 年。
OpenAI 花在安全测试上的算力,可能比很多公司训练整个模型的算力还多。
四、定价:旗舰也不贵
GPT-5.6 系列的定价策略很有意思。
| 型号 | 输入价格(每百万 token) | 输出价格(每百万 token) |
|------|------------------------|------------------------|
| Sol(旗舰) | $5 | $30 |
| Terra(均衡) | $2.50 | $15 |
| Luna(快速) | $1 | $6 |
Sol 作为旗舰模型,输入 $5、输出 $30。
对比一下——GPT-4o 的定价是输入 $2.50、输出 $10。Sol 的定价大约是 GPT-4o 的两倍。
但考虑到 Sol 引入了 max reasoning effort、Ultra Mode 和更强的安全层,这个溢价是合理的。
更重要的是,GPT-5.6 引入了更可预测的提示缓存(prompt caching):
- 支持显式缓存断点(explicit cache breakpoints)
- 最低 30 分钟的缓存有效期
- 缓存写入按模型未缓存输入费率的 1.25 倍计费
- 缓存读取继续享受 90% 的折扣
这意味着什么?意味着如果你的应用场景有大量重复的上下文(比如企业知识库问答),成本可以大幅降低。
OpenAI 还在官方博客中透露,GPT-5.6 Sol 将在 7 月登陆 Cerebras 平台,速度高达 750 token/秒。
750 token/秒。
这是什么速度?相当于每秒输出约 500-600 个中文字。你眨一下眼的功夫,它已经写了一段话。
五、发布策略:有限预览,政府参与
GPT-5.6 的发布策略,是这次最值得关注的"非技术"新闻。
OpenAI 没有直接全面开放,而是采取了有限预览(limited preview)的方式:
- 初期仅通过 API 和 Codex 向一小批受信任的合作伙伴开放
- 在美国政府的参与下进行了提前演示
- 在预览期间持续测试和协调,逐步扩大可用性
- 计划在未来几周内全面开放
OpenAI 在博客中写了一段非常坦率的话:
这段话的信息量很大。
它意味着:
1. OpenAI 和美国政府之间有一个关于 AI 模型发布的协调机制
2. OpenAI 认为这个机制是"必要的恶",但不是长久之计
3. 政府参与的核心关切是网络安全——怕太强模型被恶意使用
这其实反映了一个更大的趋势:前沿 AI 模型正在从"纯商业产品"变成"国家安全资产"。
当一个模型的网络安全能力足够强时,它就不再只是一个 API 接口了。它可以被用于防御,也可以被用于攻击。而攻击的可能性,让政府不得不介入。
这和核技术、导弹技术的管控逻辑是一样的——当一项技术足够强大时,它就不再完全属于商业范畴。
OpenAI 的选择是:短期妥协,换取长期空间。
六、三个型号,三种定位
GPT-5.6 的命名体系变化,其实反映了 OpenAI 的产品哲学。
过去的命名:GPT-4、GPT-4o、GPT-4o mini……数字代表代数,后缀代表变体。
新的命名:GPT-5.6 是代数,Sol/Terra/Luna 是能力层级。
Sol(太阳):旗舰,最强能力,最高价格
Terra(地球):均衡,与 GPT-5.5 性能相当但便宜两倍
Luna(月亮):快速,最低成本
这个三层结构,和汽车行业的豪华/中端/入门定位很像。也和云计算的 IaaS/PaaS/SaaS 分层逻辑一致。
不同层次的用户,不同层次的需求,不同层次的价格。
Terra 的定位特别有意思——"与 GPT-5.5 性能相当但便宜两倍"。
这意味着什么?意味着 GPT-5.5 的用户可以无缝迁移到 Terra,性能不变,成本减半。
这是 OpenAI 在告诉市场:升级不一定更贵,可能更便宜。
而 Luna 的定位是"最低成本"。它可能性能不如 Sol 和 Terra,但对于聊天、摘要、简单问答这类轻量任务,完全够用。
三层模型,覆盖从"最强推理"到"最便宜回答"的全场景。
七、AI 军备竞赛的新阶段
GPT-5.6 Sol 的发布,不是孤立的事件。
把它放在 2026 年的 AI 大背景下看,你会看到一条清晰的演进路线:
2024 年:大模型拼参数规模——谁的模型大,谁就强
2025 年:大模型拼推理能力——谁能深度思考,谁就强
2026 年:大模型拼"智能体协作"——谁能组织多个 AI 一起干活,谁就强
GPT-5.6 Sol 的 Ultra Mode,正是这个趋势的最新注脚。
同时,安全不再是"附加功能",而是核心能力的一部分。
OpenAI 花了 70 万 GPU 小时做安全测试,这个数字本身就说明了一切。当一个 AI 公司花在安全上的算力,比很多公司花在训练上的算力还多时,你就知道——AI 安全已经不是一个"可选项"了。
它是前提条件。
没有安全,就没有发布。没有信任,就没有用户。
八、普通人怎么用?
GPT-5.6 Sol 的亮点说完了,回到一个实际问题:普通人怎么用?
OpenAI 计划在未来几周内全面开放 GPT-5.6 系列。届时,你可以通过以下方式使用:
- ChatGPT:直接和 Sol、Terra、Luna 对话
- Codex:用 Sol 做编程工作,享受 Ultra Mode 的多智能体协作
- API:开发者可以集成到自己的应用中,按 token 计费
对于普通用户来说,最直接的体验升级是:
1. 更深的推理——复杂问题不再"秒回",而是"深思熟虑"
2. 更强的编程——Sol 在 Terminal-Bench 上刷新了最佳成绩
3. 更快的响应——Cerebras 平台上的 Sol 可达 750 token/秒
对于开发者来说,最有价值的是:
1. Ultra Mode——复杂任务可以拆分成多个子智能体并行处理
2. 可预测的缓存——企业级应用可以大幅降低重复上下文的成本
3. 三层模型选择——根据场景选择 Sol/Terra/Luna,灵活控制成本和质量
结语:Sol 不只是太阳,也是方向
GPT-5.6 Sol 的名字来源于拉丁语的"太阳"。
太阳意味着什么?意味着光明,意味着能量,意味着万物生长的方向。
OpenAI 用这个名字,或许也在暗示一个方向——
AI 的未来不是更快的回答,而是更深的思考。
不是更强的单兵,而是更好的协作。
不是更激进的能力释放,而是更负责任的安全设计。
这三条,可能就是 2026 年下半年 AI 发展的主旋律。
Sol 已经升起。接下来,看谁跟得上。
夜雨聆风