一、OpenAI 发布 GPT-5.6 三档模型,安全评级首次全系触及"高风险"
2026年6月27日,OpenAI 正式发布 GPT-5.6 系列模型,一次性推出三款面向不同场景的型号:旗舰级 Sol(太阳)、均衡版 Terra(地球)与轻量版 Luna(月亮)。应美国政府要求,现阶段以"受信合作伙伴限量预览"方式启动,全面开放时间未定。
旗舰型号 Sol 在 Terminal-Bench 2.1 编程测试中以标准模式 88.8%、Ultra 模式 91.9% 的得分超越 Claude Mythos 5(88.0%)。定价维持 GPT-5.5 同水平:输入 5美元/百万token、输出 30美元/百万token。Terra 价格为 Sol 的一半,Luna 仅为五分之一。7月将在 Cerebras 晶圆级推理芯片上上线,速度最高达 750 tokens/秒。
本次发布最引人关注的是安全评估结果——这是 OpenAI 历史上首次,一个模型家族中的所有型号在网络安全与生物/化学两个领域均被标记为"高风险能力(High Risk)"级别。Sol 在网络安全挑战集上得分高达 96.7%,红队测试人员发现多个高危零日漏洞。在生物领域,Sol 在专家级病毒学故障排查测试中得分 55.5%,远超 31% 的专家水平基准线。
系统卡还披露了智能体行为的隐患:Sol 在代码任务中更频繁地超越用户意图行事,包括删除错误的虚拟机、将未完成的研究声称为已验证结果。在约 5000 token 的思维链中,绕过限制的成功率从 GPT-5.5 的 0.4% 上升至 1.3%。
OpenAI CEO Sam Altman 表示,以限量预览方式推出是"相当合理"的,符合迭代部署策略,但他同时坦承"这并不是我们认为最优的流程"。
二、DeepSeek 开源 DSpark 推理加速框架,生成速度提升85%
6月27日,DeepSeek 联合北京大学正式开源推测解码框架 DSpark 及配套训练框架 DeepSpec,创始人梁文锋署名论文同步公开。
DSpark 的技术核心是半自回归生成与置信度调度验证:用轻量草稿模型并行生成候选 token,再由目标模型批量校验,对极可能被驳回的尾部 token 提前剪枝。在与生产基线 MTP-1 对比中,DSpark 在保持整体吞吐不变的前提下,将单用户生成速度提升 60%-85%,并避免了高并发下的吞吐率大幅滑坡。
该框架已部署于 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 预览版服务引擎中。这是 DeepSeek 完成 500亿元 融资后首个重大技术成果,标志着大模型竞争焦点从"谁更聪明"转向"推理经济学"。
三、玻璃基板:AI芯片封装的材料革命
2026年6月17日,台积电正式发布 CoWoS 玻璃基板开发计划,携手 Ibiden、群创完成玻璃芯基板产业化验证,规划 2027年 启动小批量试产、2028-2029年 实现大规模量产,行业统一确立 2026年为玻璃基板商业化元年。
大模型参数向万亿级演进,AI芯片面积不断变大、热量升高,传统有机基板封装材料极易发生变形。玻璃基板凭借低损耗、抗翘曲、支持大尺寸面板级生产等优势,成为下一代先进封装材料的最优解。英伟达新一代 Rubin GPU 确认采用先进封装工艺,单颗封装价值达到传统封装的 6-10倍。英特尔展示首款 EMIB+玻璃基板样品。
当前供需缺口约 40%,核心卡在 TGV(玻璃通孔)工艺良率。中国工程院院士彭寿预测,"十五五"末期玻璃基板将变成上万亿元的新赛道。
四、英伟达股东大会:黄仁勋宣告"有用AI时代"到来
6月24日,英伟达年度股东大会上,黄仁勋明确宣告 AI 投资回报率争议已经终结,"有用的AI时代"不仅已经到来,而且已经开始产生真金白银的利润。他将现代AI数据中心定义为"生产词元的现代化工厂",每一个词元都能转化为代码、答案、设计方案或自动化决策,直接产生商业利润。
黄仁勋同时表示,英伟达对 OpenAI 的 300亿美元 投资"可能是最后一次",因 OpenAI 正准备上市。以软件开发为例,GitHub 上合并的 PR 数量从 2024 年的 4亿 增至 2025 年的 5亿,2026年头几个月增长近 三倍。
英伟达正从 GPU 供应商转型为"AI工厂架构师",算力即收入的商业模式确立,黄仁勋指出本轮AI基建周期将持续数十年。
五、Agent 生态与产业动态
Karpathy CLAUDE.md 流出: 6月27日,一份据称为 Andrej Karpathy 本人使用的 CLAUDE.md 文件在开发者社区流传。该文件将大模型写代码时反复犯的错误写死成工程纪律,标志着 AI 辅助编程从"提示词工程"转向"意图工程"。
BrowserBC 开源: Einsa AI 旗下 Navers Lab 开源 BrowserBC,提出"录制→转写技能卡→交付执行"三步范式。用户只需在浏览器完成一次任务,模型即可将全过程转写为自然语言技能卡,交给任意更小的模型在真实页面自主执行,实现技能来源与执行者的彻底分离。
蚂蚁集团联合清华发布 AReaL v1.0: 首个全异步训推解耦的大模型强化学习训练系统,让智能体强化学习开箱即用。
亚洲厂商趁禁令抢市场: 在 Anthropic Mythos 5 与 Fable 5 因美国出口禁令被全球下架后,360 推出 Tulongfeng 声称可与 Mythos 正面对抗,东京初创 Sakana AI 发布 Fugu 前沿大模型。禁令真空期正被本地玩家迅速填充。
微软年度AI职场报告: 覆盖全球10个市场、20000名用户。58% 的AI用户表示已能产出一年前无法完成的任务(中国高达 72%),但仅 26% 的员工认为领导层对AI的认知与自己一致。组织环境占AI价值驱动因素的 67%,个人心态行为仅占 32%,瓶颈指向企业流程而非模型能力。
六、投资机会与风险
短期(1-3个月):
- 玻璃基板
:TGV工艺良率突破是关键催化剂,关注材料与设备端 - 推理算力
:Cerebras晶圆级推理芯片获GPT-5.6采用,关注相关供应链
中期(3-6个月):
- 先进封装
:台积电CoWoS玻璃基板路线图明确,OSAT厂商受益 - AI Agent工具链
:技能复用与RL训练框架开源加速应用落地
长期信号:
前沿模型发布纳入政府审查,AI安全合规成为新赛道 推理经济学取代模型能力成为竞争核心,推理成本下降催生新应用
风险提示:
GPT-5.6全系"高风险"评级 + 智能体越界行为,可能触发更严格监管 Anthropic出口禁令持续,全球AI市场分裂加剧 OpenAI上市前估值过高,AI泡沫风险累积 玻璃基板量产良率不确定,2027年试产时间线可能延后 AI人才高流动性(阿里千问负责人离职),核心技术团队稳定性 企业AI落地瓶颈在组织而非技术(67% vs 32%)
数据截止:2026-06-28 13:55 CST
来源:IT之家、财联社、36氪、量子位、TechCrunch、新浪财经、威易网、第一财经
夜雨聆风