GPT-5.6 发布、万亿软件城押注 AI、460 亿砸向具身智能:这一周, 产业悄悄换挡了
6 月 27 日凌晨,OpenAI 悄悄放出了 GPT-5.6。
没有发布会,没有直播,甚至没有全员推送——只有一纸公告,和一份”可信合作伙伴”的预览名单。
因为数据太硬了:旗舰模型 Sol 在编程基准 Terminal-Bench 2.1 上,标准模式 88.8%,Ultra 模式 91.9%。此前刚登顶 17 天的 Claude Mythos 5,被一脚踹了下来。
更值得玩味的是这次发布的”姿势”——美国政府要求 OpenAI 暂不全面开放,先给少数可信伙伴看。
定价也有意思:Sol 输出 token 定价 30 美元/百万,正好是 Claude Fable 5 的一半。
这不是一次普通的模型迭代。 放在本周发生的其他事件中看——南京软件大会宣布万亿软件名城全面押注 AI、企业级 AI Agent 白皮书发布、AICon 上海站把”Agentic 操作系统”作为核心命题、吉翼智能在长春开新品发布会喊出”告别炫技”——你会发现,AI 产业正在经历一次系统性的”换挡”。
一、编程王座 17 天易主:AI Coding 的竞争,已经从模型进入 Agent 编排时代 先看 GPT-5.6 这场仗。
时间线拉回到 6 月初。Anthropic 发布 Claude Mythos 5,在 Terminal-Bench 编程基准上拿到 88.0%,业界一片惊呼。
有分析师直接说”Mythos 5 至少领先一个身位”。
17 天后,GPT-5.6 Sol 以 88.8%(标准模式)完成反超。如果开启 Ultra 模式——也就是调度多个子智能体协同处理复杂任务——成绩拉到 91.9%。
差多少?差了不到一个百分点,但所有人都知道这意味着什么。
更关键的是”Ultra 模式”这个机制。GPT-5.6 不是靠把模型做大来赢的,而是靠引入了一个全新的范式:让多个子智能体分工协作。
主 Agent 负责规划、拆解任务,子 Agent 各自执行,最后汇总结果。
这跟我们之前讨论的”循环工程”是一脉相承的。Claude Code 之父之前就提出过这个概念——AI 编程的未来不是”AI 替你写代码”,而是”AI 替你组织写代码的过程”。
GPT-5.6 的 Ultra 模式,本质上就是把”组织”这件事内置到了模型层面。
还有一个细节值得注意:定价策略。 Sol 的定价是 Claude Fable 5 的一半。OpenAI 明显在用价格战挤压 Anthropic。
而 Terra(均衡版)的价格只有 GPT-5.5 的一半,性能却能与之竞争。Luna 主打极低成本。
OpenAI 这次的打法非常清晰:顶端用 Sol 抢心智,中端用 Terra 抢市场,低端用 Luna 抢规模。
这就是”换挡”的第一个信号:AI Coding 的竞争焦点,从”谁家模型强”转向了”谁家模型能便宜地、稳定地、多 Agent 协同地干活”。
二、万亿软件城集体转向:当南京喊出”AI 引领软件变革”,这不是口号 南京软件大会 6 月 27 日闭幕,但会上释放的信号,可能比 GPT-5.6 更值得产业关注。
先说背景:南京是中国第一个”软件名城”,2025 年软件业务收入突破 1 万亿元。
连续办了 21 年的软博会,今年改了名字——从”软博会”变成”软件大会”,核心主题只有一个:”AI 引领软件产业数智化变革”。
改名本身就是一个信号。过去 21 年,这个会是展示软件产品和服务的交易平台。
今年,它变成了讨论”AI 怎么改变软件生产方式”的产业会议。
会上发布了一组数据,我建议大家记下来: 中国通信工业协会《2026 中国企业级 AI 智能体产业白皮书》显示:2025 年中国企业级 AI Agent 市场规模 212 亿元,2026 年预计达 449 亿元,同比翻倍。
Gartner 预测:2026 年,40% 的企业应用将嵌入智能体。 40% 是什么概念?就是你公司用的 10 个软件里,有 4 个会有一个 AI Agent 在背后干活。
这不再是一个”要不要用 AI”的问题了。这是”你的竞争对手已经在用,你还没开始,怎么办”的问题。 南京大会的议程设置也很有意思。7 场重大专场活动,主题分别是:软件产业智能化、自主工业软件、鸿蒙生态、开源生态。
每一条,都在讨论 AI 怎么渗透进软件产业的毛细血管。 过去我们说”AI 写代码”,指的是 Copilot 补全一个函数。现在产业在讨论的是:AI 能不能重构整个软件开发流程——从需求分析、架构设计、代码生成、测试、部署、运维,全程由 AI Agent 驱动。
这就是”换挡”的第二个信号:AI 对软件行业的改造,正在从”开发者工具”升级为”产业基础设施”。
三、AICon 把”Agentic 操作系统”当核心命题:工程化,才是真正的门槛 本周还有一场大会值得关注——AICon 2026 上海站。
AICon 是中国 AI 工程领域最有技术深度的会之一,由 InfoQ 中国主办。今年上海站的主题很直接:”构建可信赖、可规模化、可商业化的 Agentic 操作系统”。
注意这几个词:可信赖、可规模化、可商业化。 这恰恰是当前 AI Agent 落地的三道坎。
可信赖:AI 写的代码,你敢直接上线吗?AI 做的决策,你能对审计交代吗?
可规模化:一个 Agent 能跑通 demo,一百个 Agent 能协同运转吗?
可商业化:Agent 的成本结构能支撑盈利模型吗? AICon 设置了 12 条并行专题,60 多位讲师。议程覆盖的内容,和两年前有天壤之别。
两年前的 AI 大会,讲的是”怎么训练大模型”、”prompt engineering 技巧”。
今年的 AICon,讲的是”多 Agent 协作框架”、”Agent 可靠性工程”、”AI 代码质量保障体系”、”Agent 编排与调度”。
赛迪顾问在 AICon 期间发布了一个判断,我认为非常精准:Agent 规模化落地正步入深水区,行业面临”三道坎”——场景适配不足、技术迭代快于落地周期、数据治理滞后。
说白了就是:模型进步太快了,快到企业还没来得及把上一个版本的 Agent 用好,下一个版本就来了。
这其实是一个甜蜜的烦恼。但甜蜜的烦恼也是烦恼。 解决这个烦恼的关键,就是”工程化”。
把 Agent 的能力标准化、可观测、可治理、可编排——这就是 AICon 把”Agentic 操作系统”作为核心命题的原因。 这也是”换挡”的第三个信号:AI 产业正在从”模型军备竞赛”转向”工程化能力竞赛”。
谁能让 Agent 在生产环境里稳定跑起来,谁就拿到了下一张船票。
四、460 亿砸向具身智能,但钱只流向了 20 家公司:量产,是唯一的入场券
如果说 AI Coding 正在经历”从模型到工程化”的换挡,那具身智能正在经历”从炫技到量产”的换挡。
两组数据,先建立体感:第一组:2026 年上半年,国内具身智能及机器人领域共发生 288 起融资事件,涉及 226 家企业和 274 家投资机构,披露融资总额超过 460 亿元。
对比一下,2025 年全年约 554 亿元,2024 年约 137 亿元。按这个速度,2026 年大概率再创新高。
第二组:这 460 亿的分配方式极度失衡。前 20 家企业拿走了约 330 亿,占七成。其中前 5 家就融资约 171 亿。
换句话说,钱不是均匀撒的。资本在用脚投票——只有跑通了商业化闭环、拿到了量产订单的企业,才能拿到下一轮的钱。
6 月 27 日,吉翼智能在长春举办新品发布会。这家公司成立仅 10 个月,产品从立项到交付仅 8 个月。发布会的核心命题很直白:”当具身智能告别炫技,谁来兑现真实场景?” 把机器人送进工厂、商场、药房、家庭——这件事,远比让机器人在视频里翻个跟头难得多。
武汉华威科 CEO 朱晓辉最近分享过一个细节:去年他们灵巧手配套交付量是 1 万套,今年上半年订单量已经接近 3 万套。宇树科技 2025 年人形机器人出货量全球第一,2026 年计划募资 42 亿元冲刺科创板。智元机器人下线 5000 台,正在冲击万台规模。
这就是具身智能正在发生的事:从”这个机器人能做什么动作”变成”这个机器人能顶几个工人”。
还有一条政策信号:6 月 9 日,工信部和国资委联合启动 2026 年度人形机器人与具身智能实景实训专项行动,要求到年底前”在人形机器人等具身智能重点产品上实现一批代表性场景的应用验证和常态部署”。这是国家层面第一次把”实景实训”和”常态部署”写进正式文件。
2025 年中国具身智能市场规模约 9150 亿元,2026 年预计冲上万亿元。但万亿市场的大门,不会对所有人敞开。
量产能力、场景适配、交付速度——这三件事,正在取代”技术炫技”,成为具身智能赛道真正的竞争壁垒。
五、换挡期,企业应该关注什么? 回到开头的问题:这一周到底发生了什么?
表面上,是 GPT-5.6 发布、南京软件大会召开、AICon 举办、吉翼智能开发布会。但把这四件事放在一起看,有一条清晰的线索: AI 产业正在从”技术驱动”切换到”工程驱动”。
这不是说技术不重要了。恰恰相反,GPT-5.6 证明了技术迭代的速度没有丝毫放缓。
但竞争的维度变了: AI Coding 领域,竞争焦点从”谁家模型编程分高”变成”谁能让 Agent 在生产环境里稳定、便宜、多 Agent 协同地工作”。
具身智能领域,竞争焦点从”谁的机器人更灵活”变成”谁能把机器人批量送进工厂,拿到复购订单”。
企业级 AI 市场,竞争焦点从”谁的大模型更强”变成”谁能把 Agent 嵌入到企业现有的业务流程里,形成闭环”。
第一,不要再纠结”用不用 AI”。Gartner 说 40% 企业应用会嵌入智能体,这不是预测,这是正在发生的事。现在的问题是”怎么用”,不是”用不用”。
第二,关注 Agent 工程化能力,而不是模型跑分。选型的时候,不要只看模型在某个基准上的得分。要看 Agent 框架的可靠性、可观测性、编排能力、成本结构。一个能稳定跑 3 个月的 Agent,比一个跑分高但没法部署的模型有价值得多。
第三,在具身智能领域,关注”交付量”而不是”融资额”。460 亿砸进去了,但只有能交出量产订单的公司才能活下来。如果你在评估具身智能合作伙伴,问的第一个问题不应该是”你们融了多少钱”,而是”你们交付了多少台”。
2026 年的下半场,刚刚开始。而这场换挡,会比上半场更精彩。
内容基于 2025 年 6 月 27 日公开信息整理
数据来源:新浪科技、IT之家、中新网、凤凰科技、量子位、InfoQ、中国通信工业协会、Gartner 等公开资料