关注我们,第一时间获取 AI 前沿资讯 👆
GPT-5.4 重磅发布:
AI 终于学会了「用电脑」
推理 × 编程 × Agent 三位一体,前沿模型的终极进化

▲ GPT-5.4:OpenAI 迄今最强大的统一前沿模型
2026 年 3 月 6 日,OpenAI 正式发布了 GPT-5.4,并称其为「最强大、最高效的前沿模型」。这不是一次简单的版本迭代——它将 GPT-5.2 的通用推理能力、GPT-5.3-Codex 业界领先的编程能力,以及全新的原生电脑操控能力,三合一融入同一个模型。
换句话说,这是 OpenAI 的第一个「大一统」模型——一个模型,什么都能干,而且干得比以前任何一个专项模型都好。
接下来,我们从五个核心维度来拆解这次发布究竟带来了什么。
▎ 一、原生电脑操控:AI 自己会用电脑了
GPT-5.4 最让人兴奋的突破,是它成为 OpenAI 首个原生支持计算机操控(Computer Use)的通用模型。
这意味着什么?GPT-5.4 可以像人类一样操作电脑:看屏幕截图、理解界面元素、点击鼠标、敲键盘,跨应用完成复杂任务。不再局限于 API 和聊天窗口,AI 真正进入了「动手干活」的时代。

▲ GPT-5.4 原生支持计算机操控,可直接操作桌面应用
在 OSWorld 桌面环境操控测试中,GPT-5.4 成功率达 75.0%,超过人类表现(72.4%),而前代 GPT-5.2 仅为 47.3%。
想象一下这样的场景:你让 AI 帮你在浏览器里搜索信息、打开 Excel 整理数据、切换到邮件客户端发送结果——全部自动完成。这就是 Computer Use 带来的想象空间。
▎ 二、百万级上下文:记忆力的质变
GPT-5.4 支持高达100 万 token 的上下文窗口。这是什么概念?大约相当于 750 万字的中文文本,一次性全部「记住」。
对于开发者来说,这意味着 Agent 可以在超长的任务链中持续规划、执行和验证,不再因为「记性不够」中途失忆。对于普通用户,长时间的多轮对话也能保持连贯。
💡 小知识:超过标准 272K 上下文的部分,将按 2 倍费率计费。开发者可以根据需要灵活配置。
▎ 三、专业工作能力:在 83% 的职业测试中媲美人类
GPT-5.4 在 GDPval 基准测试中,覆盖了美国 GDP 贡献最高的 9 个行业、44 种职业。测试结果显示,GPT-5.4 在 83.0% 的比较中达到或超过行业专业人员的水平,前代 GPT-5.2 为 70.9%。

▲ GPT-5.4 vs GPT-5.2 核心基准测试对比
更直观地看看关键数据:
测试基准 | GPT-5.2 | GPT-5.4 |
GDPval 职业能力 | 70.9% | 83.0% |
OSWorld 电脑操控 | 47.3% | 75.0% |
BrowseComp 搜索 | 65.8% | 82.7% |
投行建模测试 | 68.4% | 87.3% |
事实错误率降低 | — | ↓33% |
特别值得关注的是办公场景:在 PPT 生成评测中,评审有 68% 的时间更偏好 GPT-5.4 的结果;投行建模测试得分从 68.4% 跃升至 87.3%。写报告、做财务模型、制作演示文稿——这些知识型任务正是 GPT-5.4 重点优化的方向。
▎ 四、中途打断 + 思考预览:终于不用干等了
以前和 ChatGPT 对话,一旦它开始回答,你只能干等着。方向跑偏了?等它说完再来。
GPT-5.4 Thinking 模式改变了这一点。模型会先展示思考计划,你可以在它回答的过程中随时打断,补充信息、调整方向、纠正偏差。模型会立刻将新指令融入,继续生成。
这一功能已在网页版和 Android 端上线,iOS 版本即将推出。
此外,深度网页搜索能力也显著提升。在 BrowseComp 测试中,GPT-5.4 得分 82.7%,比 GPT-5.2 的 65.8% 跃升了整整 17 个百分点。GPT-5.4 Pro 更是拿下 89.3% 的新纪录。
▎ 五、更省 Token、更少幻觉:务实的进步
GPT-5.4 是 OpenAI 迄今最省 token 的推理模型——解决同样的问题,消耗的推理 token 比 GPT-5.2 显著更少。对于大量调用 API 的开发者来说,这直接意味着成本下降。
在准确性方面,GPT-5.4 同样表现亮眼:单条事实错误率较 GPT-5.2 降低 33%,完整回复的错误率降低 18%。这是 OpenAI 迄今最「靠谱」的模型。
另一个对开发者友好的创新是工具搜索(Tool Search)机制:模型不再一次性加载所有工具定义(动辄上万 token),而是按需检索,既省钱又快速。在 MCP Atlas 基准测试中,启用工具搜索后 token 消耗减少 47%。
▎ 写在最后:AI 正在从「对话」走向「行动」

▲ 从对话到行动,人机协作正在进入新阶段
GPT-5.4 的发布标志着一个重要转折:AI 不再只是「对话的对象」,而正在成为「行动的伙伴」。
从原生电脑操控到百万上下文,从专业知识工作到更少的幻觉——这不仅仅是技术指标的提升,更是 AI 使用范式的根本性变化。当 AI 可以直接操作你的电脑、处理你的表格、写你的报告,我们离「AI 同事」又近了一大步。
当然,这也带来了新的思考:当 AI 在 83% 的职业测试中达到人类水平,我们每个人都需要重新审视自己的价值定位。或许,学会与 AI 协作,才是这个时代最重要的技能。
未来已来,只是尚未均匀分布。—— 威廉·吉布森
· · · · · · · · · ·
📌 觉得有用?点个「在看」让更多人看到
💬 你最期待 GPT-5.4 的哪个功能?欢迎留言讨论
⭐ 点赞 + 收藏 + 关注 = 下次更新不迷路
夜雨聆风