GPT-5.4来了:会用电脑的 AI,你准备好了吗?

关注我们，第一时间获取 AI 前沿资讯 👆

GPT-5.4 重磅发布：

AI 终于学会了「用电脑」

推理 × 编程 × Agent 三位一体，前沿模型的终极进化

▲ GPT-5.4：OpenAI 迄今最强大的统一前沿模型

2026 年 3 月 6 日，OpenAI 正式发布了 GPT-5.4，并称其为「最强大、最高效的前沿模型」。这不是一次简单的版本迭代——它将 GPT-5.2 的通用推理能力、GPT-5.3-Codex 业界领先的编程能力，以及全新的原生电脑操控能力，三合一融入同一个模型。

换句话说，这是 OpenAI 的第一个「大一统」模型——一个模型，什么都能干，而且干得比以前任何一个专项模型都好。

接下来，我们从五个核心维度来拆解这次发布究竟带来了什么。

▎ 一、原生电脑操控：AI 自己会用电脑了

GPT-5.4 最让人兴奋的突破，是它成为 OpenAI 首个原生支持计算机操控（Computer Use）的通用模型。

这意味着什么？GPT-5.4 可以像人类一样操作电脑：看屏幕截图、理解界面元素、点击鼠标、敲键盘，跨应用完成复杂任务。不再局限于 API 和聊天窗口，AI 真正进入了「动手干活」的时代。

▲ GPT-5.4 原生支持计算机操控，可直接操作桌面应用

在 OSWorld 桌面环境操控测试中，GPT-5.4 成功率达 75.0%，超过人类表现（72.4%），而前代 GPT-5.2 仅为 47.3%。

想象一下这样的场景：你让 AI 帮你在浏览器里搜索信息、打开 Excel 整理数据、切换到邮件客户端发送结果——全部自动完成。这就是 Computer Use 带来的想象空间。

▎ 二、百万级上下文：记忆力的质变

GPT-5.4 支持高达100 万 token 的上下文窗口。这是什么概念？大约相当于 750 万字的中文文本，一次性全部「记住」。

对于开发者来说，这意味着 Agent 可以在超长的任务链中持续规划、执行和验证，不再因为「记性不够」中途失忆。对于普通用户，长时间的多轮对话也能保持连贯。

💡 小知识：超过标准 272K 上下文的部分，将按 2 倍费率计费。开发者可以根据需要灵活配置。

▎ 三、专业工作能力：在 83% 的职业测试中媲美人类

GPT-5.4 在 GDPval 基准测试中，覆盖了美国 GDP 贡献最高的 9 个行业、44 种职业。测试结果显示，GPT-5.4 在 83.0% 的比较中达到或超过行业专业人员的水平，前代 GPT-5.2 为 70.9%。

▲ GPT-5.4 vs GPT-5.2 核心基准测试对比

更直观地看看关键数据：

特别值得关注的是办公场景：在 PPT 生成评测中，评审有 68% 的时间更偏好 GPT-5.4 的结果；投行建模测试得分从 68.4% 跃升至 87.3%。写报告、做财务模型、制作演示文稿——这些知识型任务正是 GPT-5.4 重点优化的方向。

▎ 四、中途打断 + 思考预览：终于不用干等了

以前和 ChatGPT 对话，一旦它开始回答，你只能干等着。方向跑偏了？等它说完再来。

GPT-5.4 Thinking 模式改变了这一点。模型会先展示思考计划，你可以在它回答的过程中随时打断，补充信息、调整方向、纠正偏差。模型会立刻将新指令融入，继续生成。

这一功能已在网页版和 Android 端上线，iOS 版本即将推出。

此外，深度网页搜索能力也显著提升。在 BrowseComp 测试中，GPT-5.4 得分 82.7%，比 GPT-5.2 的 65.8% 跃升了整整 17 个百分点。GPT-5.4 Pro 更是拿下 89.3% 的新纪录。

▎ 五、更省 Token、更少幻觉：务实的进步

GPT-5.4 是 OpenAI 迄今最省 token 的推理模型——解决同样的问题，消耗的推理 token 比 GPT-5.2 显著更少。对于大量调用 API 的开发者来说，这直接意味着成本下降。

在准确性方面，GPT-5.4 同样表现亮眼：单条事实错误率较 GPT-5.2 降低 33%，完整回复的错误率降低 18%。这是 OpenAI 迄今最「靠谱」的模型。

另一个对开发者友好的创新是工具搜索（Tool Search）机制：模型不再一次性加载所有工具定义（动辄上万 token），而是按需检索，既省钱又快速。在 MCP Atlas 基准测试中，启用工具搜索后 token 消耗减少 47%。

▎ 写在最后：AI 正在从「对话」走向「行动」

▲ 从对话到行动，人机协作正在进入新阶段

GPT-5.4 的发布标志着一个重要转折：AI 不再只是「对话的对象」，而正在成为「行动的伙伴」。

从原生电脑操控到百万上下文，从专业知识工作到更少的幻觉——这不仅仅是技术指标的提升，更是 AI 使用范式的根本性变化。当 AI 可以直接操作你的电脑、处理你的表格、写你的报告，我们离「AI 同事」又近了一大步。

当然，这也带来了新的思考：当 AI 在 83% 的职业测试中达到人类水平，我们每个人都需要重新审视自己的价值定位。或许，学会与 AI 协作，才是这个时代最重要的技能。

未来已来，只是尚未均匀分布。—— 威廉·吉布森

· · · · · · · · · ·

📌 觉得有用？点个「在看」让更多人看到

💬 你最期待 GPT-5.4 的哪个功能？欢迎留言讨论

⭐ 点赞 + 收藏 + 关注 = 下次更新不迷路