GPT-5.4发布,AI能操作电脑了,83%的职业即将被替代

3月6日，OpenAI悄无声息地扔了一颗炸弹。GPT-5.4发布，不是那种小版本迭代，是真正意义上的能力跃迁。我看完技术报告，后背一阵发凉——这个模型在44个职业领域的测试中，83%的项目达到了或超过了人类专业水平。

你没看错，83%。

不只是更聪明，是能动手了

以前的GPT再强，也就是一个能说会道的参谋。你问它问题，它给你答案，至于答案对不对、能不能落地，还得你自己去干。

GPT-5.4不一样了。它原生支持计算机操控能力，也就是说，它能直接操作你的电脑。不是那种简单的API调用，而是通过截图识别屏幕，然后用键盘鼠标指令操控，跨应用完成任务。

OSWorld基准测试的结果直接炸了：GPT-5.4的计算机操作成功率是75%，人类是72.4%。

比人还高。

这不是OpenAI第一次做computer use，Claude去年就推出了类似功能，谷歌的Project Mariner也在做同样的事。但GPT-5.4是第一个把这种能力整合进通用推理模型里的。以前是独立的agent模式，现在变成了模型本身的基操。

编程能力的降维打击

做投行的人可能不太关心AI能不能写代码，但对程序员来说，GPT-5.4的编码能力意味着饭碗问题。

SWE-Bench Pro是测试AI能不能真正解决软件工程问题的基准。GPT-5.4在这个测试上的表现，跟专门为编程打造的GPT-5.3-Codex持平甚至更好，而且延迟更低。Codex里新增了/fast模式，token速度提升1.5倍。

说白了，以前GPT帮你写代码，你还得自己调试、自己部署。现在它可以端到端地完成任务，你只需要说我要什么。

Linus Torvalds最近在一个项目里直接用了vibe coding。他自己说，Python可视化那块基本是AI写的，他对模拟滤波器的了解都比对Python多。这话从一个写了三十多年C代码的人嘴里说出来，份量不一样。

政策风口已经铺好了

如果说技术层面是OpenAI在狂飙突进，那政策层面就是中国在大步追赶。

今年两会政府工作报告里，深化拓展人工智能+被写进了正文。工信部直接表态要推动AI电脑、AI手机、智能家居发展。2025年8月国务院发布的意见更具体：到2027年，新一代智能终端和智能体应用普及率超过70%；到2030年超过90%。

这不是喊口号。字节跳动的豆包手机助手已经在做技术预览了，把大模型能力直接塞进手机操作系统，不用开App就能完成任务。谷歌和三星也刚联合推出了新款AI手机，模型和硬件、操作系统一体化整合。

北理工的尹西明说了句话挺有意思：十五五时期，AI会深度融入企业和产业的核心业务，成为驱动技术颠覆性创新和全球产业范式变革的源动力。

智能体时代的安全焦虑

能力越强，不安感越重。

GPT-5.4能在你的电脑上点来点去，开文件、改数据、发邮件，它能做的太多了。OpenAI自己都承认，在思维链可控性测试里，GPT-5.4 Thinking的控制能力较低。翻译成人话就是：它脑子里在想什么，有时候连它自己都说不清。

国内专家也在讨论这个问题。北航的沙磊教授说，智能体在技术层面已经具备保护用户隐私和数据安全的能力。中国政法的陶乾认为，智能体的行为应该被认定为用户意志的技术实现机制，不是独立主体。

但浙江大学传媒学院的方兴东提了个更尖锐的观点：不能完全基于既有格局固守自封，用一刀切的方式扼杀创新。监管要包容审慎，倒逼互联网巨头从封闭的数据圈地走向开放的技术生态。

说白了，智能体要能帮你打车、帮你点外卖，就不可能不碰平台的数据和接口。平台不想开放，智能体就活不了。这个博弈才刚开始。

普通人该怎么看这件事

说点实际的。

GPT-5.4现在只对Plus、Team和Pro用户开放，普通用户用不上。但按照OpenAI的节奏，半年内肯定下放到免费版。到时候任何人都可以让AI帮自己操作电脑、写报告、做分析。

GPT-5.2在投行级电子表格建模上的得分是68.4%，GPT-5.4直接干到了87.3%。演示文稿评估里，评审者偏好GPT-5.4生成的PPT的比例是68%，几乎是GPT-5.2的两倍。

这些数字意味着什么？意味着以前AI只能帮你打打下手，现在它能独立完成相当比例的专业工作。错误率降了33%，也就是说你不用像以前那样频繁纠错了。

工具搜索功能也值得一提。启用之后，在保持准确率不变的前提下，token消耗量减少47%。这意味着用AI的成本在大幅下降。

2026年3月，AI正在从聊天工具变成真正的数字员工。它不只是能帮你思考，还能帮你动手。变化不是线性的，是阶跃式的。

学习ai ，可加入社群讨论