乐于分享
好东西不私藏

GPT-5.4发布,AI能操作电脑了,83%的职业即将被替代

GPT-5.4发布,AI能操作电脑了,83%的职业即将被替代

3月6日,OpenAI悄无声息地扔了一颗炸弹。GPT-5.4发布,不是那种小版本迭代,是真正意义上的能力跃迁。我看完技术报告,后背一阵发凉——这个模型在44个职业领域的测试中,83%的项目达到了或超过了人类专业水平。

你没看错,83%。

不只是更聪明,是能动手了

以前的GPT再强,也就是一个能说会道的参谋。你问它问题,它给你答案,至于答案对不对、能不能落地,还得你自己去干。

GPT-5.4不一样了。它原生支持计算机操控能力,也就是说,它能直接操作你的电脑。不是那种简单的API调用,而是通过截图识别屏幕,然后用键盘鼠标指令操控,跨应用完成任务。

OSWorld基准测试的结果直接炸了:GPT-5.4的计算机操作成功率是75%,人类是72.4%。

比人还高。

这不是OpenAI第一次做computer use,Claude去年就推出了类似功能,谷歌的Project Mariner也在做同样的事。但GPT-5.4是第一个把这种能力整合进通用推理模型里的。以前是独立的agent模式,现在变成了模型本身的基操。

编程能力的降维打击

做投行的人可能不太关心AI能不能写代码,但对程序员来说,GPT-5.4的编码能力意味着饭碗问题。

SWE-Bench Pro是测试AI能不能真正解决软件工程问题的基准。GPT-5.4在这个测试上的表现,跟专门为编程打造的GPT-5.3-Codex持平甚至更好,而且延迟更低。Codex里新增了/fast模式,token速度提升1.5倍。

说白了,以前GPT帮你写代码,你还得自己调试、自己部署。现在它可以端到端地完成任务,你只需要说我要什么。

Linus Torvalds最近在一个项目里直接用了vibe coding。他自己说,Python可视化那块基本是AI写的,他对模拟滤波器的了解都比对Python多。这话从一个写了三十多年C代码的人嘴里说出来,份量不一样。

政策风口已经铺好了

如果说技术层面是OpenAI在狂飙突进,那政策层面就是中国在大步追赶。

今年两会政府工作报告里,深化拓展人工智能+被写进了正文。工信部直接表态要推动AI电脑、AI手机、智能家居发展。2025年8月国务院发布的意见更具体:到2027年,新一代智能终端和智能体应用普及率超过70%;到2030年超过90%。

这不是喊口号。字节跳动的豆包手机助手已经在做技术预览了,把大模型能力直接塞进手机操作系统,不用开App就能完成任务。谷歌和三星也刚联合推出了新款AI手机,模型和硬件、操作系统一体化整合。

北理工的尹西明说了句话挺有意思:十五五时期,AI会深度融入企业和产业的核心业务,成为驱动技术颠覆性创新和全球产业范式变革的源动力。

智能体时代的安全焦虑

能力越强,不安感越重。

GPT-5.4能在你的电脑上点来点去,开文件、改数据、发邮件,它能做的太多了。OpenAI自己都承认,在思维链可控性测试里,GPT-5.4 Thinking的控制能力较低。翻译成人话就是:它脑子里在想什么,有时候连它自己都说不清。

国内专家也在讨论这个问题。北航的沙磊教授说,智能体在技术层面已经具备保护用户隐私和数据安全的能力。中国政法的陶乾认为,智能体的行为应该被认定为用户意志的技术实现机制,不是独立主体。

但浙江大学传媒学院的方兴东提了个更尖锐的观点:不能完全基于既有格局固守自封,用一刀切的方式扼杀创新。监管要包容审慎,倒逼互联网巨头从封闭的数据圈地走向开放的技术生态。

说白了,智能体要能帮你打车、帮你点外卖,就不可能不碰平台的数据和接口。平台不想开放,智能体就活不了。这个博弈才刚开始。

普通人该怎么看这件事

说点实际的。

GPT-5.4现在只对Plus、Team和Pro用户开放,普通用户用不上。但按照OpenAI的节奏,半年内肯定下放到免费版。到时候任何人都可以让AI帮自己操作电脑、写报告、做分析。

GPT-5.2在投行级电子表格建模上的得分是68.4%,GPT-5.4直接干到了87.3%。演示文稿评估里,评审者偏好GPT-5.4生成的PPT的比例是68%,几乎是GPT-5.2的两倍。

这些数字意味着什么?意味着以前AI只能帮你打打下手,现在它能独立完成相当比例的专业工作。错误率降了33%,也就是说你不用像以前那样频繁纠错了。

工具搜索功能也值得一提。启用之后,在保持准确率不变的前提下,token消耗量减少47%。这意味着用AI的成本在大幅下降。

2026年3月,AI正在从聊天工具变成真正的数字员工。它不只是能帮你思考,还能帮你动手。变化不是线性的,是阶跃式的。

学习ai ,可加入社群讨论