乐于分享
好东西不私藏

GPT-5.4能接管电脑,OpenAI迈出自主代理关键一步

GPT-5.4能接管电脑,OpenAI迈出自主代理关键一步

GPT-5.4能直接操作你的电脑,帮你干活了。

OpenAI刚发布了GPT-5.4,这是他们第一个具备原生电脑使用能力的模型。说白了,就是它能代表你操作电脑,在不同软件之间完成任务。比如,你让它“帮我找找晚餐食材并下单”,它就能自己打开浏览器搜索,然后操作购物网站完成购买。

这玩意儿是朝着AI公司们心心念念的“代理未来”迈出的一大步。那个未来是啥样?就是一堆AI代理在后台默默运行,帮你处理线上和软件里的各种复杂任务。

不光能动手,还能“动脑”给你看

GPT-5.4会通过API和他们的AI编程工具Codex推出,但一个叫GPT-5.4 Thinking的推理模型会直接上ChatGPT。

这个Thinking版本牛在哪儿?处理复杂问题时,它会给你展示一个工作大纲。更关键的是,在它回答的过程中,你可以随时插嘴,调整或修改你的要求。OpenAI说,“这让你更容易引导模型达到你想要的确切结果,而不用重头开始或者需要额外多轮对话。”

这个功能现在已经在ChatGPT网页版和安卓App上能用了,iOS版“马上就来”。

键盘鼠标、写代码、找资料,样样都行

GPT-5.4能写代码来操作电脑,还能根据屏幕截图发出键盘和鼠标指令。用浏览器也更溜了,调用各种工具和API来完成任务也更准、更快。

它也更擅长处理那些需要从多个来源搜集信息的问题。OpenAI说,模型“可以更持久地进行多轮搜索,以找出最相关的来源,特别是对于‘大海捞针’式的问题,并把它们综合成一个清晰、有充分推理的答案。”

OpenAI还声称GPT-5.4是他们“迄今为止最真实的模型”,单个陈述出错的概率比GPT-5.2低了33%。


GPT-5.4现在正全面推向ChatGPT、Codex和API。GPT-5.4 Thinking模型会给到Plus、Team和Pro用户。API里还会推出一个GPT-5.4 Pro模型,用于“复杂任务的最大化性能”,ChatGPT Enterprise和Edu用户也能用。

讲真,AI开始能直接操作你的电脑了,你觉得最先被它替代的会是哪些重复性工作?或者,你敢让它帮你处理涉及支付密码之类的敏感操作吗?评论区聊聊。