乐于分享
好东西不私藏

Codex能控制你的电脑了,AI助手终于"长手"了

Codex能控制你的电脑了,AI助手终于"长手"了

你有没有想过,有一天AI不只是回答你的问题,还能直接帮你操作电脑?

这事儿真的来了。

昨天OpenAI发布了全新的Codex,这次不是简单的版本更新,而是一次彻底的进化——它现在能直接控制你的macOS应用了。对,就是那种”你说一句话,它帮你把活儿干完”的程度。

从”动嘴”到”动手”

以前的AI助手是什么样的?你问它问题,它给你答案。你让它写代码,它给你一段代码。然后呢?你还得自己复制粘贴,自己打开软件,自己点来点去。

说白了,AI就像个只会出主意的参谋,真正干活还得你自己上。

但Codex这次不一样了。它现在能直接操作你电脑上的应用——打开文件、编辑文档、运行命令、甚至调试代码。你只需要告诉它”帮我把这个项目部署到服务器”,它就能一步步执行,不用你再盯着屏幕手动操作。

有个开发者在博客里写了个真实案例:他让Codex破解三星电视的控制协议。你没看错,是”破解”。Codex自己分析了网络流量,找到了控制接口,写了个脚本,最后成功控制了电视。整个过程,这哥们儿就在旁边看着,偶尔点个”继续”。

这就是AI从”动嘴”到”动手”的跨越。

技术上到底做了什么?

OpenAI这次给Codex加了一套叫”应用控制层”的东西。简单说,就是让AI能”看懂”你电脑上的界面,知道哪个按钮是干嘛的,哪个菜单藏着什么功能。

以前AI只能通过命令行(CLI)操作电脑,现在它能直接”看”GUI界面了。这意味着什么?意味着它能操作任何有图形界面的软件——浏览器、代码编辑器、设计工具、甚至游戏。

而且OpenAI还开源了一套Android技能库,专门让AI学会怎么开发Android应用。Google也跟进了,推出了Android CLI工具,号称能让开发速度提升3倍。

这背后的逻辑很清楚:AI不再只是”写代码的工具”,而是”能完成整个工作流的助手”。

这会带来什么改变?

对开发者来说,这简直是解放生产力的神器。以前你得在IDE里写代码、在终端里跑命令、在浏览器里测试、在文档里记笔记……现在你只需要跟AI说”帮我搭个博客系统”,它就能从零到部署全给你搞定。

有人测试过,用Codex做一个完整的Web应用,从设计数据库到前端界面,原本需要一周的工作,现在两小时就能出原型。

对普通用户来说,这意味着”不会编程”不再是门槛。你想做个自动化脚本?想批量处理文件?想定制一个小工具?告诉AI就行了,它会帮你实现。

但这也带来了新的问题。

风险也在变大

AI能控制你的电脑,这事儿听起来很酷,但你有没有想过——如果它出错了怎么办?如果它被黑客利用了怎么办?

已经有安全研究人员警告:AI代理(AI Agent)的权限越大,攻击面就越大。如果有人能诱导AI执行恶意操作,后果可能比传统病毒更严重。

而且,AI现在还不是100%可靠。有开发者反馈,Codex有时候会”理解错意思”,把你的文件改乱了,或者执行了你不想要的命令。虽然OpenAI加了很多安全机制,但AI毕竟不是人,它没法完全理解”这件事能不能做”。

还有一个更深层的问题:当AI能替你做越来越多的事,你会不会逐渐失去某些能力?

就像导航软件让我们不再记路,AI助手会不会让我们不再思考”怎么解决问题”?

我的看法

Codex这次升级,本质上是AI从”工具”向”助手”的转变。它不再只是被动响应你的指令,而是能主动完成一整套任务。

这是好事,也是挑战。

好的一面是,它确实能提高效率,让更多人能做以前做不了的事。坏的一面是,我们需要重新思考”人和AI的边界在哪里”。

我的建议是:用它,但别完全依赖它。让AI帮你处理重复性工作,但关键决策还是要自己做。毕竟,AI再聪明,它也不知道你真正想要什么。

最后说一句:如果你是开发者,现在就该去试试Codex了。如果你不是,也可以关注一下——因为这种”AI能控制电脑”的能力,很快就会出现在你日常用的软件里。

到那时候,你可能会发现,原来”不会编程”也能做很多以前想都不敢想的事。


参考资料:

  • OpenAI官方博客:Codex for almost everything
  • 开发者博客:Codex Hacked a Samsung TV
  • Google Android开发者博客:Build Android apps 3x faster using any agent