上周末,我在终端里敲了三个字母。
codex
然后就看着它自己读代码、改bug、跑测试、提交git,一口气干了四个小时,中间没停过。
我坐在旁边,喝了三杯咖啡,键盘碰都没碰一下。
说实话,脊背有点发凉。
这东西到底是个啥
Codex,OpenAI 出的。一个跑在你本地终端里的编程智能体。
它跟 Copilot 不一样。Copilot 是给你补全代码,它是在你电脑上干活。读你的项目、改你的文件、跑你的命令、装你的依赖。你只需要说"我要什么",它自己盘算怎么做。
安装就一行:curl -fsSL https://chatgpt.com/codex/install.sh | sh。然后 codex,登录 ChatGPT 账号,完事。
而且它走的是你已有的 ChatGPT Plus/Pro 订阅,不是 API 按量付费。你本来就在付费,等于白嫖。
我拿它干了件真事
为了试它的真实水平,我扔了个活给它:把一段 Python 数据处理脚本从同步改异步,加上错误重试和日志,最后写单元测试。
过程是这样的:
1. 打开项目目录,敲 codex,它问"想做什么"
2. 我用大白话说完需求,不出 20 秒,它开始啃代码
3. 啃完,自己列了份计划:改哪些文件、加哪些模块、注意哪些兼容性问题
4. 我点头,它动手。改代码、跑测试、报错了自己修、修完再跑
5. 四十分钟后,任务完成。我翻了翻 git log,它自己做了 15 次 commit,每次 commit message 都写得工工整整
中间有几个瞬间,我真的笑了:
它跑测试挂了一次,报错信息里写的是"这个接口在 Python 3.11 里变了,我换个写法哈"。
我故意给它挖了个坑,提了一个跟现有架构冲突的需求。它没跳,回了一句"这个需求会跟现有模块打架,我建议这么改……"然后给了三个方案。
改完代码之后,它主动问了句:要不要我顺手把 README 也更新一下?
我当时的表情大概就是:😳
它跟 Copilot、Cursor 到底差在哪
Copilot 和 Cursor 我用了快两年了,说句实话:它俩跟 Codex 不是一个物种。
Copilot 和 Cursor 是"增强版代码补全"。你写,它们猜。方向盘在你手里。
Codex 是"你坐副驾,它开"。
这不是比喻。它真的在操作你的电脑。读文件、写文件、跑 shell、执行 git、装依赖。全程不用你碰键盘。
这就让工作方式彻底变了。
以前:想方案 → 写代码 → 让它补全 → 我检查
现在:说需求 → 看它出方案 → 确认 → 它执行 → 我验收
角色从"驾驶员"变成了"质检员"。从"干活的"变成了"验收的"。
这件事如果发生在五年前,我肯定不信。
说几个真的让我惊到的点
▸ 它真的会"读代码"
不是把文件 dump 进上下文窗口那么简单。它会分析项目结构、依赖关系、代码风格,然后基于这些做决策。我试过让它改一个我连路径都没说清楚的模块,它自己找到了。
▸ 它不怕犯错,会自己修
这是 Codex 跟所有 AI 编程工具最大的区别。Copilot 给你错了,你得自己改。Codex 给它错了,它会看报错、分析原因、重新改、再跑测试。这个循环可以自己跑很多轮,直到通过。
▸ 它有自己的判断力
我给它挖坑,它没跳。它会质疑不合理需求,给替代方案。这不是"听话",是"理解"。
▸ 沙箱模式,不搞乱你的环境
默认在沙箱里跑,装依赖、删文件都在沙箱里。要操作真实环境,得手动确认。
坑也不少,说真的
最大的坑:它还不够稳。偶尔会陷入死循环,改了A,B报错,改B,A又报错,来回折腾。你得手动喊停。
第二个坑:它对复杂业务逻辑的理解还是弱。工具函数能写好,但当你让它解释"为什么这个业务要这样设计",它就露怯了。
第三个坑:token 烧得狠。一个复杂任务下来,几百万 token 没了。虽然 Plus 用户目前无限用,但谁知道 OpenAI 能撑多久。
第四个坑:它会过度自信。改一些你没想到的边角文件,然后轻描淡写地说"我还顺便优化了几个地方"。你最好养成 review 的习惯。
回到那个老问题:程序员会被替代吗
试完 Codex 之后,我反而觉得这个问题问错了。
Codex 替代不了"知道要做什么"的人。它能替你写代码,但不能替你决定"这个需求该不该做""这个架构合不合理""这个取舍值不值得"。
但它会把"只会写代码"的人挤得很惨。
以前,你会写代码,这就是你的价值。以后,写代码这个动作本身,可能会像打字一样基础。你的价值变成:你能不能把需求说清楚、能不能判断AI做得好不好、能不能在它卡住的时候接手。
本质上,Codex 把编程从"手艺活"变成了"管理活"。
你不会被AI替代,
但你一定会被会用AI的人替代。
说点真心的
用了 Codex 一周,我最大的感受不是什么"效率提升",虽然确实快了很多。
我最大的感受是:它让我回到了"思考问题"而不是"敲代码"的状态。
以前我花 60% 的时间想方案,40% 的时间敲键盘。现在变成了 90% 和 10%。省下来的时间,我用来把方案想得更清楚、把边界情况考虑得更周全。这些恰好是它做不好的。
挺讽刺的。AI 帮我省了时间,我省下来的时间又用来做 AI 做不好的事。
它让我更像一个"工程师",而不是一个"打字员"。
如果你写代码,建议现在就装一个。不需要等它完美,它正在以肉眼可见的速度变好。你只需要知道一件事:
你的同事可能已经在用了。
砺思有言 | AI实战派,先看到,先行动
如果想聊聊 Codex 的使用体验,或者不知道怎么上手,欢迎进群。有一群跟你一样在摸索的人。
夜雨聆风