最近,程序员论坛有个帖子火了。
问的是:AI编程工具,哪个最好用?
65条真实回复,全是写生产代码的老手。
不是试玩两天就吹的那种。
我认真刷完所有评论,发现一个大变化。
AI编程圈,已经出现明显的“阵营分化”。
有人死磕Claude Code。
有人全面转向Codex。
还有人开始用DeepSeek + OpenCode,图个低成本。
今天这篇文章,就把讨论整理出来。
不是广告,不是测评。
就是看看真正的开发者,现在是怎么用AI写代码的。

先说结论。
Codex,已经成为当前口碑第一。
我统计一下这个帖子的所有回复。
提到次数最多的,就是Codex。
而且不是随便提一嘴。
说的是:“Codex最好”、“智商在线”、“review强”。
“逻辑最清晰”、“比Claude更稳定”、“主力已经切过去了”。
很多人现在的组合,已经很明确了。
用Claude Code写功能。
用Codex做代码审查。
或者Cursor加Codex,两个一起用。
这说明了一件事。
AI编程工具,正在从“聊天”走向“工程化”。
现在决定体验好坏的,不再是能不能生成一个演示程序。
也不是会不会写个待办事项应用。
而是:能不能长期记住上下文。
会不会把代码改坏。
回滚方不方便。
代码审查靠不靠谱。
多文件修改稳不稳定。
适不适合真实项目。
所以很多人开始觉得:Codex越来越像一个真正的工程师。
为什么大家突然开始吹Codex?
帖子评论里反复提到三个点。
第一,逻辑非常稳定。
很多人觉得Codex更像个“理工科脑子”。
它不会像Claude那样疯狂发挥产品思维。
它就像一个老程序员,一个强迫症工程师,一个审查型开发者。
特点就是:废话少,目标明确,不容易跑偏。
改bug很稳,代码审查非常强。
很多人甚至说:Codex写的逻辑,比Claude更可靠。
第二,多文件修改能力很强。
真实项目里最怕什么?
不是AI不会写代码。
是AI一口气改了10个文件以后,彻底失控了。
很多开发者现在开始强调:可控性比智商更重要。
Codex在这方面口碑非常高。
尤其是大项目、重构、代码审查、修bug、多轮连续修改。
优势特别明显。
第三,不容易封号。
这个在帖子里被疯狂吐槽。
很多人都说:Claude的账号全被封完了。
甚至有人说:Anthropic和智谱,在我这里坐一桌。
现在大家对Claude最大的不满,已经不是能力了。
而是太容易封号,限额太狠。
所以很多人开始转向Codex、Cursor、DeepSeek、OpenCode。
原因很简单:稳定性也是生产力。
当然,Claude Code仍然是最强模型。
虽然帖子里Codex热度最高。
但有一点大家都很统一:没人否认Claude Code很强。
很多人原话就是:“Claude写得最对”。
或者“Claude做需求理解最牛”。
这其实就是Claude最大的特点——产品思维非常强。
它会主动理解业务,主动设计结构,主动扩展功能,主动优化体验。
但问题也来了:它经常想太多。
有个开发者形容得特别真实:“Claude会把自己当成codebase的主人。”
什么意思呢?
你让它改A。
它顺手就把B重构了,把C优化了,把D修改了。
顺便再抽象一下架构。
最后,项目炸了。
现在高手们基本都不是只用一个AI。
而是多个AI协同干活。
最常见的是Claude + Codex的组合。
Claude负责理解需求,负责生成功能,负责设计架构。
Codex负责代码审查,负责修bug,负责细节优化。
很多人说:两个AI交叉验证以后,稳定性提升非常大。
第二种是Cursor + Codex。
适合那些习惯用VS Code的人,喜欢图形界面和IDE工作流的人。
很多人现在已经明确表示:命令行工具不适合长期开发。
原因很简单:看代码改动不方便,代码审查效率低。
多文件修改不好看,回滚操作不直观。
所以Cursor这种图形界面的IDE,优势越来越明显。
第三种是DeepSeek + OpenCode,低成本流。
这是这次讨论里非常值得注意的新趋势。
很多人提到:DeepSeek V4 Pro Max真不差。
甚至有人说:“比GLM强一万倍”。
因为它便宜,稳定,智商在线,长期使用成本极低。
所以有人开始用DeepSeek做日常开发,用Codex做关键任务。
因为真正生产环境下,token成本会越来越重要。
国产AI编程工具的问题,也暴露了。
帖子里对国产工具的评价两极分化。
比如Trae CN、Qoder、CodeBuddy、Pi、GLM这些。
很多人承认:国产工具的界面确实更好。
漂亮,上手简单,功能入口明显,更像一个“产品”。
但问题也很明显:工程能力不够稳定。
很多评论提到:工具调用容易炸,长上下文容易乱。
真实项目容易跑偏,复杂逻辑不稳定。
有句评价说得很准:“国外是工程师思路,国内是消费者思路。”
这次讨论里最有价值的一句话是:
“短demo看起来都强,真正拉开差距的,是连续改一个真实项目时的可控性。”
这句话非常关键。
因为AI编程已经进入第二阶段了。
第一阶段,大家比的是谁生成代码快。
谁一句话就能做个网站,谁的演示程序更酷。
第二阶段,也就是现在,大家开始比长上下文的稳定性。
比代码审查能力、回滚能力、工程可控性。
比与Git工作流的融合、多Agent协同。
这些,才是真正的生产力。
帖子里还有一句话特别值得警惕。
“谨防AI写得太随意,在项目里立假灯塔。”
什么意思呢?
就是AI一开始写错了架构。
但因为它写得很自信,文件越来越多,代码越来越复杂。
最后整个项目,会沿着错误的方向疯狂前进。
最后变成token黑洞,无限修bug,永远重构不完。
所以很多老程序员现在开始强调:AI越强,人类越要懂工程。
我自己这半年也明显感觉到。
AI编程已经从玩具,变成了生产工具。
以前AI更像自动补全,帮你偷个懒。
现在AI已经开始接管重构、接管代码审查、接管文档。
接管测试,接管架构草稿。
但现阶段,没有任何一个AI能完全替代工程师。
真正高效的人,已经不再是“让AI自动写完代码”。
而是知道“什么时候该用哪个AI”。
未来大概率会形成这样的格局:
Claude负责理解世界。
Codex负责实现世界。
DeepSeek负责降低成本。
Cursor负责工程交互。
而真正的核心竞争力,仍然是你的工程经验和你的判断力。
最后总结一下当前AI编程工具的真实梯队。ai编程的进化是月月新,以下的排名只适用于2026年5月。
第一梯队(生产级主力):Codex、Claude Code、Cursor。
第二梯队(性价比流):DeepSeek + OpenCode、Trae CN。
第三梯队(争议较大):GLM、Qoder、Pi、Kimi Code。
AI编程最危险的阶段,不是AI不会写代码。
而是它已经“看起来很会写代码”了。
但最后决定项目生死的,依然是架构、代码审查、可维护性和工程纪律。
这也是为什么越来越多的高手开始让Claude负责创造,让Codex负责审判。
这里是「小白说遥感」

如果你也在做遥感、GIS、AI、Python。
欢迎一起交流。
夜雨聆风