上周有个朋友问我:"现在AI编程工具这么多,到底该用哪个?"
我说别急,我三个都用了半年以上。有的真香,有的真想骂街。
先给你看看2026年5月的战况——魔幻得不像真的。离谱。真他妈离谱。
5月7号,Anthropic在开发者大会上宣布Claude Code全自动模式转正。第二天,OpenAI就甩出GPT-5.5,顺带发了Codex-Spark。不到一周,百度文心5.1来了,预训练成本只要同行的6%。
最离谱的是马斯克——xAI刚死,22万张GPU租给了Anthropic。转头就爆出Grok Build编程应用内测截图。
这哪是卷。这他妈叫互相扒裤子。
但问题来了:工具越多,选择越难。整得人脑阔疼。说实话这局面挺让人上火的——工具在进化,你的钱包也在缩水。这篇文章不整虚的,我按自己真实的使用场景,把这几个工具拆开揉碎了给你看。
三个工具,三条完全不同的路线
先说大方向。三家公司对"AI编程的未来形态"给出了完全不同的答案。理解了这一点,你就不会纠结了——好吧说实话,理解了还是会纠结,但至少知道自己在纠结什么。
嗯。
三条路,三种不同的工作流,不是谁取代谁的关系——至少目前还不是。
Claude Code:适合想要深度控制的你
先说我最常用的——好吧其实我说"最常用"也不太准确,应该说是"最想用但用得最少"的那个。
Claude Code在SWE-bench Verified上拿了80.9%的通过率,首次执行准确率95%。大部分任务一次过,不用来回修。数据是好数据。
但说实话,真正让我觉得它有点东西的不是benchmark,是它的Plan Mode。执行之前先读一遍整个代码库,然后告诉你:"这个重构可能会影响以下文件——"等你确认了再动手。
但——等等,你以为这就完了?不,真正让我上火的在后面。
上周我重构一个支付模块,跨了15个文件。它花了大概20秒梳理依赖关系,然后问我:"订单状态机的逻辑要不要一起迁移?我看这块和你改的文件有耦合。"
我当时愣了一下。这个"全局理解"的能力,Cursor和Codex目前都做不到。
但——(这里有个大转折)——它贵得离谱。Claude Pro $20/月,Max $100/月,Max 20x直接干到$200/月。Token消耗大概是一般工具的4倍。
4倍。认真的?搁这儿当韭菜割呢?
最气人的是,国内直连Anthropic API还不稳定。得自己搭中转、配代理、折腾半天。不是技术搞不定,是真tm心累。花钱买工具,结果先得把自己变成运维。
Cursor:适合追求丝滑体验的你
如果说Claude Code是高级钳工,那Cursor就是一台精密的数控机床——体验是真的好,但也有一些你想骂娘的地方。
它的Tab补全速度<100ms。你刚敲半行,它就猜到你下一段要写什么了。这个功能——用久了会上瘾。真的会上瘾。我回不去没有它的日子了。但你要是觉得它啥都能干,那就太天真了。
Composer 2模式支持多文件重构,可视化diff对比。隔壁同事看你改代码,会觉得你在看科幻片。
2026年3月,Cursor推出了Cloud Agents,可以在云端沙箱跑任务。这个补位很重要,因为之前它最大的短板就是不能异步——所有任务你都得盯着屏幕等。等得心焦。
但是!
上下文窗口只有200K。200K。处理超大项目时它会"迷路"。我有一个朋友——不对,这样说显得我在编——我认识的一个团队,用Cursor重构一个20万行的老项目。改了一半,上下文丢了,改了A忘了B。全部回滚。一天白干。
痛不痛?痛。
Codex:适合想要当甩手掌柜的你
Codex走了完全不同的路子——它不帮你写代码,是替你写代码。
对。你发条消息,然后去喝咖啡。
任务提交后,它在隔离沙箱里:clone仓库、装依赖、改代码、跑测试、创建PR。整个过程中你可以刷手机、开会、甚至睡觉。醒来收结果。
最狠的是并行。同时提交5个重构任务,每个在独立沙箱里跑。半小时后回来收5个PR。这个能力Claude Code和Cursor都做不到——做不到就是做不到。
但代价呢?
$200/月。ChatGPT Pro。这个价格——说实话我觉得定得有点不要脸。而且它不是实时交互的,遇到复杂决策时会显得很蠢。它可能自己做了个糟糕的设计决策,等你审PR时才发现,然后你得全部推翻重来。
那这省的时间又赔进去了。
那到底怎么选?
那到底怎么选?给你我的真实结论。
现实情况呢?
大部分重度开发者——我认识的那些,包括我自己——都在组合使用。日常编码用Cursor,复杂重构丢给Claude Code,脏活累活交给Codex。一个月下来,工具订阅费比咖啡钱还多。这还没算那些折腾中转、配代理花的功夫——搞这些东西的时间加起来都能学一门新语言了。
荒诞吗?我觉着挺荒诞的。但这就是2026年操蛋的现实。你除了接受还能咋整?
每个工具都有自己的碾压级场景,也都有让人想摔键盘的短板。没有一个是全能的——一个都没有。
承认这件事,比天天纠结"到底选哪个"要舒坦得多。也比每个月白花几百刀订阅费强。
嗯。就这样吧。
哦对了,差点忘了说——就在我写这篇文章的时候,马斯克那边又搞事了。Grok Build的内测截图流出来了。又一个选手进场。
卷吧。卷死拉倒。
反正到头来买单的还是我们这些臭写代码的。
夜雨聆风