这十一天到底发生了什么
距离我写上一篇 AI 编程工具对比,过去十天——不不,是十一天。
时间不算长,但在这个领域,十一天可以发生很多事。 Cursor 涨价了, Claude Code 更新了几个版本, Copilot 发了新功能, Windsurf 换了一轮定价,还冒出了几个我还没试过的新工具。
我今天不想重复上一篇的内容。上一轮我给了明确的工具推荐,这一次我想换个角度——不是"哪个最好",而是现在的工具格局到底变成什么样了。
坦白说,格局变化比我想象的快。
Cursor :在涨价和降价之间反复横跳
先说 Cursor ,因为它最典型。
上一轮我写的时候, Cursor 刚调过一次价格。现在它又调了——Pro 版从 20 美元涨到 25 美元, Business 版直接标 60 美元/月。但有意思的是,他们的"免费版"给的额度反而变多了。
这操作很迷惑。
我第一次看到这个定价的时候,第一反应是——你们到底想干嘛?后来用了几天想明白了。他们在做用户分层:免费版给足够多让你上瘾的额度, Pro 版收走你钱包里的钱, Business 版收走你老板的钱。
这套路在 SaaS 行业叫"freemium 漏斗"。但放在 AI 编程助手这个赛道上,它有一个很大的风险——用户迁移成本很低。今天是 Cursor 明天是 Windsurf ,说切就切了。
Cursor 本身依然是综合体验最好的。它的补全准确率、多文件编辑的流畅度、还有那个你用了就回不去的 Tab 跳转——这些都没变。
但说实话, 25 美元一个月,值不值?
这么说吧:如果你是重度用户(每天写代码 6 小时以上), Cursor 仍然是最省时间的。 25 美元买回来的时间,绝对值。但如果你是轻度用户(每天 2-3 小时),这个价格其实有点高了。
说实话,这个涨价让我挺不爽的。不是说 5 美元差多少钱——而是感觉被捏住了。他们知道你已经习惯了,知道你不会轻易走,所以涨个价试试你的底线。下次涨到 30 呢? 35 呢?这种"用惯了就得挨宰"的感觉,太熟悉了。

Claude Code :最强核心,最摆烂的体验
Claude Code 在 5 月中旬出了一次更新,增加了一些让我眼前一亮的能力——更好的上下文记忆、更精准的代码定位、支持了 MCP 协议。
如果你不知道 MCP 是什么,简单说就是一个标准协议,让 AI 可以调用外部工具——数据库、 API 、文件系统。这意味着 Claude Code 从一个"对话式编程助手"变成了一个"真正的 Agent"。
但问题是——它还是那么慢。
我上一篇文章吐槽过它的速度,现在版本更新了好几轮,问题只改善了一点点。一个操作平均要等 8-12 秒,这在快节奏的编码场景里非常打断心流。
它的核心能力,说实话,是这几个工具里最强的。特别是复杂重构、跨文件理解、从零搭一个完整模块——这些场景下 Claude Code 的表现遥遥领先。
但它的体验,也是最让人抓狂的。
我用了一个比喻觉得很贴切——Claude Code 就像一个智商 180 但脾气不好的天才同事,你问他一个问题他要思考十秒钟,然后给你一个惊艳的答案。 你问第二个问题,他又要思考十秒钟。
短期用觉得惊艳。长期用?你可能更在乎那十秒钟。
Copilot :微软的翻身仗
GitHub Copilot 在 5 月份推出了一个让我没想到的功能——多模型支持。你现在可以在 Copilot 里切换底层模型: GPT-4o 、 Claude 3.5 Sonnet 、还有他们自家的 Copilot 模型。
这个更新乍一看没那么大,但仔细想想很可怕。
微软在做一个"AI 编程的聚合平台"。你不需要在多个工具之间切来切去,一个 Copilot 插件,想用哪个模型用哪个。
而且 Copilot 的定价没有变——个人版还是 10 美元/月,比 Cursor 便宜一半多。
它的补全能力在过去几个月也有明显提升,从"勉强能用"到了"多数时候能猜对我要写什么"。虽然不是 Cursor 那种"哇他居然知道"的惊艳感,但胜在稳定、便宜、不出幺蛾子。
Copilot 的问题在于——它什么都做,但什么都不做到极致。补全不如 Cursor 好, Agent 模式不如 Claude Code 强。就像一个全能型选手,每科 80 分,但没有 90 分的。
对于大多数开发者来说, 80 分可能就够用了。但如果你追求极致效率,你可能还是会嫌弃它。
说到 Copilot 我就来气。 10 美元一个月确实便宜,问题是它那个补全——有时候你明明在等一个精准建议,它给你来一句完全无关的。前天我在写一个数据处理的函数,它给我补了半行 CSS 代码。半行。 CSS 。我写的是 Python 。这种离谱的情况虽然不频繁,但遇到一次就能让你停下来骂十秒钟。累积下来,它省的时间可能还没它浪费的多。

Windsurf :被低估的第三极
Windsurf 在 5 月做了一次比较低调但重要的更新——改进了他们的 Cascade 模式,让多文件编辑的准确率大幅提升。
我第一次用 Windsurf 是半年前。当时觉得它跟 Cursor 差不多,但体验差一点。现在再回去看,差距还在,但缩小了不少。
Windsurf 的定价策略很有趣——免费版给了非常慷慨的额度(每月 1500 次补全), Pro 版 15 美元/月。在 Cursor 涨价的背景下,这看起来像是"价格屠夫"的定位。
它的弱点是生态。 Cursor 有人写配置教程,有人做 workflow 分享,有大量社区资源。 Windsurf 的社区规模大概只有 Cursor 的五分之一。这意味着你遇到问题,找解决方案的时间成本更高。
但如果你对价格敏感, Windsurf 是目前性价比最高的选择。
还有两个新面孔
写这篇文章的时候,我还注意到两个新工具——Tabnine 出了新的 AI 原生版本,以及一个叫 Kite 2.0(对,就是那个已经关掉的 Kite ,被收购后复活了)。
Tabnine 的新版本主打企业级安全和本地部署。如果你的公司在金融、医疗这种数据敏感行业,它可能是唯一的选择。
Kite 2.0 我刚试了不到一周,还不好说太多。初步印象是不错,但跟第一梯队差距明显。
所以到底怎么选
说了这么多,给一个简单粗暴的参考矩阵:
| Cursor Pro ($25/月) | ||
| Windsurf Pro ($15/月) | ||
| Claude Code | ||
| Copilot ($10/月) | ||
| Tabnine |
如果让我选——我现在主力是 Cursor Pro + Claude Code (按需用)。 Cursor 处理日常编码, Claude Code 处理复杂任务。两个加一起 25+20=45 美元,不便宜,但对我每天 8 小时写代码来说,回本没问题。
但我也在观望 Copilot 的多模型策略。如果 Copilot 能把补全准确率再提一提, 15 美元( Copilot 个人版)对比 25+20 的差价,那个 80 分的全能选手可能才是大部分人的最优解。
具体会怎么样?
我也不确定。
这个领域现在最大的确定性,就是它毫无确定性可言。
你用的哪个工具?有没有踩过什么坑——留言告诉我吧。
夜雨聆风