说实话,这周我有点焦虑。
不是技术上的焦虑——而是信息过载的焦虑。谷歌 I/O 刚开完,Antigravity 2.0、Gemini 3.5 Flash、Spark 智能体一股脑砸过来。紧接着 Cursor 放出 Composer 2.5,号称 1/10 成本追平 Claude Opus。马斯克的 SpaceXAI(原 xAI)又意外曝光了 Grok Build。DeepSeek 的终端工具 DeepSeek-TUI 直接把 AI 编程塞进了命令行……
作为一个每天都要写代码的人,我花了一周时间,把这些工具全部上手跑了一遍。不是看评测文章,是真正拿自己的项目去试。这篇文章就是我这周的笔记整理,希望对你有用。
一、先说结论:没有银弹,但有最优解
先把结果放前面。如果你赶时间,直接看这个:
| 日常业务开发 | Cursor | |
| 复杂工程重构 | Claude Code | |
| Vibe Coding / 快速原型 | Claude + Figma | |
| 终端重度用户 | DeepSeek-TUI | |
| 预算敏感型 | Cursor (Kimi 底座) |
当然,上面这张表是"理想情况"。现实是——大多数人应该组合使用,下面细说为什么。
二、2026年5月,战场发生了什么?
AI编程赛道突然升级三连击:5月14日,Grok Build 曝光直指 Claude Code;DeepSeek-TUI 抢占终端阵地;各 CLI 工具集体适配 DeepSeek V4 引发"cc-switch"工具潮。
Cursor Composer 2.5 发布:5月中旬,不换 Kimi K2.5 底座,靠后训练强化学习追平 Opus 4.7 性能,SWE-Bench 达到 79.8%,成本仅为竞品 1/10。首周用量翻倍。
谷歌 I/O 2026:5月20日,Antigravity 2.0 对标 Claude Code/Codex;Gemini 3.5 Flash 输出速度达竞品 4 倍;Spark 智能体可后台持续运行;搜索本身变成轻量应用生成器。
短短两周,三条战线同时开火:桌面端 → 终端端 → 云端 Agent。这不是渐进式更新,这是整个赛道的范式切换。

面对这么多工具,选型本身就是个技术活
三、四款主力工具的真实使用体验
Claude Code:能力天花板,钱包在滴血
先说最贵的那个。
Anthropic 这边的数据确实漂亮:Opus 4.7 在 SWE-Bench Multilingual 上拿了 80.5% 的分数,企业客户超过 30 万家,年化收入突破 25 亿美元。我用它来处理一个涉及多模块联动的代码重构任务,它的表现怎么说呢——像请了一个资深架构师坐在旁边。
它能理解跨文件的依赖关系,能主动提出架构层面的优化建议,出错后自我修正的能力明显优于其他工具。但问题也很直观:
Claude Code 的实际痛点
API 成本高得离谱:重度用户月消费超过 $100 是常态,复杂任务动辄烧掉几十美元
终端原生 = 学习门槛:对习惯了 IDE 图形界面的开发者来说,纯命令行交互需要适应期
上下文窗口虽大但不是万能:超大型 monorepo 项目仍需手动拆分任务
我的建议:把它当作"重武器",用在关键节点——架构设计、核心算法实现、疑难 Bug 排查。日常 CRUD 就别用它了,杀鸡用牛刀还费钱。
Cursor:性价比之王,但有个隐忧
Cursor 这次发布的 Composer 2.5 确实让人刮目相看。我列几个关键数据你感受一下:
79.8%SWE-Bench 得分 | <$1单任务平均成本 |
35%内部 PR 由 Agent 创建 | 67%财富500强客户占比 |
输入 Token 只要 $0.50/百万,输出 $2.50/百万。同等难度任务下,成本大约是 Opus 4.7 和 GPT-5.5 的 十分之一。
但它有一个战略性的尴尬:底层模型用的是 Anthropic 的 Kimi K2.5。也就是说,Cursor 一边给 Anthropic 交钱买模型,一边跟 Anthropic 的 Claude Code 抢市场。这也是为什么 Cursor 正在疯狂投入自研模型训练——总计算量的 85% 都花在了自有模型的强化学习上,甚至已经在跟 SpaceXAI 合作用 Colossus 2 的百万 H100 算力训练下一代模型。
Cursor 被 Claude Code 逼急了。不换底座、靠后训练、打价格牌——这是从 IDE 产品层向模型竞赛参与者转型的关键信号。
对我这样的个人开发者来说,现阶段 Cursor 是综合体验最好的选择。IDE 内置的 AI 交互不需要额外切换工具,Composer 的多文件编辑能力覆盖了 80% 的日常工作。唯一需要注意的是:如果未来 Cursor 自研模型翻车,或者 Anthropic 断供,体验可能会波动。

Windsurf:被低估的中间路线选手
Windsurf(原 Codeium)走的是另一条路——不做最强的 AI,做最好用的 IDE 集成。它的 Cascade 功能在处理中等复杂度的编码任务时表现稳定,不会像某些工具那样"要么天才要么智障"。
适合的人群很明确:不想折腾配置、不想研究 Prompt 技巧、就想安安静静写代码的开发者。免费版的功能已经够用了,付费版价格也在可接受范围内。缺点是在极端复杂的工程任务上,上限不如 Claude Code。
新入局者:Grok Build 和 DeepSeek-TUI
马斯克的 Grok Build 目前只曝光了定位——全桌面平台兼容、Agent 自主编程,具体效果还要等正式发布。但从 SpaceXAI 整合 xAI 的动作来看,这次是认真的。
DeepSeek-TUI 则是我最近的心头好。直接在终端里运行,读取项目文件、执行命令、调试代码、支持 Git 回滚——真正融入了开发者工作流而不是另起炉灶。而且原生支持自家模型,不存在适配烦恼。对于习惯 Vim/Neovim 工作流的开发者来说,这可能是今年最值得尝试的新工具。
四、谷歌入局意味着什么?
这次谷歌 I/O,对开发者影响最大的其实不是某个单一功能,而是一个信号:AI Agent 将成为所有应用的默认形态。
Antigravity 2.0 毫不掩饰地以"智能体优先"为理念。官方演示中提到,从零构建一个操作系统的 Token 成本不到 1000 美元——这意味着什么?意味着 AI 辅助开发的边际成本正在趋近于零。
Gemini 3.5 Flash 更值得关注——生成速度是其他前沿模型的 4 倍,专门为 AI Agent 开发和编码工具做了优化。如果 Google 能把这个性能级别的模型以合理价格开放 API,整个市场的定价体系都会被重塑。
还有 Gemini Spark——一个可以持续运行的 AI 智能体平台,关闭电脑后仍在后台跑着。虽然目前定价不便宜(Ultra 套餐 $100/月起),但方向是对的:你的 AI 助手不应该需要你一直盯着它。
当构建成本趋近于零时,产品的差异化将完全来自创意和执行力,而非技术门槛。这对独立开发者来说是前所未有的利好——你不再需要一个团队就能做出有竞争力的产品。
五、Vibe Coding 不是神话,也不是骗局
聊 AI 编程不可能绕过 Vibe Coding 这个话题。自 Karpathy 2025 年 2 月命名以来,这个概念已经被炒烂了,但我还是想从一个实操者的角度说几句真话。
先说个真实案例:23 岁的独立开发者 Connor,用 Claude 做 Vibe Coding,14 天从构思到上线了一款叫 Payout 的应用,50 天做到月收入 2 万美元。他没有任何计算机专业背景,之前是个游戏玩家。
听起来很爽对吧?但文章里有一段话我觉得特别重要:
"很多人沉迷于想要快速一次性搞定所有功能,结果往往是失败、无法部署,最终不得不放弃。Vibe Coding 不是一键搞定,你必须学会如何高效使用 AI 工具,明确要做什么、如何快速交付。"
——Connor,独立开发者
我自己的体会也是如此。Vibe Coding 的本质不是"不用写代码",而是把精力从语法细节转移到产品决策上。你需要清楚自己想要什么,能用自然语言准确描述需求,然后有能力判断 AI 生成的代码是否靠谱。
换句话说:Vibe Coding 对产品思维的要求反而更高了。以前你可以躲在"我是写代码的"后面,现在不行了——你得同时是产品经理、设计师和项目经理。

从一个人到一个产品,AI让独立开发者的野心不再受限
六、我的实际工作流(仅供参考)
经过这一周的密集测试,我调整了自己的工作流,大概是这样:
1、需求分析与原型阶段 → 用 Claude 做头脑风暴和技术方案讨论。它的对话能力最强,适合发散思考。
2、MVP 快速搭建 → Cursor + Composer 2.5。IDE 内置体验好,多文件编辑能力强,成本可控。
3、复杂逻辑与架构决策 → 切换到 Claude Code 处理关键路径。贵,但在关键时刻值得。
4、日常迭代与 Bug 修复 → 回到 Cursor 或 Windsurf,快速闭环。
5、终端操作与脚本任务 → DeepSeek-TUI。Git 操作、环境配置、自动化脚本,终端里搞定。
核心思路就是:按任务的复杂度和重要性匹配不同等级的工具。别拿火箭筒打蚊子,也别拿水枪救火灾。
七、最后说几句掏心窝的话
这段时间,最强烈的感受其实是——工具越来越强,但焦虑不减反增。
每天都有新工具发布,每个都声称自己更强更便宜更好用。社交媒体上充斥着"AI 取代程序员"、"Vibe Coding 月入十万"的标题党内容。很容易让人觉得:是不是我不跟上就要被淘汰了?
但冷静下来想想,事情可能没这么极端。
几个我觉得重要的认知锚点
AI 可以卷走重复代码,卷不走技术判断力。知道用什么方案、为什么不选另一个方案——这种经验值短期内无法被替代。
AI 可以帮你写得更快,但不能替你想清楚做什么。产品嗅觉、用户理解、商业直觉,这些依然是人的核心竞争力。
工具会变,但基本功不会过时。数据结构、系统设计、网络协议、安全意识——这些底层的"内功",决定了你能走多远。
真正的差距从来不是谁写代码更快,而是谁能把技术系统化地输出出去。影响力、个人品牌、社区信誉,这些东西比多学一个框架重要得多。
所以我的态度是:积极拥抱,但不盲目追逐。找到适合自己的工具组合,建立稳定的工作流,然后把节省下来的时间投入到那些 AI 做不了的事情上去。
毕竟,工具再强大,也只是工具。握工具的那只手,才是决定性的。
夜雨聆风