停止工具焦虑:写给普通人的 AI 进阶与避坑地图

前两天吃饭的时候，朋友突然问我：

VS Code 和 Claude Code 有什么区别？

这个问题很好回答，又很不好回答。

它们根本不是同一个物种，但彼此之间又有关系，一时半会还真讲不清楚，所以就有了这篇文章。

这是一篇给新手的扫盲贴，希望能帮你构建起对 AI 工具的全局认知。

当脑子里有了这张全景地图，看懂了它们各自的站位，自然也就消除了对新工具的陌生和无措。

全文预计5000字，如果你准备好了，我们就出发啦~

先分清公司、模型和产品

OpenAI、Anthropic、Google，是公司。

GPT、Claude、Gemini，是它们开发的大模型家族，可以理解成藏在产品背后的“大脑”。

ChatGPT、Claude 和 Gemini 网页版，是普通用户打开网页就能使用的 AI 产品。

而 Codex、Claude Code 和 Antigravity，则是这三家公司面向编程和项目任务推出的 Agent。

为了方便记忆，你可以简单把它们的关系对应起来：

作为“大脑”，这些模型本身也在不断迭代，会有不同的版本。

比如 GPT-5.5、Gemini 3.1 Pro、Claude Opus 4.8、Claude Sonnet 4.6。数字通常代表模型代际，Pro、Opus 一般更偏复杂任务，Sonnet 更强调能力、速度和成本的平衡，Flash、Haiku、Instant 通常更快、更便宜。

常见名称	实际含义
ChatGPT	OpenAI 推出的 AI 产品，不是模型名称
GPT-5.5	OpenAI 的通用大模型，5.5 是版本代际
GPT-5.5 Thinking	会投入更多推理计算处理复杂问题
GPT-5.5 Pro	更高计算量、更强调复杂任务准确性
GPT Image 2	OpenAI 专门负责生成和编辑图片的模型
Gemini 3.1 Pro	Google 的高能力复杂任务模型
Gemini 3 Flash	更偏速度、成本和日常高频任务
Claude Fable 5	Anthropic 最新推出、专为复杂且长时间 Agent 任务打造的旗舰模型
Claude Opus 4.8	面向复杂任务的强大模型
Claude Sonnet 4.6	能力、速度和成本更均衡
Claude Haiku 4.5	更快、更便宜，适合轻量任务

除了处理文字和代码，还有专门生成图片、视频或音乐的模型，比如目前生图领域最顶尖的 OpenAI 的 GPT Image 2，以及 Google 的 Nano Banana 2。

这些名字不用背，新手真正需要分清的只有三件事：

它是哪家公司开发的？
它是一个直接面向用户的产品，还是背后的模型？
它的定位更适合复杂的长线任务，还是日常的快速问答？

普通人最常用的：Chatbot 与 Agent

如果不考虑复杂的技术分类，普通人最常用的 AI 工具基本就是两类：

Chatbot 和 AI Agent。

Chatbot 就是我们已经很熟悉的聊天框（如ChatGPT、Claude 和 Gemini网页端）。

你打开网页，输入问题，它回答你。

我现在仍然高频使用 ChatGPT 和 Gemini 网页端，不仅是因为包月模式下可以节省token，更重要的是网页端本身就有不可替代的优势。

Agent 不只和你讨论“怎么做”，它还能自己动手。 它可以进入真实的工作环境，读取资料、调用工具、修改文件、检查结果，然后自动往下推进。

Claude Code、Codex 和 Antigravity，都属于这一轮 Agent 化趋势中的代表产品。

一句话概括：

Chatbot 主要给你答案，Agent 开始接过任务。

当然，这两者的边界也正在变得模糊。ChatGPT、Claude、Gemini 这些聊天产品也在不断增加搜索、文件处理、工具调用和电脑操作能力。

这正是现在 AI 演化最明显的方向：

AI 正在从聊天框里走出来，越来越深入地进入我们的电脑和真实工作。

三家的编程 Agent 正在越来越像

虽然 Claude Code、Codex 和 Antigravity 在产品定义上各有侧重，但从我的实际体验来看，它们都在进化成高度趋同的全能型编程 Agent。

只要给它们一个本地项目，它们都能独立跑通完整的闭环：

读取文件 → 理解规则 → 调用工具与命令 → 修改内容 → 检查并自动修复报错。

即便是一开始主打多 Agent 管理的 Antigravity，在升级 2.0 并整合 Gemini CLI 后，也彻底看齐了这套标准。

所以，新手不必急着研究它们之间每一个功能差异，它们本质上都在做同一件事：

让 AI 不只回答问题，而是进入真实项目，把任务接过去。

Agent 是打工人，它还需要一个“工作环境”

前面说到，Agent 能帮你接管真实的本地任务，但这中间还缺一环。

这就像一个人很聪明，不代表他进入一家新公司后马上就能工作，他还需要办公桌、工作资料、软件权限、操作规范和验收标准。

Agent 是干活的人，而 VS Code、Cursor、终端和桌面 App，就是它进入电脑、开展工作的不同场所/环境。

先看可视化的工作台：VS Code 与 Cursor

VS Code、Cursor 这类工具经常被统称为 IDE。IDE 的中文是“集成开发环境”，听起来很专业，但其实它就是一个工作台，把文件编辑、项目管理、运行命令和各种扩展都集中在了这里。

VS Code 官方更常称自己为代码编辑器，它最初主要服务于编程，但现在它早已打破了“只能写代码”的限制，你可以用它打开本地文件夹，查看和修改文件。

如果要找一个东西来方便理解，你可以把它理解成手机的操作系统——它具有极其丰富的生态，Claude Code 和 Codex 都可以作为扩展（插件）安装到里面。

这也是我目前给新手最推荐的入口：

先装 VS Code，再从 Claude Code 或 Codex 里选一个使用。

原因不是它最先进，而是它足够通用，你不需要一次性研究所有工具，先在 VS Code 里让 Agent 进入一个真实文件夹，帮你完成一件具体的事就够了。

Cursor 则是一款基于 VS Code 改造的 AI 编程工具。

它把 Agent 能力更深地做进了编辑器，也支持 Claude、GPT、Gemini 和自研的 Composer 模型。

我没有实际使用过 Cursor，所以本文只帮助大家认识它，不作具体推荐。对于已经习惯的人可以继续用，但新手完全没必要因为大家都在讨论，就专门去更换编辑器。

再看命令行的工作台：终端（Terminal）

除了可视化的编辑器，终端（Terminal）同样是 Agent 的工作场所，但因为这一组词涉及的操作和概念稍微复杂一点，我们需要单独把它理清。

我最初学习AI时，最先接触到的就是终端，经常被 Terminal、PowerShell、CLI 这几个词搞晕，再加上非常极客的黑色终端界面和红色的报错代码，心里的抗拒感被拉满了，学的非常痛苦。

最简单的理解方式是：

Windows Terminal：输入和显示命令的“窗口”。可以理解成是收银台那台点单机。它本身只是一块屏幕和一个输入框，不负责做菜，只负责把“客人要什么”传进去。
PowerShell：负责理解和执行命令的“环境”。可以理解为点单机的收银系统。同一个点单机可以装不同的系统——PowerShell 是其中很懂厨房流程的一套；你也可以换成 CMD、Git Bash 这种别的系统。
CLI：中文叫命令行接口，是软件开放出来的“文字操作门”。可以理解是餐厅给外卖员留的取餐窗口。平时你去店里吃饭，是走大门、坐着点菜（这是给人走的路）；CLI 是给“会暗号的人”留的快速通道——只要报出特定的一串口令，后厨立刻出货，不需要走常规流程。

以前用 CLI，往往需要人手动去记、去敲命令，但在 Agent 时代，人不需要亲自操作。以飞书 CLI 为例，你只需要告诉 Agent：“把这个文件上传到飞书”，Agent 就会自动调用飞书 CLI 完成操作。

所以，今天 CLI 最大的价值不只是“让人在黑色窗口里敲命令”，更在于：

它给 Agent 提供了操作其他软件的可调用入口。

不过，虽然终端也是 Agent 的工作场所，但我强烈建议前期碰到终端时，直接跟着靠谱的教程无脑照做就行，不要去死磕。因为终端界面不够直观，一旦出错，很容易让新手心态崩溃。

补充说明：为什么没讲桌面 App？

你可能注意到了，前面提到了 Agent 也有桌面 App 形态，但这里没有深入说明。我个人体验，桌面端会更好用。但不在这里展开，是因为它的网络配置和登录条件往往更苛刻，极易在一开始就把人卡住。

总结一下工作台的打怪升级路线：

无论是难啃的终端，还是门槛高的桌面 App，新手先别碰。一律先在配置最友好的 VS Code 里把 Agent 用起来。

等你清楚了它的运行逻辑，再去找教程慢慢迁移，饭要一口一口吃，工具要一步一步换。

为什么 Codex 看起来有很多种

很多新手第一次接触 Codex 时，还会遇到一个疑惑：为什么有人在 VS Code 里用，有人在终端里敲命令，有人打开的是独立 App，还有人在网页上用？

其实，它们并不是四个完全不同的 AI，而是 同一个 Agent 开了四扇不同的“门”：

VS Code 扩展
Codex CLI
Codex 桌面 App
Codex Web

Claude Code 和 Antigravity 也是一样的逻辑。

所以，千万不要被这些形态唬住，觉得要学四种不同的工具。这也是为什么我们在上一段强烈建议：既然背后都是同一个“打工人”，新手直接走最好进的那扇门（VS Code）就行了，其他的形态暂时全都不用管。

Git 与 GitHub：你的代码“游戏存档”

GitHub 也经常和 AI 编程一起出现，它是一个存放、分享和协作管理项目的云端平台。对新手来说，前期它可能只是一个经常需要去上面下载开源工具、环境包和插件的“资源网站”。

Git 是版本管理工具，负责记录项目文件发生过哪些变化。最直白的理解：

它就是你代码项目的“游戏存档”。

这里很想插一句自己的碎碎念：我一直觉得，把学习 AI 类比成打游戏，是最贴切的。看，这里又出现了“游戏存档”的概念。打游戏有时候就像人生，酸甜苦辣啥都会发生；但不同的是，游戏里试错和重来的成本极低，N 次尝试后，你总能找到正向的反馈。

在“乱拳打死老师傅”的新手阶段，Git 和 GitHub 看起来并没有那么重要。

你甚至完全不懂 GitHub，也可以让 Agent 帮你做出第一个脚本、网页或者本地工作流。

我自己一开始也是这么过来的。

但当你真正开始维护一个长期项目，需要知道 Agent 改了哪些文件、某个错误从哪里出现、怎么恢复以前的正常版本时，你会发现 Git 这个“存档功能”极其重要。

这一部分值得以后专门研究。我也准备后面认真补一次 Git，再单独写一篇。

模型竞争，已经进入 Harness Engineering 阶段

这里很想插一句吐槽：今年以来，每次看到铺天盖地的新模型发布、跑分比拼，我就觉得特别吵。

这些信息不仅会带来海量噪音，评测时还经常夹带私货，给普通人制造了毫无必要的焦虑。每个人的真实场景千差万别，跑分怎么可能代表全貌？就像大家普遍认为 ChatGPT 的模型比 Gemini 更强，但我自己在做深度文本修改、需要多模态识别时，就是觉得 Gemini 更好用。

我越来越明显地感觉到，对绝大部分日常任务来说，主流模型本身的能力已经足够强了。

国内模型当然还有差距，但在很多场景下已经完全够用了，国外顶级模型之间，也很难只用“谁的分数更高”来概括实际体验。

真正开始拉开差距的，是模型之外的东西：

它能拿到哪些资料
可以调用哪些工具
能不能进入真实工作环境
是否知道你的规则和边界
能不能检查自己做得对不对
出错以后是否可以继续修正

一个再聪明的模型，如果不看真实文件，也只能给通用废话。反之，哪怕不是第一的模型，只要能持续拿到你的项目资料和判断标准，也绝对比什么都不懂的模型强，这也是我一直以来的观点：

事实比模型更重要。

这背后对应的概念，就是 2026 年初进入公众视野的 Harness Engineering。

当时很多人还在纠结选什么模型、怎么装 OpenClaw 时，前沿的讨论重点已经转向：怎样给 Agent 搭一套能长期稳定工作的系统。

如果把大模型理解成大脑，Harness 就是围绕大脑搭建的工作环境、工具、资料、规则、权限和反馈机制,它可以压缩成一个极其简单的公式：

也就是 Agent 中除模型以外的其他所有东西。

模型决定它能想多远，而 Harness 决定它能不能稳定地把事情做完。

我的工作中心：铁打的本地项目，流水的 Agent

虽然我仍然建议新手从 VS Code 开始，但那只是一个更容易理解的入口，并不是我现在的使用状态。

我现在主要使用 Claude、Codex 和 Antigravity 的桌面端，再配合 ChatGPT 和 Gemini 网页端。

网页端主要用来进行初步的讨论、研究和想法碰撞；而桌面端的 Agent，则负责直接进入真实项目，读取资料并干活。

这里分享一个真实的细节：我目前使用 Claude 桌面端时，背后接入的是国产大模型 Minimax。

为什么？因为就像前面说的，当你的系统里沉淀了足够清晰的资料和规则（Harness），国内优秀的模型也完全能极其出色地把活干完。

但它们都不是我的工作中心。

我真正的工作中心，是电脑里的 Obsidian 仓库。

我的项目文件、公众号文章、工作记录、判断标准、表达偏好和工作流程，都保存在本地 Obsidian 中。

需要处理任务时，我可以把同一个项目扔给任何一个 Agent：今天让 Claude Code 处理，明天让 Codex 检查，另一个任务交给 Antigravity。

Agent 会变，背后调用的模型会变，使用的入口也会变。但只要它们读取的是同一个本地项目、同一套真实的资料和规则，工作就可以完美继续。

这也是为什么我现在不再执着于“到底哪个 Agent 最好用”，我更关心的是：

无论换成哪个 Agent，它能不能快速进入我的工作环境，读懂事实，然后继续把事情做下去。

AI 分身不是复制一个会说话的我

很多人理解的 AI 分身，是训练一个说话很像自己的聊天机器人，但我理解的 AI 分身，更接近一套长期协作系统。

它知道我正在推进什么项目，能够读取我的真实资料，理解我的判断标准，知道哪些事情可以做、哪些事情必须先让我确认。当我不断把真实记录、纠偏过程和工作方法留在本地系统里，它就会在一次次任务中越来越懂我。

从这个角度看，AI 其实一直在不同程度、不同维度地代替人类原来亲自完成的工作：

最早它只是替我们回答问题；
后来开始替我们搜索、整理、写作、修改文件；
再往后，它开始操作软件、调用工具、运行任务和检查结果。

它不是某一天突然完整地“代替一个人”，而是在一点点接手具体环节。

人的位置也开始往上移动：从亲自执行每一个步骤，变成确定目标、提供事实、设置边界和验收结果。

真正应该留下来的，不是某个平台里的聊天记录

以前我会担心一个问题：如果某个 AI 账号突然被封了怎么办？我和 AI 产生的大量聊天记录、对我的了解以及长期积累的上下文，会不会一起消失？

如果所有东西都只存在某个平台里，这确实是一个巨大的风险。

但当项目、资料、记录、判断和工作方法都保存在自己的电脑上时，情况就不一样了。

模型、Agent、网页、插件、CLI 和桌面 App 这些入口，都可以更换。

但真正属于我的东西，一直会留在本地。

因此这套系统除了可以帮助我搭建 AI 分身外，它还有一个同样重要的价值：

它让我不再把自己的长期积累，绑定在任何一个模型、账号或者平台上。

我真正想保存的，从来不是和某一个 AI 聊过什么，而是我的项目、事实、判断和工作方法。

只要这些东西还在，换一个模型，工作仍然可以继续。

公众号内延伸阅读：

Claude Code 实战系列 (一)：不懂这 7 个核心概念，用 AI 就是在拼体力

Claude Code 实战系列 (二)：30分钟从裸机到上手跑任务

用 Claude Code + Obsidian 搭一个能每天进化的 AI 分身