前两天吃饭的时候,朋友突然问我:
VS Code 和 Claude Code 有什么区别?
这个问题很好回答,又很不好回答。
它们根本不是同一个物种,但彼此之间又有关系,一时半会还真讲不清楚,所以就有了这篇文章。
这是一篇给新手的扫盲贴,希望能帮你构建起对 AI 工具的全局认知。
当脑子里有了这张全景地图,看懂了它们各自的站位,自然也就消除了对新工具的陌生和无措。

全文预计5000字,如果你准备好了,我们就出发啦~
先分清公司、模型和产品
OpenAI、Anthropic、Google,是公司。
GPT、Claude、Gemini,是它们开发的大模型家族,可以理解成藏在产品背后的“大脑”。
ChatGPT、Claude 和 Gemini 网页版,是普通用户打开网页就能使用的 AI 产品。
而 Codex、Claude Code 和 Antigravity,则是这三家公司面向编程和项目任务推出的 Agent。
为了方便记忆,你可以简单把它们的关系对应起来:

作为“大脑”,这些模型本身也在不断迭代,会有不同的版本。
比如 GPT-5.5、Gemini 3.1 Pro、Claude Opus 4.8、Claude Sonnet 4.6。数字通常代表模型代际,Pro、Opus 一般更偏复杂任务,Sonnet 更强调能力、速度和成本的平衡,Flash、Haiku、Instant 通常更快、更便宜。
| 常见名称 | 实际含义 |
|---|---|
| ChatGPT | |
| GPT-5.5 | |
| GPT-5.5 Thinking | |
| GPT-5.5 Pro | |
| GPT Image 2 | |
| Gemini 3.1 Pro | |
| Gemini 3 Flash | |
| Claude Fable 5 | |
| Claude Opus 4.8 | |
| Claude Sonnet 4.6 | |
| Claude Haiku 4.5 |
除了处理文字和代码,还有专门生成图片、视频或音乐的模型,比如目前生图领域最顶尖的 OpenAI 的 GPT Image 2,以及 Google 的 Nano Banana 2。
这些名字不用背,新手真正需要分清的只有三件事:
它是哪家公司开发的? 它是一个直接面向用户的产品,还是背后的模型? 它的定位更适合复杂的长线任务,还是日常的快速问答?
普通人最常用的:Chatbot 与 Agent
如果不考虑复杂的技术分类,普通人最常用的 AI 工具基本就是两类:
Chatbot 和 AI Agent。
Chatbot 就是我们已经很熟悉的聊天框( 如ChatGPT、Claude 和 Gemini网页端)。
你打开网页,输入问题,它回答你。
我现在仍然高频使用 ChatGPT 和 Gemini 网页端,不仅是因为包月模式下可以节省token,更重要的是网页端本身就有不可替代的优势。
Agent 不只和你讨论“怎么做”,它还能自己动手。 它可以进入真实的工作环境,读取资料、调用工具、修改文件、检查结果,然后自动往下推进。
Claude Code、Codex 和 Antigravity,都属于这一轮 Agent 化趋势中的代表产品。
一句话概括:
Chatbot 主要给你答案,Agent 开始接过任务。
当然,这两者的边界也正在变得模糊。ChatGPT、Claude、Gemini 这些聊天产品也在不断增加搜索、文件处理、工具调用和电脑操作能力。
这正是现在 AI 演化最明显的方向:
AI 正在从聊天框里走出来,越来越深入地进入我们的电脑和真实工作。
三家的编程 Agent 正在越来越像
虽然 Claude Code、Codex 和 Antigravity 在产品定义上各有侧重,但从我的实际体验来看,它们都在进化成高度趋同的全能型编程 Agent。
只要给它们一个本地项目,它们都能独立跑通完整的闭环:
读取文件 → 理解规则 → 调用工具与命令 → 修改内容 → 检查并自动修复报错。
即便是一开始主打多 Agent 管理的 Antigravity,在升级 2.0 并整合 Gemini CLI 后,也彻底看齐了这套标准。
所以,新手不必急着研究它们之间每一个功能差异,它们本质上都在做同一件事:
让 AI 不只回答问题,而是进入真实项目,把任务接过去。
Agent 是打工人,它还需要一个“工作环境”
前面说到,Agent 能帮你接管真实的本地任务,但这中间还缺一环。
这就像一个人很聪明,不代表他进入一家新公司后马上就能工作,他还需要办公桌、工作资料、软件权限、操作规范和验收标准。
Agent 是干活的人,而 VS Code、Cursor、终端和桌面 App,就是它进入电脑、开展工作的不同场所/环境。

先看可视化的工作台:VS Code 与 Cursor
VS Code、Cursor 这类工具经常被统称为 IDE。IDE 的中文是“集成开发环境”,听起来很专业,但其实它就是一个工作台,把文件编辑、项目管理、运行命令和各种扩展都集中在了这里。
VS Code 官方更常称自己为代码编辑器,它最初主要服务于编程,但现在它早已打破了“只能写代码”的限制,你可以用它打开本地文件夹,查看和修改文件。
如果要找一个东西来方便理解,你可以把它理解成手机的操作系统——它具有极其丰富的生态,Claude Code 和 Codex 都可以作为扩展(插件)安装到里面。
这也是我目前给新手最推荐的入口:
先装 VS Code,再从 Claude Code 或 Codex 里选一个使用。
原因不是它最先进,而是它足够通用,你不需要一次性研究所有工具,先在 VS Code 里让 Agent 进入一个真实文件夹,帮你完成一件具体的事就够了。
Cursor 则是一款基于 VS Code 改造的 AI 编程工具。
它把 Agent 能力更深地做进了编辑器,也支持 Claude、GPT、Gemini 和自研的 Composer 模型。
我没有实际使用过 Cursor,所以本文只帮助大家认识它,不作具体推荐。对于已经习惯的人可以继续用,但新手完全没必要因为大家都在讨论,就专门去更换编辑器。
再看命令行的工作台:终端(Terminal)
除了可视化的编辑器,终端(Terminal)同样是 Agent 的工作场所,但因为这一组词涉及的操作和概念稍微复杂一点,我们需要单独把它理清。
我最初学习AI时,最先接触到的就是终端,经常被 Terminal、PowerShell、CLI 这几个词搞晕,再加上非常极客的黑色终端界面和红色的报错代码,心里的抗拒感被拉满了,学的非常痛苦。
最简单的理解方式是:
- Windows Terminal: 输入和显示命令的“窗口”。可以理解成是收银台那台点单机。它本身只是一块屏幕和一个输入框,不负责做菜,只负责把“客人要什么”传进去。
- PowerShell: 负责理解和执行命令的“环境”。可以理解为点单机的收银系统。同一个点单机可以装不同的系统——PowerShell 是其中很懂厨房流程的一套;你也可以换成 CMD、Git Bash 这种别的系统。
- CLI:中文叫命令行接口,是软件开放出来的“文字操作门”。可以理解是餐厅给外卖员留的取餐窗口。平时你去店里吃饭,是走大门、坐着点菜(这是给人走的路);CLI 是给“会暗号的人”留的快速通道——只要报出特定的一串口令,后厨立刻出货,不需要走常规流程。
以前用 CLI,往往需要人手动去记、去敲命令,但在 Agent 时代,人不需要亲自操作。以飞书 CLI 为例,你只需要告诉 Agent:“把这个文件上传到飞书”,Agent 就会自动调用飞书 CLI 完成操作。
所以,今天 CLI 最大的价值不只是“让人在黑色窗口里敲命令”,更在于:
它给 Agent 提供了操作其他软件的可调用入口。
不过,虽然终端也是 Agent 的工作场所,但我强烈建议前期碰到终端时,直接跟着靠谱的教程无脑照做就行,不要去死磕。因为终端界面不够直观,一旦出错,很容易让新手心态崩溃。
补充说明:为什么没讲桌面 App?
你可能注意到了,前面提到了 Agent 也有桌面 App 形态,但这里没有深入说明。 我个人体验,桌面端会更好用。但不在这里展开,是因为它的网络配置和登录条件往往更苛刻,极易在一开始就把人卡住。
总结一下工作台的打怪升级路线:
无论是难啃的终端,还是门槛高的桌面 App,新手先别碰。一律先在配置最友好的 VS Code 里把 Agent 用起来。
等你清楚了它的运行逻辑,再去找教程慢慢迁移,饭要一口一口吃,工具要一步一步换。
为什么 Codex 看起来有很多种
很多新手第一次接触 Codex 时,还会遇到一个疑惑:为什么有人在 VS Code 里用,有人在终端里敲命令,有人打开的是独立 App,还有人在网页上用?
其实,它们并不是四个完全不同的 AI,而是 同一个 Agent 开了四扇不同的“门”:
VS Code 扩展 Codex CLI Codex 桌面 App Codex Web
Claude Code 和 Antigravity 也是一样的逻辑。
所以,千万不要被这些形态唬住,觉得要学四种不同的工具。这也是为什么我们在上一段强烈建议:既然背后都是同一个“打工人”,新手直接走最好进的那扇门(VS Code)就行了,其他的形态暂时全都不用管。
Git 与 GitHub:你的代码“游戏存档”
GitHub 也经常和 AI 编程一起出现,它是一个存放、分享和协作管理项目的云端平台。对新手来说,前期它可能只是一个经常需要去上面下载开源工具、环境包和插件的“资源网站”。
Git 是版本管理工具,负责记录项目文件发生过哪些变化。最直白的理解:
它就是你代码项目的“游戏存档”。
这里很想插一句自己的碎碎念:我一直觉得,把学习 AI 类比成打游戏,是最贴切的。看,这里又出现了“游戏存档”的概念。打游戏有时候就像人生,酸甜苦辣啥都会发生;但不同的是,游戏里试错和重来的成本极低,N 次尝试后,你总能找到正向的反馈。
在“乱拳打死老师傅”的新手阶段,Git 和 GitHub 看起来并没有那么重要。
你甚至完全不懂 GitHub,也可以让 Agent 帮你做出第一个脚本、网页或者本地工作流。
我自己一开始也是这么过来的。
但当你真正开始维护一个长期项目,需要知道 Agent 改了哪些文件、某个错误从哪里出现、怎么恢复以前的正常版本时,你会发现 Git 这个“存档功能”极其重要。
这一部分值得以后专门研究。我也准备后面认真补一次 Git,再单独写一篇。
模型竞争,已经进入 Harness Engineering 阶段
这里很想插一句吐槽:今年以来,每次看到铺天盖地的新模型发布、跑分比拼,我就觉得特别吵。
这些信息不仅会带来海量噪音,评测时还经常夹带私货,给普通人制造了毫无必要的焦虑。每个人的真实场景千差万别,跑分怎么可能代表全貌?就像大家普遍认为 ChatGPT 的模型比 Gemini 更强,但我自己在做深度文本修改、需要多模态识别时,就是觉得 Gemini 更好用。
我越来越明显地感觉到,对绝大部分日常任务来说,主流模型本身的能力已经足够强了。
国内模型当然还有差距,但在很多场景下已经完全够用了,国外顶级模型之间,也很难只用“谁的分数更高”来概括实际体验。
真正开始拉开差距的,是模型之外的东西:
它能拿到哪些资料 可以调用哪些工具 能不能进入真实工作环境 是否知道你的规则和边界 能不能检查自己做得对不对 出错以后是否可以继续修正
一个再聪明的模型,如果不看真实文件,也只能给通用废话。反之,哪怕不是第一的模型,只要能持续拿到你的项目资料和判断标准,也绝对比什么都不懂的模型强,这也是我一直以来的观点:
事实比模型更重要。
这背后对应的概念,就是 2026 年初进入公众视野的 Harness Engineering。
当时很多人还在纠结选什么模型、怎么装 OpenClaw 时,前沿的讨论重点已经转向:怎样给 Agent 搭一套能长期稳定工作的系统。
如果把大模型理解成大脑,Harness 就是围绕大脑搭建的工作环境、工具、资料、规则、权限和反馈机制,它可以压缩成一个极其简单的公式:

也就是 Agent 中除模型以外的其他所有东西。
模型决定它能想多远,而 Harness 决定它能不能稳定地把事情做完。
我的工作中心:铁打的本地项目,流水的 Agent

虽然我仍然建议新手从 VS Code 开始,但那只是一个更容易理解的入口,并不是我现在的使用状态。
我现在主要使用 Claude、Codex 和 Antigravity 的桌面端,再配合 ChatGPT 和 Gemini 网页端。
网页端主要用来进行初步的讨论、研究和想法碰撞;而桌面端的 Agent,则负责直接进入真实项目,读取资料并干活。
这里分享一个真实的细节:我目前使用 Claude 桌面端时,背后接入的是国产大模型 Minimax。
为什么?因为就像前面说的,当你的系统里沉淀了足够清晰的资料和规则(Harness),国内优秀的模型也完全能极其出色地把活干完。
但它们都不是我的工作中心。
我真正的工作中心,是电脑里的 Obsidian 仓库。
我的项目文件、公众号文章、工作记录、判断标准、表达偏好和工作流程,都保存在本地 Obsidian 中。
需要处理任务时,我可以把同一个项目扔给任何一个 Agent:今天让 Claude Code 处理,明天让 Codex 检查,另一个任务交给 Antigravity。
Agent 会变,背后调用的模型会变,使用的入口也会变。 但只要它们读取的是同一个本地项目、同一套真实的资料和规则,工作就可以完美继续。
这也是为什么我现在不再执着于“到底哪个 Agent 最好用”,我更关心的是:
无论换成哪个 Agent,它能不能快速进入我的工作环境,读懂事实,然后继续把事情做下去。
AI 分身不是复制一个会说话的我
很多人理解的 AI 分身,是训练一个说话很像自己的聊天机器人,但我理解的 AI 分身,更接近一套长期协作系统。
它知道我正在推进什么项目,能够读取我的真实资料,理解我的判断标准,知道哪些事情可以做、哪些事情必须先让我确认。当我不断把真实记录、纠偏过程和工作方法留在本地系统里,它就会在一次次任务中越来越懂我。
从这个角度看,AI 其实一直在不同程度、不同维度地代替人类原来亲自完成的工作:
最早它只是替我们回答问题; 后来开始替我们搜索、整理、写作、修改文件; 再往后,它开始操作软件、调用工具、运行任务和检查结果。
它不是某一天突然完整地“代替一个人”,而是在一点点接手具体环节。
人的位置也开始往上移动:从亲自执行每一个步骤,变成确定目标、提供事实、设置边界和验收结果。
真正应该留下来的,不是某个平台里的聊天记录
以前我会担心一个问题:如果某个 AI 账号突然被封了怎么办?我和 AI 产生的大量聊天记录、对我的了解以及长期积累的上下文,会不会一起消失?
如果所有东西都只存在某个平台里,这确实是一个巨大的风险。
但当项目、资料、记录、判断和工作方法都保存在自己的电脑上时,情况就不一样了。
模型、Agent、网页、插件、CLI 和桌面 App 这些入口,都可以更换。
但真正属于我的东西,一直会留在本地。
因此这套系统除了可以帮助我搭建 AI 分身外,它还有一个同样重要的价值:
它让我不再把自己的长期积累,绑定在任何一个模型、账号或者平台上。
我真正想保存的,从来不是和某一个 AI 聊过什么,而是我的项目、事实、判断和工作方法。
只要这些东西还在,换一个模型,工作仍然可以继续。
公众号内延伸阅读:
夜雨聆风