乐于分享
好东西不私藏

AI Coding 正在进入 Agent-First 时代:程序员该如何升级?

AI Coding 正在进入 Agent-First 时代:程序员该如何升级?

过去两年,AI 编程工具发展非常快。

从最早的代码补全,到现在的 Cursor、Claude Code、Codex、Antigravity、Gemini CLI、Roo Code、Cline、Continue 等工具,AI Coding 已经不再只是“帮你写几行代码”。

它正在从:

AI 辅助写代码

进入:

Agent 优先开发

下一步会继续走向:

AI 接管电脑 + 多 Agent 协作 + 软件开发全流程自动化

也就是说,未来程序员的核心竞争力,不只是会不会写代码,而是能不能把 AI Agent 用起来,把它变成真正的软件开发生产力。

一、当前阶段:AI 优先编程方式是什么?

现在主流 AI Coding 已经不是简单的代码补全了,而是几种方式混合使用。

大致可以分成五个层次。

1. 第一层:AI 补全 / 问答

代表工具:

* GitHub Copilot
* Cursor Tab
* JetBrains AI Assistant
* Continue
* VS Code 插件类 AI

这个阶段的特点是:

人还是主导,AI 负责补全、解释、生成局部代码。

常见使用方式包括:

* 写函数
* 改小 bug
* 解释代码
* 生成测试
* 查询 API 用法
* 根据注释补代码
* 根据上下文补全一小段逻辑

例如你写一个函数名,AI 自动补出函数体;你选中一段代码,让 AI 解释它的作用;你写注释,AI 根据注释生成代码。

这是最早期的 AI 编程方式,现在已经是基础能力。

它仍然有用,但已经不再是 AI Coding 的核心竞争力。

因为现在真正拉开差距的,不是“谁补全得快”,而是“谁能理解项目、拆解任务、自动执行、验证结果”。

2. 第二层:AI Chat + 项目上下文

代表工具:

* Cursor
* Windsurf
* VS Code + Cline / Roo Code
* Continue
* JetBrains AI
* Gemini Code Assist

这个阶段的特点是:

AI 能读整个项目,知道文件关系,可以回答“这个项目怎么改”。

以前你只能问 AI 单个文件里的问题,现在你可以问:

我想加一个登录功能,你先看下项目结构,告诉我需要改哪些文件。

AI 不再只是看你当前打开的代码,而是开始理解:

* 项目目录结构
* 前后端关系
* 组件关系
* API 调用方式
* 配置文件
* 测试文件
* 依赖关系
* 代码风格
* 业务模块边界

这个阶段比单文件补全强很多。

因为真实开发不是只写一个函数,而是需要理解整个项目。

比如你要加一个登录功能,它可能涉及:

* 前端登录页面
* 表单校验
* API 请求
* token 存储
* 路由守卫
* 后端接口
* 数据库用户表
* 错误提示
* 测试用例
* 文档更新

如果 AI 只能看一个文件,帮助有限。

但如果 AI 能理解项目上下文,它就可以告诉你:

需要修改这些文件:
1. src/pages/Login.tsx
2. src/api/auth.ts
3. src/store/user.ts
4. src/router/index.ts
5. backend/routes/auth.ts
6. backend/services/userService.ts
7. tests/auth.test.ts

这个阶段的核心能力是:

上下文管理能力。

谁能更准确地理解项目,谁就更适合作为主力 AI IDE。

3. 第三层:Agent 自动改代码

代表工具:

* Cursor Agent
* Windsurf Cascade
* Claude Code
* Codex CLI / Codex App
* Gemini CLI
* Antigravity
* Cline / Roo Code
* Aider
* OpenCode

这个阶段的特点是:

你不再一句句问,而是给任务,Agent 自己规划、改文件、跑命令、看报错、再修。

比如你可以直接说:

帮我把这个 React 页面接入登录接口,补齐 loading、错误提示、表单校验,并跑测试。

Agent 会自动做一整套流程:

1. 读取项目代码
2. 理解当前结构
3. 制定执行计划
4. 修改多个文件
5. 运行测试 / 构建
6. 读取报错
7. 根据报错继续修复
8. 再次验证
9. 总结改动

这个阶段,AI 已经不是“代码助手”,而更像“初级程序员 + 自动化执行器”。

开发方式也开始发生变化。

以前是:

人思考 → 人写代码 → 人运行测试 → 人修 bug

现在变成:

人下达目标 → Agent 拆任务 → Agent 改代码 → Agent 运行测试 → 人审查结果

这就是 AI Coding 的关键变化:

从“让 AI 写代码”变成“让 AI 执行开发任务”。

程序员的角色也会随之变化。

以前你要亲自写每一行代码。

现在你更需要做的是:

* 明确目标
* 拆解任务
* 设定边界
* 提供上下文
* 设计验证标准
* 审查 AI 改动
* 控制风险

也就是说,程序员开始从“代码生产者”,变成“Agent 指挥者”。

4. 第四层:MCP / Skills / 规则沉淀

代表工具:

* Claude Code
* Cursor Agent Skills
* Codex MCP / AGENTS.md
* Antigravity MCP / Skills
* Roo Code / Cline MCP
* Continue 自定义上下文
* OpenCode 多模型 Agent

这一层非常关键。

因为现在的 AI Coding 已经不只是“模型能力竞争”,而是进入了:

模型能力 + Agent 框架 + MCP 工具生态 + Skills 工作流 + 项目规则沉淀

其中,MCP 已经成为开发 Agent 连接外部工具的重要插件标准之一。

它的价值不是概念,而是已经在真实开发中落地。

MCP 是什么?

简单理解:

MCP = AI Agent 连接外部工具和数据的标准接口。

通过 MCP,AI Agent 可以访问:

* 数据库
* GitHub
* GitLab
* Jira
* Linear
* Figma
* 浏览器
* 本地文件
* API 文档
* 日志系统
* 测试平台
* 公司内部知识库
* Shell / Terminal
* Slack / 飞书 / 邮件
* Playwright 自动化测试
* Postgres / MySQL 数据库

没有 MCP 的 Agent,主要只能读文件、改文件、跑命令。

有 MCP 的 Agent,可以真正进入你的开发工作流。

例如:

* 接 GitHub MCP:自动读 issue、开 PR、看代码审查意见
* 接 Figma MCP:根据设计稿改前端页面
* 接数据库 MCP:查看表结构、生成 SQL、排查数据问题
* 接 Playwright MCP:自动打开浏览器测试页面
* 接 Jira MCP:读取任务、更新状态
* 接飞书 / Slack MCP:通知团队
* 接 API 文档:自动生成接口调用
* 接日志系统:分析线上报错

所以 MCP 的意义是:

让 AI Agent 从“会写代码”变成“会使用工具完成任务”。

这已经不是单纯的未来想象,而是当前 Agent 开发工具正在普遍采用的能力。

Skills 是什么?

简单理解:

Skills = 把你的开发经验、项目规范、常用流程打包给 Agent 重复使用。

例如你可以沉淀一个前端开发 Skill:

前端改动 Skill:
1. 先检查组件结构
2. 再确认接口来源
3. 再改 UI
4. 必须补齐 loading / error / empty 状态
5. 必须跑 npm run lint
6. 必须跑 npm run test
7. 最后总结改动文件和风险点

也可以沉淀一个后端开发 Skill:

后端接口 Skill:
1. 先检查路由层
2. 再检查 service 层
3. 再检查数据库 model
4. 接口必须有参数校验
5. 错误返回必须统一格式
6. 必须补充单元测试
7. 最后更新接口文档

还可以沉淀代码审查 Skill:

代码审查 Skill:
1. 检查是否破坏现有功能
2. 检查是否有类型错误
3. 检查是否有安全风险
4. 检查是否有重复代码
5. 检查是否缺少测试
6. 检查是否符合项目规范
7. 输出问题等级和修改建议

这一步非常重要。

因为它代表 AI 编程从“临时对话”,进入“可复用工作流”。

你不再每次都从零开始教 AI。

而是把你的经验、项目规则、团队规范沉淀成长期资产。

这一步是从“会用 AI”进化到:

会管理 AI 工作流。

5. 第五层:IDE + CLI Agent 成为当前主流组合

现在专业开发者使用 AI Coding,已经不只是打开一个 AI IDE。

更常见、更实用的组合是:

IDE + CLI Agent + MCP + Git Worktree + 自动测试

也就是:

* IDE 负责看代码、编辑、审查
* CLI Agent 负责复杂任务执行
* MCP 负责连接外部工具
* Git Worktree 负责隔离多个任务
* 测试和 CI 负责验证结果

代表组合包括:

Cursor / VS Code
+
Claude Code / Codex CLI / Gemini CLI / Aider / OpenCode
+
Roo Code / Cline / Continue
+
Git Worktree
+
Playwright / CI

这已经是当前 AI 优先开发里非常实用的一种工作方式。

为什么 CLI Agent 已经是标配?

因为真实开发不是只靠编辑器聊天就够了。

很多任务天然适合放到终端里执行:

* 跑测试
* 执行构建
* 批量改文件
* 操作 Git
* 分析报错日志
* 启动本地服务
* 执行脚本
* 调试依赖问题
* 生成 PR diff
* 长程重构
* 多任务并行

CLI Agent 的优势是:

它离真实工程环境最近。

它能直接使用:

* Shell
* Git
* npm / pnpm / yarn
* Python / uv / pip
* Docker
* 测试命令
* 构建命令
* 本地脚本
* 项目配置

所以现在很多开发者会这样工作:

1. 用 Cursor / VS Code 阅读项目和做局部修改
2. 用 Claude Code 执行复杂改造
3. 用 Codex CLI 做 OpenAI 生态任务
4. 用 Gemini CLI 做大上下文分析
5. 用 Aider / OpenCode 做 Git diff 级别修改
6. 用 Git Worktree 隔离多个 Agent 任务
7. 用测试和 CI 验证结果

这已经不是未来设想,而是当前 AI Coding 的成熟用法。

二、Agent 优先的未来趋势和进度

如果说当前 AI Coding 已经进入了 Agent 阶段,那么未来真正值得关注的,不是 MCP 会不会成为标准,也不是 CLI Agent 会不会普及。

因为这些已经在发生,并且已经成为很多专业开发者的日常工具链。

下一阶段更大的变化主要有两个:

1. IDE 会从代码编辑器升级为 Agent 控制台
2. Codex 已经落地电脑接管,多 Agent 协作正在走向软件交付自动化

趋势 1:IDE 正在从代码编辑器升级为 Agent 控制台

传统 IDE 是这样的:

人打开文件 → 人写代码 → 人运行测试 → 人提交代码

未来 IDE 更像这样:

人下达目标 → Agent 拆任务 → Agent 改代码 → Agent 验证 → 人审查合并

也就是说,IDE 不再只是编辑器,而会变成:

* 任务控制台
* Agent 管理器
* 多工作区控制台
* 代码审查中心
* 自动化执行平台
* 项目知识库入口
* 测试和验证中心

Google Antigravity 就是这个方向的代表。

它不是单纯的代码补全工具,而是 Agent-First IDE。

它强调 Agent 可以规划、执行、验证任务,并且可以跨编辑器、终端、浏览器工作。

未来的 IDE 很可能不再只是一个“写代码窗口”,而是一个“Agent 工作台”。

你在里面管理多个 Agent:

Agent A:负责前端页面
Agent B:负责后端接口
Agent C:负责测试
Agent D:负责代码审查
Agent E:负责文档和部署

程序员则负责:

* 分配任务
* 审查结果
* 处理关键决策
* 设计架构
* 控制质量
* 控制风险

这就是 Agent-First IDE 的方向。

趋势 2:Codex 已经落地电脑接管,多 Agent 协作正在走向软件交付自动化

电脑接管控制和多 Agent 协作,本质上是同一个方向的两个部分。

以前 AI Coding 主要解决的是:

AI 帮你写代码

现在 Agent 开始解决的是:

AI 帮你执行开发任务

而 Codex 最新版本已经把这个方向往前推了一步。

Codex 已经支持 computer use,可以在 macOS 上看到并操作图形界面,用于桌面 App 检查、浏览器操作、修改 App 设置、处理没有插件的数据源、复现只在 GUI 里出现的问题等场景。

Codex 也已经支持通过自己的光标在电脑上看、点击、输入,并且多个 Agent 可以在 Mac 上并行工作,不影响用户在其他 App 里的操作。

这说明电脑接管已经不是概念,而是开始进入实际开发工具。

它意味着 Agent 不只是改代码,还能参与真实软件验证流程。

例如你做了一个登录功能,Agent 不仅能改代码,还可以:

1. 启动项目
2. 打开浏览器
3. 进入登录页
4. 输入账号密码
5. 点击登录
6. 检查是否跳转 dashboard
7. 截图确认 UI
8. 如果失败,读取错误信息
9. 回到代码继续修复

这就从“写代码”升级到了“验证软件”。

真实的软件开发不只发生在代码文件里,还发生在:

* 浏览器
* 终端
* 桌面 App
* iOS / Android 模拟器
* 后台管理系统
* Figma
* Postman
* 数据库客户端
* CI/CD 平台
* 云控制台
* 内部业务系统

所以 Agent 如果只会改代码,还不够。

它还需要能:

* 打开浏览器验证页面
* 操作模拟器复现 bug
* 点击后台管理系统检查数据
* 使用 Postman 验证接口
* 查看 Figma 设计稿
* 读取 CI 报错
* 操作测试平台
* 截图留证
* 根据验证结果继续修代码

这时,多 Agent 协作就会自然出现。

例如一个完整任务可以拆成:

Agent A:需求分析,拆分任务
Agent B:前端实现
Agent C:后端接口
Agent D:测试和自动化验证
Agent E:代码审查和安全检查
Agent F:文档、部署和发布说明

其中电脑接管能力主要用于:

浏览器验证
UI 测试
模拟器测试
后台系统检查
截图确认
GUI 工具操作

这就不是单纯“AI 写代码”了,而是:

AI Agent 团队协作完成软件交付。

未来的开发流程可能会变成:

人提出目标

主 Agent 拆分任务

多个子 Agent 并行执行

编码 Agent 修改代码

测试 Agent 跑测试

电脑操作 Agent 打开浏览器 / 模拟器验证

审查 Agent 检查风险

文档 Agent 更新说明

人类开发者最终审查、合并、发布

一句话总结:

Codex 已经证明电脑接管能力开始落地;下一步更大的变化,是电脑接管和多 Agent 协作融合,推动软件交付自动化。

三、结合电脑接管控制,程序开发人员应该怎么发展?

如果站在程序员个人发展角度,我的建议很明确:

不要只定位成“写代码的人”,要升级成“AI Agent 驱动的软件工程师”。

未来单纯写 CRUD、页面、接口的人,会受到很大冲击。

因为这些任务越来越容易被 Agent 执行。

但真正有价值的程序员,不会消失,而是会升级。

1. 从“写代码的人”升级为“AI Agent 驱动的软件工程师”

未来程序员的核心职责会从:

我来写每一行代码

变成:

我来定义目标、拆任务、设计架构、指挥 Agent、审查结果、保证交付

你需要负责:

* 定义需求
* 拆解任务
* 设计架构
* 配置 Agent
* 管理上下文
* 设计测试
* 审查代码
* 控制风险
* 交付结果

AI 可以帮你写代码,但它需要你告诉它:

* 为什么这么做
* 边界在哪里
* 哪些不能动
* 什么结果算完成
* 如何验证正确
* 失败了怎么处理
* 风险点在哪里

所以未来优秀程序员的价值,不是消失,而是向上迁移。

从代码执行层,迁移到任务设计层、架构层、验证层和交付层。

2. 必须掌握“可验证开发”

Agent 最怕任务没有验证标准。

如果你只说:

帮我做一个登录功能

Agent 可能会做出一个看起来能用,但实际上很多边界没处理的版本。

更好的方式是:

帮我做一个登录功能,完成后必须满足:
1. npm run lint 通过
2. npm run test 通过
3. 登录失败显示错误提示
4. 登录成功跳转 dashboard
5. token 正确保存
6. 刷新页面后登录状态保持
7. 补充一个 e2e 测试

这就是可验证开发。

你需要强化这些能力:

* 单元测试
* E2E 测试
* TypeScript 类型
* lint
* CI/CD
* 日志
* 监控
* 回归测试
* 自动化截图验证
* 接口测试
* 数据库迁移验证

未来使用 Agent 的关键不是“多会提问”,而是“会不会定义完成标准”。

因为 Agent 需要反馈信号。

测试、类型系统、lint、构建结果、浏览器验证,都是反馈信号。

没有这些验证机制,Agent 容易乱改。

有了这些验证机制,Agent 就可以不断试错、修复、收敛。

所以未来程序员必须从“写代码”升级到“设计验证体系”。

3. 建立自己的 Skills / 工作流库

你应该把常用经验沉淀成文件。

例如:

/frontend-skill.md
/backend-skill.md
/code-review-skill.md
/refactor-skill.md
/test-skill.md
/deploy-skill.md
/project-rules.md
/agent-rules.md

这些文件里可以写:

* 项目架构
* 编码规范
* 接口规范
* 测试要求
* 提交流程
* 禁止事项
* 常用命令
* 业务规则
* 数据库规范
* 错误处理规范
* 日志规范
* 安全边界
* 部署流程
* 回滚流程

例如项目规则可以这样写:

项目规则:
1. 不允许直接修改生产配置
2. 所有接口必须有参数校验
3. 所有前端请求必须处理 loading/error/empty 状态
4. 所有新增功能必须补测试
5. 修改数据库结构必须新增 migration
6. 不允许删除已有测试
7. 提交前必须运行 npm run lint 和 npm run test
8. 涉及鉴权的代码必须重点说明风险

以后不管你用 Cursor、Claude Code、Codex、Antigravity,还是 Roo Code / Cline,这些规则都可以迁移。

它们就是你的个人 AI 编程资产。

谁能更早沉淀自己的 Skills 和项目规范,谁就能更快把 AI 变成稳定生产力。

4. 学会搭建 MCP 工具体系

建议优先掌握这些 MCP / 工具连接。

类型 作用
GitHub / GitLab issue、PR、代码审查
File system 管理本地项目文件
Playwright / Browser 自动浏览器测试
Figma 设计稿到前端
Postgres / MySQL 查数据库 schema
API 文档 / OpenAPI 生成接口调用
Jira / Linear 任务管理
Slack / 飞书 / 邮件 通知和协作
Shell / Terminal 自动跑命令
Memory / Knowledge 项目长期知识
日志 / 监控 分析线上问题
CI/CD 自动验证和发布

你的目标不是装很多 MCP。

而是围绕开发闭环搭建:

需求 → 设计 → 编码 → 测试 → 浏览器验证 → PR → 部署 → 通知

一个实用的 Agent 工具体系可以是:

GitHub MCP:读任务、开 PR
Figma MCP:读设计稿
File MCP:改项目文件
Terminal MCP:跑命令
Playwright MCP:浏览器测试
Database MCP:查表结构
Slack / 飞书 MCP:通知结果

这样 Agent 就不只是写代码,而是能完成一整条开发链路。

5. 电脑接管能力要用,但不能完全放权

电脑接管能力很强,但也有风险。

适合让 AI 做:

* UI 自动测试
* 浏览器点击验证
* 复现 bug
* 操作模拟器
* 检查后台页面
* 截图验证
* 批量配置低风险软件
* 操作本地开发环境
* 测试登录流程
* 测试表单流程
* 测试页面跳转
* 检查页面样式

不建议一开始让 AI 做:

* 付款
* 删除数据
* 生产环境操作
* 修改云资源
* 发布正式版本
* 操作敏感账号
* 无确认执行破坏性命令
* 删除数据库
* 修改权限配置
* 关闭安全策略

你应该设置权限边界。

例如:

允许:
– 读文件
– 改项目文件
– 跑测试
– 打开浏览器
– 操作本地模拟器
– 截图验证
– 访问本地开发页面
必须确认:
– 删除文件
– 提交代码
– 推送远程
– 部署生产
– 修改数据库
– 操作账号设置
– 修改云资源
– 执行 rm -rf 类命令

未来真正值钱的是:

会让 AI 自动干活,同时知道哪里不能让 AI 自动干。

这就是 AI Agent 时代的安全边界能力。

四、下一代 AI Coding 工具方向:电脑接管型 Coding Agent 会成为首选

前面讨论过很多工具,包括 Cursor、Claude Code、Codex、Antigravity、Gemini CLI、Roo Code、Cline、Continue 等。

如果按照下一代开发工具的发展方向来看,核心判断是:

具有电脑接管控制能力的 Coding Agent,会成为下一代开发工具首选。

因为 AI Coding 的竞争重点,正在从:

谁能更快补全代码

转向:

谁能真正执行软件开发任务

再进一步转向:

谁能操作电脑、验证软件、协作交付项目

未来开发工具的核心能力,不只是生成代码,而是要能完成完整闭环:

理解需求

拆解任务

修改代码

运行项目

打开浏览器 / 桌面 App 验证

发现问题

继续修复

生成测试

提交变更说明

等待人类审查

所以,谁能把 写代码 + 跑命令 + 浏览器验证 + GUI 操作 + 多 Agent 协作 结合起来,谁就更接近下一代开发工具。

1. Codex:电脑接管型 Coding Agent 的代表,会成为下一代首选方向

Codex 的定位已经不只是传统 coding agent。

它更像是:

能操作电脑的软件交付 Agent。

Codex 的关键优势在于,它已经把 computer use / 电脑接管控制 带进开发工作流。

这意味着它不只是能改代码,还可以:

* 打开浏览器
* 操作页面
* 点击按钮
* 输入内容
* 查看 UI 状态
* 操作桌面 App
* 复现 GUI 问题
* 截图验证结果
* 多 Agent 并行处理任务
* 在本地开发环境中完成验证

这对软件开发非常关键。

因为真实开发不是写完代码就结束,而是要验证:

* 页面能不能打开
* 登录能不能成功
* 按钮能不能点击
* 表单有没有报错
* 样式有没有错位
* 路由跳转是否正常
* 后台系统数据是否正确
* 桌面端 App 是否符合预期
* 只在 GUI 里出现的问题能不能复现

以前这些事情需要人来做。

现在具备电脑接管能力的 Agent 可以参与完成。

所以 Codex 的意义不只是“写代码更强”,而是代表了一种新方向:

AI Coding 从代码生成工具,升级为电脑接管型软件交付工具。

这类工具会成为下一代开发者首选,因为它能覆盖更完整的开发闭环。

2. Cursor:当前主力 AI IDE,正在跟进 Agent 控制台和电脑操作能力

Cursor 仍然是当前最适合作为主力开发入口的 AI IDE 之一。

它的优势是:

* IDE 体验成熟
* 项目上下文理解强
* 多文件修改方便
* Agent 改代码体验好
* Chat / Composer / Tab / Agent 结合顺畅
* 适合长期做真实项目
* 更接近传统开发者的工作习惯

所以现阶段,如果你需要一个稳定的日常开发入口,Cursor 仍然很强。

但是从下一代方向看,Cursor 也需要继续跟进:

* Agent 控制台
* 多 Agent 并行
* 电脑操作能力
* 浏览器验证
* 端到端任务执行
* 更强的 MCP 和 Skills 工作流

也就是说,Cursor 当前更像:

主力 AI IDE + Agent 开发入口。

而 Codex 代表的方向更像:

电脑接管型 Coding Agent。

未来 Cursor 如果把电脑操作、Agent 控制台、多 Agent 协作继续补强,它仍然会是非常强的主力工具。

所以对开发者来说,现阶段比较稳的判断是:

Cursor 适合作为现在的主力 IDE,Codex 代表下一代电脑接管型开发工具方向。

3. Claude Code:从 CLI 强执行工具,开始转向桌面端和完整 Agent 工作流

Claude Code 以前最强的形态是 CLI。

它的优势非常明显:

* 复杂任务执行强
* 终端操作自然
* 适合长程重构
* 适合跑测试和修报错
* 适合读项目、改文件、总结变更
* MCP 和 Skills 工作流比较成熟
* 很适合专业开发者做复杂工程任务

所以 Claude Code 一直很像:

终端里的强执行程序员。

但现在 AI Coding 的方向在变化。

只在 CLI 里执行任务已经不够了。

下一代工具需要更完整的能力:

* 可视化任务管理
* 桌面端交互
* 多 Agent 协作
* 浏览器 / GUI 验证
* 项目级任务控制台
* 更直观的审查和回滚
* 和本地 IDE 更深结合

所以 Claude Code 也会从单纯 CLI 工具,逐步向:

CLI + 桌面端 + MCP + Skills + 电脑操作 + Agent 工作流

这个方向演进。

它的核心优势仍然是复杂任务执行能力。

但未来如果要和 Codex、Cursor、Antigravity 竞争,就必须补齐桌面端体验和电脑接管控制能力。

一句话:

Claude Code 的强项是 CLI 执行力,下一步重点是从终端工具升级为完整桌面 Agent 开发平台。

4. Antigravity:Agent-First IDE 方向代表,但成熟度还需要观察

Antigravity 代表的是另一个方向:

IDE 从代码编辑器升级为 Agent 控制台。

它强调的不是传统补全,而是:

* Agent 规划任务
* Agent 执行任务
* Agent 验证结果
* 多 Agent 管理
* 编辑器 / 终端 / 浏览器联动
* Mission Control 式工作流

这个方向是对的。

因为未来 IDE 很可能不再只是写代码的窗口,而是一个 Agent 工作台。

但 Antigravity 作为长期主力工具,还需要继续观察:

* 稳定性
* 生态成熟度
* 模型选择自由度
* MCP / Skills 实用程度
* 国内网络体验
* 长期额度和价格
* 对真实复杂项目的适配能力

所以它现在更适合:

观察、体验、尝鲜,以及判断未来 IDE 形态。

不一定马上作为唯一主力。

5. Gemini CLI:Google 生态和大上下文补充

Gemini CLI 更适合作为工具链补充。

它的优势是:

* 命令行使用方便
* 适合 Google 模型生态
* 适合大上下文代码分析
* 适合快速解释代码
* 可以配合 Antigravity / AI Studio 使用

它不一定是唯一主力,但可以作为:

Google 模型的命令行补充工具。

尤其适合需要大上下文、快速分析、Google API / Gemini 生态开发的场景。

6. Roo Code / Cline / Continue:多模型、MCP、自定义工作流补充

这类工具的价值在于灵活。

它们适合:

* VS Code 用户
* 多模型切换
* 自定义 API
* OpenAI-compatible 模型
* 国内模型接入
* MCP 工具调用
* 本地模型接入
* 自定义 Agent 工作流

如果你想接:

* DeepSeek
* Qwen
* MiniMax
* OpenRouter
* 本地 Ollama
* 自建 OpenAI-compatible API

这类工具通常比官方闭环产品更自由。

所以它们的定位是:

灵活的多模型和 MCP 补充层。

但从下一代首选工具的角度看,它们更像增强插件,不一定是最终主力平台。

小结

下一代 AI Coding 工具的核心,不再只是“会不会写代码”。

而是:

能不能接管电脑、操作 GUI、验证结果、协作交付。

因此工具判断可以这样看:

工具 当前定位 下一代价值
Codex 电脑接管型 Coding Agent 最接近下一代首选方向
Cursor 当前主力 AI IDE 正在跟进 Agent 控制台和电脑操作
Claude Code CLI 强执行 Agent 正从 CLI 向桌面端和完整 Agent 工作流演进
Antigravity Agent-First IDE 探索 代表未来 IDE 控制台方向
Gemini CLI Google 命令行补充 大上下文和 Gemini 生态补充
Roo Code / Cline / Continue 多模型 / MCP 插件层 灵活补充,不一定是最终主力

最终判断:

短期主力开发:Cursor + Claude Code 仍然稳。
下一代首选方向:Codex 这种具备电脑接管控制能力的 Coding Agent。
长期趋势:IDE 会变成 Agent 控制台,Coding Agent 会变成软件交付 Agent。

五、程序员发展路线建议

如果你是程序开发人员,我建议按三个阶段升级。

阶段 1:现在马上做

先形成一套稳定组合。

推荐组合:

Cursor / VS Code
+
Claude Code
+
Codex 或 Gemini CLI
+
Git Worktree
+
基础 MCP

更具体一点:

Cursor:主力 IDE
Claude Code:复杂任务执行
Codex:电脑操作验证
Roo Code / Cline:多模型和 MCP 补充
Git Worktree:多任务隔离
Playwright:浏览器自动化测试

这样你既有 IDE,也有 CLI Agent,也有电脑操作,也有多模型和 MCP 扩展。

不要只押一个工具。

因为现在 AI Coding 工具还在快速变化。

最稳的方式是:

主力工具稳定,辅助工具灵活。

阶段 2:建立 AI 开发规范

给每个项目准备这些文件:

README.md
AGENTS.md
PROJECT_RULES.md
TESTING.md
API.md
DEPLOY.md
CONTRIBUTING.md

让 Agent 每次进入项目都知道:

* 项目怎么启动
* 项目怎么测试
* 项目怎么构建
* 哪些文件不能改
* 代码风格是什么
* 业务规则是什么
* 接口规范是什么
* 完成标准是什么
* 部署流程是什么
* 出错如何回滚

例如:

AGENTS.md:
1. 修改代码前先阅读 PROJECT_RULES.md
2. 不允许删除已有测试
3. 所有新增功能必须补测试
4. 修改前端必须处理 loading/error/empty
5. 修改后端必须补参数校验
6. 提交前必须运行 lint 和 test
7. 不允许直接修改生产环境配置
8. 所有风险点必须在总结里说明

这类文件对 Agent 非常重要。

它能显著降低 AI 乱改代码的概率。

阶段 3:把自己升级成 Agent 架构师

未来比较有竞争力的程序员,需要具备这些能力:

能力 价值
架构设计 AI 能写代码,但需要方向
需求拆解 Agent 需要清晰任务
测试设计 没测试,Agent 容易乱改
工具链集成 MCP / CI / Git / 浏览器自动化
代码审查 AI 生成代码仍需人把关
安全边界 防止 AI 误操作
性能优化 AI 不一定懂系统瓶颈
业务理解 这是最难被替代的部分
Prompt / 指令设计 决定 Agent 执行质量
工作流沉淀 把经验变成可复用资产

未来的优秀程序员,不是不用 AI 的人,也不是完全依赖 AI 的人。

而是能做到:

我知道什么适合交给 AI。
我知道怎么让 AI 做得更好。
我知道怎么验证 AI 的结果。
我知道什么时候必须人工介入。

这类人会变得更有价值。

六、最终建议

如果你是程序开发人员,不要只追“哪个 AI IDE 最火”。

应该按这个方向布局:

主力 IDE + CLI Agent + MCP 工具 + Skills 规范 + 电脑操作验证 + 自动测试。

具体落地可以这样:

主力:Cursor
执行:Claude Code
电脑操作:Codex / Claude computer-use
多模型补充:Roo Code / Cline / Continue
未来观察:Antigravity
大上下文补充:Gemini CLI

你的个人发展方向应该是:

从“会写代码”升级为“会指挥 AI Agent 交付软件”。

最关键的 5 个能力:

1. 会拆任务
2. 会写项目规则
3. 会配置 MCP
4. 会设计测试和验证标准
5. 会审查 AI 产物并控制风险

最后用一句话总结:

AI Coding 的未来不是程序员消失,而是普通程序员变成 Agent 操作员,优秀程序员变成 Agent 架构师和软件交付负责人。