AI Coding 正在进入 Agent-First 时代:程序员该如何升级?
过去两年,AI 编程工具发展非常快。
从最早的代码补全,到现在的 Cursor、Claude Code、Codex、Antigravity、Gemini CLI、Roo Code、Cline、Continue 等工具,AI Coding 已经不再只是“帮你写几行代码”。
它正在从:
AI 辅助写代码
进入:
Agent 优先开发
下一步会继续走向:
AI 接管电脑 + 多 Agent 协作 + 软件开发全流程自动化
也就是说,未来程序员的核心竞争力,不只是会不会写代码,而是能不能把 AI Agent 用起来,把它变成真正的软件开发生产力。
⸻
一、当前阶段:AI 优先编程方式是什么?
现在主流 AI Coding 已经不是简单的代码补全了,而是几种方式混合使用。
大致可以分成五个层次。
⸻
1. 第一层:AI 补全 / 问答
代表工具:
* GitHub Copilot
* Cursor Tab
* JetBrains AI Assistant
* Continue
* VS Code 插件类 AI
这个阶段的特点是:
人还是主导,AI 负责补全、解释、生成局部代码。
常见使用方式包括:
* 写函数
* 改小 bug
* 解释代码
* 生成测试
* 查询 API 用法
* 根据注释补代码
* 根据上下文补全一小段逻辑
例如你写一个函数名,AI 自动补出函数体;你选中一段代码,让 AI 解释它的作用;你写注释,AI 根据注释生成代码。
这是最早期的 AI 编程方式,现在已经是基础能力。
它仍然有用,但已经不再是 AI Coding 的核心竞争力。
因为现在真正拉开差距的,不是“谁补全得快”,而是“谁能理解项目、拆解任务、自动执行、验证结果”。
⸻
2. 第二层:AI Chat + 项目上下文
代表工具:
* Cursor
* Windsurf
* VS Code + Cline / Roo Code
* Continue
* JetBrains AI
* Gemini Code Assist
这个阶段的特点是:
AI 能读整个项目,知道文件关系,可以回答“这个项目怎么改”。
以前你只能问 AI 单个文件里的问题,现在你可以问:
我想加一个登录功能,你先看下项目结构,告诉我需要改哪些文件。
AI 不再只是看你当前打开的代码,而是开始理解:
* 项目目录结构
* 前后端关系
* 组件关系
* API 调用方式
* 配置文件
* 测试文件
* 依赖关系
* 代码风格
* 业务模块边界
这个阶段比单文件补全强很多。
因为真实开发不是只写一个函数,而是需要理解整个项目。
比如你要加一个登录功能,它可能涉及:
* 前端登录页面
* 表单校验
* API 请求
* token 存储
* 路由守卫
* 后端接口
* 数据库用户表
* 错误提示
* 测试用例
* 文档更新
如果 AI 只能看一个文件,帮助有限。
但如果 AI 能理解项目上下文,它就可以告诉你:
需要修改这些文件:
1. src/pages/Login.tsx
2. src/api/auth.ts
3. src/store/user.ts
4. src/router/index.ts
5. backend/routes/auth.ts
6. backend/services/userService.ts
7. tests/auth.test.ts
这个阶段的核心能力是:
上下文管理能力。
谁能更准确地理解项目,谁就更适合作为主力 AI IDE。
⸻
3. 第三层:Agent 自动改代码
代表工具:
* Cursor Agent
* Windsurf Cascade
* Claude Code
* Codex CLI / Codex App
* Gemini CLI
* Antigravity
* Cline / Roo Code
* Aider
* OpenCode
这个阶段的特点是:
你不再一句句问,而是给任务,Agent 自己规划、改文件、跑命令、看报错、再修。
比如你可以直接说:
帮我把这个 React 页面接入登录接口,补齐 loading、错误提示、表单校验,并跑测试。
Agent 会自动做一整套流程:
1. 读取项目代码
2. 理解当前结构
3. 制定执行计划
4. 修改多个文件
5. 运行测试 / 构建
6. 读取报错
7. 根据报错继续修复
8. 再次验证
9. 总结改动
这个阶段,AI 已经不是“代码助手”,而更像“初级程序员 + 自动化执行器”。
开发方式也开始发生变化。
以前是:
人思考 → 人写代码 → 人运行测试 → 人修 bug
现在变成:
人下达目标 → Agent 拆任务 → Agent 改代码 → Agent 运行测试 → 人审查结果
这就是 AI Coding 的关键变化:
从“让 AI 写代码”变成“让 AI 执行开发任务”。
程序员的角色也会随之变化。
以前你要亲自写每一行代码。
现在你更需要做的是:
* 明确目标
* 拆解任务
* 设定边界
* 提供上下文
* 设计验证标准
* 审查 AI 改动
* 控制风险
也就是说,程序员开始从“代码生产者”,变成“Agent 指挥者”。
⸻
4. 第四层:MCP / Skills / 规则沉淀
代表工具:
* Claude Code
* Cursor Agent Skills
* Codex MCP / AGENTS.md
* Antigravity MCP / Skills
* Roo Code / Cline MCP
* Continue 自定义上下文
* OpenCode 多模型 Agent
这一层非常关键。
因为现在的 AI Coding 已经不只是“模型能力竞争”,而是进入了:
模型能力 + Agent 框架 + MCP 工具生态 + Skills 工作流 + 项目规则沉淀
其中,MCP 已经成为开发 Agent 连接外部工具的重要插件标准之一。
它的价值不是概念,而是已经在真实开发中落地。
⸻
MCP 是什么?
简单理解:
MCP = AI Agent 连接外部工具和数据的标准接口。
通过 MCP,AI Agent 可以访问:
* 数据库
* GitHub
* GitLab
* Jira
* Linear
* Figma
* 浏览器
* 本地文件
* API 文档
* 日志系统
* 测试平台
* 公司内部知识库
* Shell / Terminal
* Slack / 飞书 / 邮件
* Playwright 自动化测试
* Postgres / MySQL 数据库
没有 MCP 的 Agent,主要只能读文件、改文件、跑命令。
有 MCP 的 Agent,可以真正进入你的开发工作流。
例如:
* 接 GitHub MCP:自动读 issue、开 PR、看代码审查意见
* 接 Figma MCP:根据设计稿改前端页面
* 接数据库 MCP:查看表结构、生成 SQL、排查数据问题
* 接 Playwright MCP:自动打开浏览器测试页面
* 接 Jira MCP:读取任务、更新状态
* 接飞书 / Slack MCP:通知团队
* 接 API 文档:自动生成接口调用
* 接日志系统:分析线上报错
所以 MCP 的意义是:
让 AI Agent 从“会写代码”变成“会使用工具完成任务”。
这已经不是单纯的未来想象,而是当前 Agent 开发工具正在普遍采用的能力。
⸻
Skills 是什么?
简单理解:
Skills = 把你的开发经验、项目规范、常用流程打包给 Agent 重复使用。
例如你可以沉淀一个前端开发 Skill:
前端改动 Skill:
1. 先检查组件结构
2. 再确认接口来源
3. 再改 UI
4. 必须补齐 loading / error / empty 状态
5. 必须跑 npm run lint
6. 必须跑 npm run test
7. 最后总结改动文件和风险点
也可以沉淀一个后端开发 Skill:
后端接口 Skill:
1. 先检查路由层
2. 再检查 service 层
3. 再检查数据库 model
4. 接口必须有参数校验
5. 错误返回必须统一格式
6. 必须补充单元测试
7. 最后更新接口文档
还可以沉淀代码审查 Skill:
代码审查 Skill:
1. 检查是否破坏现有功能
2. 检查是否有类型错误
3. 检查是否有安全风险
4. 检查是否有重复代码
5. 检查是否缺少测试
6. 检查是否符合项目规范
7. 输出问题等级和修改建议
这一步非常重要。
因为它代表 AI 编程从“临时对话”,进入“可复用工作流”。
你不再每次都从零开始教 AI。
而是把你的经验、项目规则、团队规范沉淀成长期资产。
这一步是从“会用 AI”进化到:
会管理 AI 工作流。
⸻
5. 第五层:IDE + CLI Agent 成为当前主流组合
现在专业开发者使用 AI Coding,已经不只是打开一个 AI IDE。
更常见、更实用的组合是:
IDE + CLI Agent + MCP + Git Worktree + 自动测试
也就是:
* IDE 负责看代码、编辑、审查
* CLI Agent 负责复杂任务执行
* MCP 负责连接外部工具
* Git Worktree 负责隔离多个任务
* 测试和 CI 负责验证结果
代表组合包括:
Cursor / VS Code
+
Claude Code / Codex CLI / Gemini CLI / Aider / OpenCode
+
Roo Code / Cline / Continue
+
Git Worktree
+
Playwright / CI
这已经是当前 AI 优先开发里非常实用的一种工作方式。
⸻
为什么 CLI Agent 已经是标配?
因为真实开发不是只靠编辑器聊天就够了。
很多任务天然适合放到终端里执行:
* 跑测试
* 执行构建
* 批量改文件
* 操作 Git
* 分析报错日志
* 启动本地服务
* 执行脚本
* 调试依赖问题
* 生成 PR diff
* 长程重构
* 多任务并行
CLI Agent 的优势是:
它离真实工程环境最近。
它能直接使用:
* Shell
* Git
* npm / pnpm / yarn
* Python / uv / pip
* Docker
* 测试命令
* 构建命令
* 本地脚本
* 项目配置
所以现在很多开发者会这样工作:
1. 用 Cursor / VS Code 阅读项目和做局部修改
2. 用 Claude Code 执行复杂改造
3. 用 Codex CLI 做 OpenAI 生态任务
4. 用 Gemini CLI 做大上下文分析
5. 用 Aider / OpenCode 做 Git diff 级别修改
6. 用 Git Worktree 隔离多个 Agent 任务
7. 用测试和 CI 验证结果
这已经不是未来设想,而是当前 AI Coding 的成熟用法。
⸻
二、Agent 优先的未来趋势和进度
如果说当前 AI Coding 已经进入了 Agent 阶段,那么未来真正值得关注的,不是 MCP 会不会成为标准,也不是 CLI Agent 会不会普及。
因为这些已经在发生,并且已经成为很多专业开发者的日常工具链。
下一阶段更大的变化主要有两个:
1. IDE 会从代码编辑器升级为 Agent 控制台
2. Codex 已经落地电脑接管,多 Agent 协作正在走向软件交付自动化
⸻
趋势 1:IDE 正在从代码编辑器升级为 Agent 控制台
传统 IDE 是这样的:
人打开文件 → 人写代码 → 人运行测试 → 人提交代码
未来 IDE 更像这样:
人下达目标 → Agent 拆任务 → Agent 改代码 → Agent 验证 → 人审查合并
也就是说,IDE 不再只是编辑器,而会变成:
* 任务控制台
* Agent 管理器
* 多工作区控制台
* 代码审查中心
* 自动化执行平台
* 项目知识库入口
* 测试和验证中心
Google Antigravity 就是这个方向的代表。
它不是单纯的代码补全工具,而是 Agent-First IDE。
它强调 Agent 可以规划、执行、验证任务,并且可以跨编辑器、终端、浏览器工作。
未来的 IDE 很可能不再只是一个“写代码窗口”,而是一个“Agent 工作台”。
你在里面管理多个 Agent:
Agent A:负责前端页面
Agent B:负责后端接口
Agent C:负责测试
Agent D:负责代码审查
Agent E:负责文档和部署
程序员则负责:
* 分配任务
* 审查结果
* 处理关键决策
* 设计架构
* 控制质量
* 控制风险
这就是 Agent-First IDE 的方向。
⸻
趋势 2:Codex 已经落地电脑接管,多 Agent 协作正在走向软件交付自动化
电脑接管控制和多 Agent 协作,本质上是同一个方向的两个部分。
以前 AI Coding 主要解决的是:
AI 帮你写代码
现在 Agent 开始解决的是:
AI 帮你执行开发任务
而 Codex 最新版本已经把这个方向往前推了一步。
Codex 已经支持 computer use,可以在 macOS 上看到并操作图形界面,用于桌面 App 检查、浏览器操作、修改 App 设置、处理没有插件的数据源、复现只在 GUI 里出现的问题等场景。
Codex 也已经支持通过自己的光标在电脑上看、点击、输入,并且多个 Agent 可以在 Mac 上并行工作,不影响用户在其他 App 里的操作。
这说明电脑接管已经不是概念,而是开始进入实际开发工具。
它意味着 Agent 不只是改代码,还能参与真实软件验证流程。
例如你做了一个登录功能,Agent 不仅能改代码,还可以:
1. 启动项目
2. 打开浏览器
3. 进入登录页
4. 输入账号密码
5. 点击登录
6. 检查是否跳转 dashboard
7. 截图确认 UI
8. 如果失败,读取错误信息
9. 回到代码继续修复
这就从“写代码”升级到了“验证软件”。
真实的软件开发不只发生在代码文件里,还发生在:
* 浏览器
* 终端
* 桌面 App
* iOS / Android 模拟器
* 后台管理系统
* Figma
* Postman
* 数据库客户端
* CI/CD 平台
* 云控制台
* 内部业务系统
所以 Agent 如果只会改代码,还不够。
它还需要能:
* 打开浏览器验证页面
* 操作模拟器复现 bug
* 点击后台管理系统检查数据
* 使用 Postman 验证接口
* 查看 Figma 设计稿
* 读取 CI 报错
* 操作测试平台
* 截图留证
* 根据验证结果继续修代码
这时,多 Agent 协作就会自然出现。
例如一个完整任务可以拆成:
Agent A:需求分析,拆分任务
Agent B:前端实现
Agent C:后端接口
Agent D:测试和自动化验证
Agent E:代码审查和安全检查
Agent F:文档、部署和发布说明
其中电脑接管能力主要用于:
浏览器验证
UI 测试
模拟器测试
后台系统检查
截图确认
GUI 工具操作
这就不是单纯“AI 写代码”了,而是:
AI Agent 团队协作完成软件交付。
未来的开发流程可能会变成:
人提出目标
↓
主 Agent 拆分任务
↓
多个子 Agent 并行执行
↓
编码 Agent 修改代码
↓
测试 Agent 跑测试
↓
电脑操作 Agent 打开浏览器 / 模拟器验证
↓
审查 Agent 检查风险
↓
文档 Agent 更新说明
↓
人类开发者最终审查、合并、发布
一句话总结:
Codex 已经证明电脑接管能力开始落地;下一步更大的变化,是电脑接管和多 Agent 协作融合,推动软件交付自动化。
⸻
三、结合电脑接管控制,程序开发人员应该怎么发展?
如果站在程序员个人发展角度,我的建议很明确:
不要只定位成“写代码的人”,要升级成“AI Agent 驱动的软件工程师”。
未来单纯写 CRUD、页面、接口的人,会受到很大冲击。
因为这些任务越来越容易被 Agent 执行。
但真正有价值的程序员,不会消失,而是会升级。
⸻
1. 从“写代码的人”升级为“AI Agent 驱动的软件工程师”
未来程序员的核心职责会从:
我来写每一行代码
变成:
我来定义目标、拆任务、设计架构、指挥 Agent、审查结果、保证交付
你需要负责:
* 定义需求
* 拆解任务
* 设计架构
* 配置 Agent
* 管理上下文
* 设计测试
* 审查代码
* 控制风险
* 交付结果
AI 可以帮你写代码,但它需要你告诉它:
* 为什么这么做
* 边界在哪里
* 哪些不能动
* 什么结果算完成
* 如何验证正确
* 失败了怎么处理
* 风险点在哪里
所以未来优秀程序员的价值,不是消失,而是向上迁移。
从代码执行层,迁移到任务设计层、架构层、验证层和交付层。
⸻
2. 必须掌握“可验证开发”
Agent 最怕任务没有验证标准。
如果你只说:
帮我做一个登录功能
Agent 可能会做出一个看起来能用,但实际上很多边界没处理的版本。
更好的方式是:
帮我做一个登录功能,完成后必须满足:
1. npm run lint 通过
2. npm run test 通过
3. 登录失败显示错误提示
4. 登录成功跳转 dashboard
5. token 正确保存
6. 刷新页面后登录状态保持
7. 补充一个 e2e 测试
这就是可验证开发。
你需要强化这些能力:
* 单元测试
* E2E 测试
* TypeScript 类型
* lint
* CI/CD
* 日志
* 监控
* 回归测试
* 自动化截图验证
* 接口测试
* 数据库迁移验证
未来使用 Agent 的关键不是“多会提问”,而是“会不会定义完成标准”。
因为 Agent 需要反馈信号。
测试、类型系统、lint、构建结果、浏览器验证,都是反馈信号。
没有这些验证机制,Agent 容易乱改。
有了这些验证机制,Agent 就可以不断试错、修复、收敛。
所以未来程序员必须从“写代码”升级到“设计验证体系”。
⸻
3. 建立自己的 Skills / 工作流库
你应该把常用经验沉淀成文件。
例如:
/frontend-skill.md
/backend-skill.md
/code-review-skill.md
/refactor-skill.md
/test-skill.md
/deploy-skill.md
/project-rules.md
/agent-rules.md
这些文件里可以写:
* 项目架构
* 编码规范
* 接口规范
* 测试要求
* 提交流程
* 禁止事项
* 常用命令
* 业务规则
* 数据库规范
* 错误处理规范
* 日志规范
* 安全边界
* 部署流程
* 回滚流程
例如项目规则可以这样写:
项目规则:
1. 不允许直接修改生产配置
2. 所有接口必须有参数校验
3. 所有前端请求必须处理 loading/error/empty 状态
4. 所有新增功能必须补测试
5. 修改数据库结构必须新增 migration
6. 不允许删除已有测试
7. 提交前必须运行 npm run lint 和 npm run test
8. 涉及鉴权的代码必须重点说明风险
以后不管你用 Cursor、Claude Code、Codex、Antigravity,还是 Roo Code / Cline,这些规则都可以迁移。
它们就是你的个人 AI 编程资产。
谁能更早沉淀自己的 Skills 和项目规范,谁就能更快把 AI 变成稳定生产力。
⸻
4. 学会搭建 MCP 工具体系
建议优先掌握这些 MCP / 工具连接。
类型 作用
GitHub / GitLab issue、PR、代码审查
File system 管理本地项目文件
Playwright / Browser 自动浏览器测试
Figma 设计稿到前端
Postgres / MySQL 查数据库 schema
API 文档 / OpenAPI 生成接口调用
Jira / Linear 任务管理
Slack / 飞书 / 邮件 通知和协作
Shell / Terminal 自动跑命令
Memory / Knowledge 项目长期知识
日志 / 监控 分析线上问题
CI/CD 自动验证和发布
你的目标不是装很多 MCP。
而是围绕开发闭环搭建:
需求 → 设计 → 编码 → 测试 → 浏览器验证 → PR → 部署 → 通知
一个实用的 Agent 工具体系可以是:
GitHub MCP:读任务、开 PR
Figma MCP:读设计稿
File MCP:改项目文件
Terminal MCP:跑命令
Playwright MCP:浏览器测试
Database MCP:查表结构
Slack / 飞书 MCP:通知结果
这样 Agent 就不只是写代码,而是能完成一整条开发链路。
⸻
5. 电脑接管能力要用,但不能完全放权
电脑接管能力很强,但也有风险。
适合让 AI 做:
* UI 自动测试
* 浏览器点击验证
* 复现 bug
* 操作模拟器
* 检查后台页面
* 截图验证
* 批量配置低风险软件
* 操作本地开发环境
* 测试登录流程
* 测试表单流程
* 测试页面跳转
* 检查页面样式
不建议一开始让 AI 做:
* 付款
* 删除数据
* 生产环境操作
* 修改云资源
* 发布正式版本
* 操作敏感账号
* 无确认执行破坏性命令
* 删除数据库
* 修改权限配置
* 关闭安全策略
你应该设置权限边界。
例如:
允许:
– 读文件
– 改项目文件
– 跑测试
– 打开浏览器
– 操作本地模拟器
– 截图验证
– 访问本地开发页面
必须确认:
– 删除文件
– 提交代码
– 推送远程
– 部署生产
– 修改数据库
– 操作账号设置
– 修改云资源
– 执行 rm -rf 类命令
未来真正值钱的是:
会让 AI 自动干活,同时知道哪里不能让 AI 自动干。
这就是 AI Agent 时代的安全边界能力。
⸻
四、下一代 AI Coding 工具方向:电脑接管型 Coding Agent 会成为首选
前面讨论过很多工具,包括 Cursor、Claude Code、Codex、Antigravity、Gemini CLI、Roo Code、Cline、Continue 等。
如果按照下一代开发工具的发展方向来看,核心判断是:
具有电脑接管控制能力的 Coding Agent,会成为下一代开发工具首选。
因为 AI Coding 的竞争重点,正在从:
谁能更快补全代码
转向:
谁能真正执行软件开发任务
再进一步转向:
谁能操作电脑、验证软件、协作交付项目
未来开发工具的核心能力,不只是生成代码,而是要能完成完整闭环:
理解需求
↓
拆解任务
↓
修改代码
↓
运行项目
↓
打开浏览器 / 桌面 App 验证
↓
发现问题
↓
继续修复
↓
生成测试
↓
提交变更说明
↓
等待人类审查
所以,谁能把 写代码 + 跑命令 + 浏览器验证 + GUI 操作 + 多 Agent 协作 结合起来,谁就更接近下一代开发工具。
⸻
1. Codex:电脑接管型 Coding Agent 的代表,会成为下一代首选方向
Codex 的定位已经不只是传统 coding agent。
它更像是:
能操作电脑的软件交付 Agent。
Codex 的关键优势在于,它已经把 computer use / 电脑接管控制 带进开发工作流。
这意味着它不只是能改代码,还可以:
* 打开浏览器
* 操作页面
* 点击按钮
* 输入内容
* 查看 UI 状态
* 操作桌面 App
* 复现 GUI 问题
* 截图验证结果
* 多 Agent 并行处理任务
* 在本地开发环境中完成验证
这对软件开发非常关键。
因为真实开发不是写完代码就结束,而是要验证:
* 页面能不能打开
* 登录能不能成功
* 按钮能不能点击
* 表单有没有报错
* 样式有没有错位
* 路由跳转是否正常
* 后台系统数据是否正确
* 桌面端 App 是否符合预期
* 只在 GUI 里出现的问题能不能复现
以前这些事情需要人来做。
现在具备电脑接管能力的 Agent 可以参与完成。
所以 Codex 的意义不只是“写代码更强”,而是代表了一种新方向:
AI Coding 从代码生成工具,升级为电脑接管型软件交付工具。
这类工具会成为下一代开发者首选,因为它能覆盖更完整的开发闭环。
⸻
2. Cursor:当前主力 AI IDE,正在跟进 Agent 控制台和电脑操作能力
Cursor 仍然是当前最适合作为主力开发入口的 AI IDE 之一。
它的优势是:
* IDE 体验成熟
* 项目上下文理解强
* 多文件修改方便
* Agent 改代码体验好
* Chat / Composer / Tab / Agent 结合顺畅
* 适合长期做真实项目
* 更接近传统开发者的工作习惯
所以现阶段,如果你需要一个稳定的日常开发入口,Cursor 仍然很强。
但是从下一代方向看,Cursor 也需要继续跟进:
* Agent 控制台
* 多 Agent 并行
* 电脑操作能力
* 浏览器验证
* 端到端任务执行
* 更强的 MCP 和 Skills 工作流
也就是说,Cursor 当前更像:
主力 AI IDE + Agent 开发入口。
而 Codex 代表的方向更像:
电脑接管型 Coding Agent。
未来 Cursor 如果把电脑操作、Agent 控制台、多 Agent 协作继续补强,它仍然会是非常强的主力工具。
所以对开发者来说,现阶段比较稳的判断是:
Cursor 适合作为现在的主力 IDE,Codex 代表下一代电脑接管型开发工具方向。
⸻
3. Claude Code:从 CLI 强执行工具,开始转向桌面端和完整 Agent 工作流
Claude Code 以前最强的形态是 CLI。
它的优势非常明显:
* 复杂任务执行强
* 终端操作自然
* 适合长程重构
* 适合跑测试和修报错
* 适合读项目、改文件、总结变更
* MCP 和 Skills 工作流比较成熟
* 很适合专业开发者做复杂工程任务
所以 Claude Code 一直很像:
终端里的强执行程序员。
但现在 AI Coding 的方向在变化。
只在 CLI 里执行任务已经不够了。
下一代工具需要更完整的能力:
* 可视化任务管理
* 桌面端交互
* 多 Agent 协作
* 浏览器 / GUI 验证
* 项目级任务控制台
* 更直观的审查和回滚
* 和本地 IDE 更深结合
所以 Claude Code 也会从单纯 CLI 工具,逐步向:
CLI + 桌面端 + MCP + Skills + 电脑操作 + Agent 工作流
这个方向演进。
它的核心优势仍然是复杂任务执行能力。
但未来如果要和 Codex、Cursor、Antigravity 竞争,就必须补齐桌面端体验和电脑接管控制能力。
一句话:
Claude Code 的强项是 CLI 执行力,下一步重点是从终端工具升级为完整桌面 Agent 开发平台。
⸻
4. Antigravity:Agent-First IDE 方向代表,但成熟度还需要观察
Antigravity 代表的是另一个方向:
IDE 从代码编辑器升级为 Agent 控制台。
它强调的不是传统补全,而是:
* Agent 规划任务
* Agent 执行任务
* Agent 验证结果
* 多 Agent 管理
* 编辑器 / 终端 / 浏览器联动
* Mission Control 式工作流
这个方向是对的。
因为未来 IDE 很可能不再只是写代码的窗口,而是一个 Agent 工作台。
但 Antigravity 作为长期主力工具,还需要继续观察:
* 稳定性
* 生态成熟度
* 模型选择自由度
* MCP / Skills 实用程度
* 国内网络体验
* 长期额度和价格
* 对真实复杂项目的适配能力
所以它现在更适合:
观察、体验、尝鲜,以及判断未来 IDE 形态。
不一定马上作为唯一主力。
⸻
5. Gemini CLI:Google 生态和大上下文补充
Gemini CLI 更适合作为工具链补充。
它的优势是:
* 命令行使用方便
* 适合 Google 模型生态
* 适合大上下文代码分析
* 适合快速解释代码
* 可以配合 Antigravity / AI Studio 使用
它不一定是唯一主力,但可以作为:
Google 模型的命令行补充工具。
尤其适合需要大上下文、快速分析、Google API / Gemini 生态开发的场景。
⸻
6. Roo Code / Cline / Continue:多模型、MCP、自定义工作流补充
这类工具的价值在于灵活。
它们适合:
* VS Code 用户
* 多模型切换
* 自定义 API
* OpenAI-compatible 模型
* 国内模型接入
* MCP 工具调用
* 本地模型接入
* 自定义 Agent 工作流
如果你想接:
* DeepSeek
* Qwen
* MiniMax
* OpenRouter
* 本地 Ollama
* 自建 OpenAI-compatible API
这类工具通常比官方闭环产品更自由。
所以它们的定位是:
灵活的多模型和 MCP 补充层。
但从下一代首选工具的角度看,它们更像增强插件,不一定是最终主力平台。
⸻
小结
下一代 AI Coding 工具的核心,不再只是“会不会写代码”。
而是:
能不能接管电脑、操作 GUI、验证结果、协作交付。
因此工具判断可以这样看:
工具 当前定位 下一代价值
Codex 电脑接管型 Coding Agent 最接近下一代首选方向
Cursor 当前主力 AI IDE 正在跟进 Agent 控制台和电脑操作
Claude Code CLI 强执行 Agent 正从 CLI 向桌面端和完整 Agent 工作流演进
Antigravity Agent-First IDE 探索 代表未来 IDE 控制台方向
Gemini CLI Google 命令行补充 大上下文和 Gemini 生态补充
Roo Code / Cline / Continue 多模型 / MCP 插件层 灵活补充,不一定是最终主力
最终判断:
短期主力开发:Cursor + Claude Code 仍然稳。
下一代首选方向:Codex 这种具备电脑接管控制能力的 Coding Agent。
长期趋势:IDE 会变成 Agent 控制台,Coding Agent 会变成软件交付 Agent。
⸻
五、程序员发展路线建议
如果你是程序开发人员,我建议按三个阶段升级。
⸻
阶段 1:现在马上做
先形成一套稳定组合。
推荐组合:
Cursor / VS Code
+
Claude Code
+
Codex 或 Gemini CLI
+
Git Worktree
+
基础 MCP
更具体一点:
Cursor:主力 IDE
Claude Code:复杂任务执行
Codex:电脑操作验证
Roo Code / Cline:多模型和 MCP 补充
Git Worktree:多任务隔离
Playwright:浏览器自动化测试
这样你既有 IDE,也有 CLI Agent,也有电脑操作,也有多模型和 MCP 扩展。
不要只押一个工具。
因为现在 AI Coding 工具还在快速变化。
最稳的方式是:
主力工具稳定,辅助工具灵活。
⸻
阶段 2:建立 AI 开发规范
给每个项目准备这些文件:
README.md
AGENTS.md
PROJECT_RULES.md
TESTING.md
API.md
DEPLOY.md
CONTRIBUTING.md
让 Agent 每次进入项目都知道:
* 项目怎么启动
* 项目怎么测试
* 项目怎么构建
* 哪些文件不能改
* 代码风格是什么
* 业务规则是什么
* 接口规范是什么
* 完成标准是什么
* 部署流程是什么
* 出错如何回滚
例如:
AGENTS.md:
1. 修改代码前先阅读 PROJECT_RULES.md
2. 不允许删除已有测试
3. 所有新增功能必须补测试
4. 修改前端必须处理 loading/error/empty
5. 修改后端必须补参数校验
6. 提交前必须运行 lint 和 test
7. 不允许直接修改生产环境配置
8. 所有风险点必须在总结里说明
这类文件对 Agent 非常重要。
它能显著降低 AI 乱改代码的概率。
⸻
阶段 3:把自己升级成 Agent 架构师
未来比较有竞争力的程序员,需要具备这些能力:
能力 价值
架构设计 AI 能写代码,但需要方向
需求拆解 Agent 需要清晰任务
测试设计 没测试,Agent 容易乱改
工具链集成 MCP / CI / Git / 浏览器自动化
代码审查 AI 生成代码仍需人把关
安全边界 防止 AI 误操作
性能优化 AI 不一定懂系统瓶颈
业务理解 这是最难被替代的部分
Prompt / 指令设计 决定 Agent 执行质量
工作流沉淀 把经验变成可复用资产
未来的优秀程序员,不是不用 AI 的人,也不是完全依赖 AI 的人。
而是能做到:
我知道什么适合交给 AI。
我知道怎么让 AI 做得更好。
我知道怎么验证 AI 的结果。
我知道什么时候必须人工介入。
这类人会变得更有价值。
⸻
六、最终建议
如果你是程序开发人员,不要只追“哪个 AI IDE 最火”。
应该按这个方向布局:
主力 IDE + CLI Agent + MCP 工具 + Skills 规范 + 电脑操作验证 + 自动测试。
具体落地可以这样:
主力:Cursor
执行:Claude Code
电脑操作:Codex / Claude computer-use
多模型补充:Roo Code / Cline / Continue
未来观察:Antigravity
大上下文补充:Gemini CLI
你的个人发展方向应该是:
从“会写代码”升级为“会指挥 AI Agent 交付软件”。
最关键的 5 个能力:
1. 会拆任务
2. 会写项目规则
3. 会配置 MCP
4. 会设计测试和验证标准
5. 会审查 AI 产物并控制风险
最后用一句话总结:
AI Coding 的未来不是程序员消失,而是普通程序员变成 Agent 操作员,优秀程序员变成 Agent 架构师和软件交付负责人。
夜雨聆风