过去一年,很多人讨论 AI 编程工具,最常问的问题是:哪个模型更强,哪个插件更聪明,哪个工具写代码更快。
但从最近几条更新看,AI 编程工具的竞争正在换方向。它不再只是拼“能不能写代码”,而是开始拼“能不能被管理”。
已确认的事实是,GitHub 在 2026 年 6 月 23 日发布 Copilot CLI 新终端界面正式可用。这个新界面不只是让你在终端里聊天,它支持浏览 issues、pull requests、gists,还可以在终端内配置 MCP servers、Skills、Plugins 和 Settings。
同一天,GitHub Copilot app 增加 BYOK 支持。用户可以连接 OpenAI、Azure OpenAI、Microsoft Foundry、Anthropic、LM Studio、Ollama 或 OpenAI-compatible endpoint。GitHub 近期 Copilot changelog 还显示,Copilot code review 支持 AGENTS.md,Copilot 使用量和 AI credits 相关指标也在持续增强。
OpenAI 这边,ChatGPT Business release notes 提到 Codex app 的 Record & Replay:用户演示一次工作流,符合条件的 Business 用户可以把它变成可复用 skill。这个方向和 AGENTS.md、Skills、MCP 这些能力是同一类问题:怎么让 AI 在一个更清楚的规则里工作。
我觉得这才是 AI 编程工具进入下一阶段的标志。
第一阶段是“能写”。你给一段需求,它帮你生成代码。这个阶段很惊艳,但也很混乱。它可能不知道你的项目结构,不知道你的测试命令,不知道你们团队的提交规范,也不知道哪些文件不能乱动。
第二阶段是“能接入”。AI 开始进入 IDE、终端、GitHub、浏览器和本地工具。它不只是回答你,而是可以读代码、跑命令、改文件、看日志。
第三阶段就是现在正在发生的“可管理”。也就是:模型从哪里来,费用怎么算,权限开多大,哪些流程可以复用,团队规范怎么告诉 AI,结果怎么审计。
BYOK 解决的是模型和账单控制。AGENTS.md 解决的是项目规则和上下文。Skills 解决的是可复用流程。MCP 解决的是工具连接。使用量和 AI credits 指标解决的是成本可见性。
这些东西听起来不像“炫酷功能”,但它们很关键。因为真正把 AI 用进开发流程的人,很快会遇到几个现实问题。
第一个问题:成本不可控。今天用这个模型,明天换那个模型,团队里每个人调用方式不同,最后不知道钱花在哪里。
第二个问题:上下文不可控。AI 每次都要重新理解项目,生成的代码风格不稳定,改动范围也容易跑偏。
第三个问题:权限不可控。AI 能不能读某些文件,能不能跑命令,能不能访问外部工具,这些都需要边界。
第四个问题:经验不能复用。一个人调通的流程,另一个人还要重新摸一遍,团队效率很难累积。
所以我会把接下来的 AI 编程工具理解为“开发基础设施”,而不是“写代码插件”。
普通用户和小团队不一定马上需要企业级配置,但至少可以先做几件事。
一是给项目写清楚 AI 工作规则。比如项目结构、安装命令、测试命令、代码风格、禁止修改的文件、提交前检查项。
二是把高频开发流程沉淀下来。比如“新增一个页面”“修一个接口”“写测试”“整理 changelog”“排查构建失败”,这些都适合做成固定流程。
三是分清模型用途。不是所有任务都要用最强模型。读文档、改小 bug、生成简单脚本、做架构判断,可以用不同模型和不同成本策略。
四是保留人工审查。AI 可以帮你写,但不应该替你承担最终判断。尤其是权限、账号、支付、数据、投放这类模块,必须复核。
这也是为什么我现在越来越不建议大家只问“哪个 AI 编程工具最好”。更好的问题应该是:我的开发流程里,哪些环节可以被 AI 稳定接管?哪些环节必须保留人工判断?哪些规则要提前写给 AI?
AI 编程工具越成熟,越不像玩具,越像一套需要配置和治理的基础设施。
夜雨聆风