微软亲手砍掉了内部最受欢迎的AI工具—

微软亲手砍掉了内部最受欢迎的AI工具——因为它太好用了

核心洞察：微软决定6月30日前让10,000名工程师停用Claude Code，全部迁移到自家Copilot CLI。这不是产品质量的竞争，是AI工具定价模型的深层矛盾——按token收费的模式，正在和企业的成本结构发生硬碰撞。

微软内部工程师圈子最近弥漫着一种矛盾的情绪。

他们中有很多人，过去半年深度依赖Claude Code。复杂调试、遗留代码重构、跨模块功能开发——Claude Code在这些高难度场景下表现出明显的代差优势，SWE-bench得分80.8%对比Copilot CLI的72.5%，是质的区别。一万多名Windows、Microsoft 365、Outlook、Teams的工程师用它在生产环境中写代码。

然后上个月，微软EVP拉杰什·贾发了一封全员邮件：6月30日前，全部迁移到GitHub Copilot CLI。Claude Code许可证全部取消。

一边：工程师为什么爱Claude Code

这不是一次充满"vs"火药味的对比，但差异确实鲜明。

Claude Code的核心优势在三个维度上不容忽视：

上下文窗口。 Claude Code支持超过100万token的上下文，Copilot CLI是128K。对于需要理解整个代码库结构的复杂任务来说，这个差距意味着Claude Code能一次性消化项目全貌，而Copilot需要工程师手动拆解任务。

SWE-bench得分。 80.8%对比72.5%。这个差距在常规代码补全场景下感知不明显，但一旦进入跨模块调试或者遗留系统重构，Claude Code的推理能力差异就会迅速放大。

模型迭代速度。 Claude Code底层模型持续更新，Anthropic在工程能力上的投入肉眼可见。Copilot CLI底层目前仍主要依赖GPT-4o，差距客观存在。

根据微软内部调研数据，61%的同时使用过两者的工程师认为Claude Code在复杂调试和重构场景下"明显更好"。而73%的工程师承认Copilot在常规代码补全场景下更快。

事实就是：工程师的偏好，和采购的逻辑，指向了两个不同的方向。

另一边：微软为什么铁了心要砍

问题的核心不在产品力，在成本结构和战略博弈。

按token付费的经济学注定和规模化冲突。 Claude Code的计费方式是按token消耗实时结算。微软每为一名工程师支付一笔Claude Code的费用，这笔钱就实实在在地流向了Anthropic。一万名工程师在重度使用场景下，这笔账的累积速度快得惊人——特别是当工程师开始用AI Agent进行多步骤、多轮次的复杂任务时，token消耗量是常规API调用的5到30倍。

更反直觉的例子来自Uber。 Fortune本周披露，Uber的AI工程预算在2026年前四个月就烧完了全年额度。重度AI用户的单人月成本已突破2,000美元。这笔钱，在某些场景下已经超过了初级开发者的实际支出。

而对于微软来说，故事更微妙。GitHub Copilot是自家产品，边际成本趋零。每把一名工程师从Claude Code迁移到Copilot，微软省下一笔付给外部供应商的token账单。

但拉杰什·贾的邮件没有只谈成本。他的原话里还藏着一条战略逻辑："Copilot CLI给了我们一个特别重要的东西——一个我们可以直接和GitHub一起塑造的产品。"

这句的意思翻译过来是：工具能跑多快、能适配什么安全策略、能和Azure DevOps怎么对接——这些，Claude Code的控制权在Anthropic手里。

微软的选择，不是一个简单的"好工具vs差工具"的对立。它是"外部精品、不可控，但有代差优势"和"内部生态、可控、边际成本为零、但落后半代"之间的组织级博弈。

更深一层：token定价正在吃掉AI工具的增长

这个事件的本质，需要回到token经济学的底层逻辑。

大模型的推理成本，本质上是线性成本+规模化效应。每多一次API调用就多一笔电费和GPU时间账单。但人力成本是完全不同的曲线——一个工程师的月薪是固定的，产出弹性取决于工具效率。

当一个工程师用AI提升50%效率时，价值增益远大于token支出。但当AI使用进入Agent阶段——工具开始自主发起多步操作、反复验证、自我纠错——token消耗量出现指数级增长。

这解释了为什么企业AI预算的增速追不上token消耗的增速。也解释了为什么Fortune这周用了一个标题："微软的AI成本问题：用AI比雇人还贵。"

对微软而言，当边际成本为零的内部工具（Copilot）和按token计费的外部工具（Claude Code）同时摆在桌面上时，这是一个不需要分析就能做出的决策。

但对于整个行业来说，这个选择的后果更深远：如果AI工具的定价模型始终是按token线性收费，而Agent能力继续进步导致token消耗非线性增长，那么AI工具的"好用"和"划算"将形成持续分裂——至少在企业级场景下如此。

这才是这个事件最值得被读透的地方。

微软不是不喜欢Claude Code。拉杰什·贾的邮件第一句话就承认了它是"学习过程中的重要一环"。但商业的底层逻辑不会因为某个产品"更好用"而改变。

对于工程师个体来说，这是一场权力感的失落——你被剥夺了选择最好工具的权利。

对于行业来说，这标志着一个分水岭：AI工具在从"个人效率增益"走向"组织级成本决策"。

企业不会只为"好用"买单。它关心的是控制力、边际成本和长期战略一致性。当这些变量中的至少两个指向负方向时，"更好用"就变成了最容易被牺牲掉的那个变量。

这道数学题，Anthropic、OpenAI、Google——每一家都在解。微软的选择不是终点，而是下一代定价模型竞赛的起点。