核心洞察:微软决定6月30日前让10,000名工程师停用Claude Code,全部迁移到自家Copilot CLI。这不是产品质量的竞争,是AI工具定价模型的深层矛盾——按token收费的模式,正在和企业的成本结构发生硬碰撞。
微软内部工程师圈子最近弥漫着一种矛盾的情绪。
他们中有很多人,过去半年深度依赖Claude Code。复杂调试、遗留代码重构、跨模块功能开发——Claude Code在这些高难度场景下表现出明显的代差优势,SWE-bench得分80.8%对比Copilot CLI的72.5%,是质的区别。一万多名Windows、Microsoft 365、Outlook、Teams的工程师用它在生产环境中写代码。
然后上个月,微软EVP拉杰什·贾发了一封全员邮件:6月30日前,全部迁移到GitHub Copilot CLI。Claude Code许可证全部取消。
一边:工程师为什么爱Claude Code
这不是一次充满"vs"火药味的对比,但差异确实鲜明。
Claude Code的核心优势在三个维度上不容忽视:
上下文窗口。 Claude Code支持超过100万token的上下文,Copilot CLI是128K。对于需要理解整个代码库结构的复杂任务来说,这个差距意味着Claude Code能一次性消化项目全貌,而Copilot需要工程师手动拆解任务。
SWE-bench得分。 80.8%对比72.5%。这个差距在常规代码补全场景下感知不明显,但一旦进入跨模块调试或者遗留系统重构,Claude Code的推理能力差异就会迅速放大。
模型迭代速度。 Claude Code底层模型持续更新,Anthropic在工程能力上的投入肉眼可见。Copilot CLI底层目前仍主要依赖GPT-4o,差距客观存在。
根据微软内部调研数据,61%的同时使用过两者的工程师认为Claude Code在复杂调试和重构场景下"明显更好"。而73%的工程师承认Copilot在常规代码补全场景下更快。
事实就是:工程师的偏好,和采购的逻辑,指向了两个不同的方向。
另一边:微软为什么铁了心要砍
问题的核心不在产品力,在成本结构和战略博弈。
按token付费的经济学注定和规模化冲突。 Claude Code的计费方式是按token消耗实时结算。微软每为一名工程师支付一笔Claude Code的费用,这笔钱就实实在在地流向了Anthropic。一万名工程师在重度使用场景下,这笔账的累积速度快得惊人——特别是当工程师开始用AI Agent进行多步骤、多轮次的复杂任务时,token消耗量是常规API调用的5到30倍。
更反直觉的例子来自Uber。 Fortune本周披露,Uber的AI工程预算在2026年前四个月就烧完了全年额度。重度AI用户的单人月成本已突破2,000美元。这笔钱,在某些场景下已经超过了初级开发者的实际支出。
而对于微软来说,故事更微妙。GitHub Copilot是自家产品,边际成本趋零。每把一名工程师从Claude Code迁移到Copilot,微软省下一笔付给外部供应商的token账单。
但拉杰什·贾的邮件没有只谈成本。他的原话里还藏着一条战略逻辑:"Copilot CLI给了我们一个特别重要的东西——一个我们可以直接和GitHub一起塑造的产品。"
这句的意思翻译过来是:工具能跑多快、能适配什么安全策略、能和Azure DevOps怎么对接——这些,Claude Code的控制权在Anthropic手里。
微软的选择,不是一个简单的"好工具vs差工具"的对立。它是"外部精品、不可控,但有代差优势"和"内部生态、可控、边际成本为零、但落后半代"之间的组织级博弈。
更深一层:token定价正在吃掉AI工具的增长
这个事件的本质,需要回到token经济学的底层逻辑。
大模型的推理成本,本质上是线性成本+规模化效应。每多一次API调用就多一笔电费和GPU时间账单。但人力成本是完全不同的曲线——一个工程师的月薪是固定的,产出弹性取决于工具效率。
当一个工程师用AI提升50%效率时,价值增益远大于token支出。但当AI使用进入Agent阶段——工具开始自主发起多步操作、反复验证、自我纠错——token消耗量出现指数级增长。
这解释了为什么企业AI预算的增速追不上token消耗的增速。也解释了为什么Fortune这周用了一个标题:"微软的AI成本问题:用AI比雇人还贵。"
对微软而言,当边际成本为零的内部工具(Copilot)和按token计费的外部工具(Claude Code)同时摆在桌面上时,这是一个不需要分析就能做出的决策。
但对于整个行业来说,这个选择的后果更深远:如果AI工具的定价模型始终是按token线性收费,而Agent能力继续进步导致token消耗非线性增长,那么AI工具的"好用"和"划算"将形成持续分裂——至少在企业级场景下如此。
这才是这个事件最值得被读透的地方。
微软不是不喜欢Claude Code。拉杰什·贾的邮件第一句话就承认了它是"学习过程中的重要一环"。但商业的底层逻辑不会因为某个产品"更好用"而改变。
对于工程师个体来说,这是一场权力感的失落——你被剥夺了选择最好工具的权利。
对于行业来说,这标志着一个分水岭:AI工具在从"个人效率增益"走向"组织级成本决策"。
企业不会只为"好用"买单。它关心的是控制力、边际成本和长期战略一致性。当这些变量中的至少两个指向负方向时,"更好用"就变成了最容易被牺牲掉的那个变量。
这道数学题,Anthropic、OpenAI、Google——每一家都在解。微软的选择不是终点,而是下一代定价模型竞赛的起点。
夜雨聆风