微软禁用自家AI的背后:越智能,越烧钱

#AI成本 #微软 #ClaudeCode #DeepSeek

▌ 长话短说

微软已下令大部分内部 Claude Code 许可证在 6 月 30 日前取消，转用自家更便宜的 Copilot CLI。Uber 在四个月内烧光了全年 AI 预算。Nvidia VP 公开说 AI 算力比员工薪资更贵。当西方 AI 的 token 计价让账单失控，DeepSeek 的极低成本路线显得格外应景。

2025 年底，微软向 Experiences + Devices 部门的数千名工程师开放了 Claude Code。六个月内，采用率爆发。工程师们爱上了这个终端里的 AI 编程助手。然后账单到了。

按 token 计费意味着每一次代码审查、每一次调试会话都要付费。当使用规模放大到近十万工程师时，数字变得惊人。五月中旬，微软内部下令：到 6 月 30 日（财年最后一天），大部分 Claude Code 许可证必须取消，工程师全面迁移到 GitHub Copilot CLI。

有史以来最贵的内部实验

据 WinBuzzer 报道，微软 Experiences + Devices 部门——负责 Windows、Microsoft 365、Teams、Outlook 和 Surface 的团队——是本次撤退的首要受影响对象。EVP Rajesh Jha 在内部分将此定性为"收敛策略"：同时运行 Copilot CLI 和 Claude Code 做基准测试后，决定统一到自家工具上。

但真实原因没那么复杂。内部对比显示，Claude Code 在不少真实工程任务中优于 Copilot CLI，工程师已建立了偏好。微软花了数月鼓励大家用 Claude Code，现在却要所有人放弃更喜欢的工具。有消息称微软甚至考虑过收购 Cursor 来填补 Copilot 的差距。

更深层的问题是钱。按企业级 Claude Code 定价估算，若 5000 名工程师平均每天做 3 个 agent 会话、每次 10 万 token，每日消耗 15 亿 token。Anthropic 企业定价每百万 token 约 3-15 美元，日成本 4500-22500 美元，月账单 13.5 万到 67.5 万美元。Gartner 报告称 agent 工具的实际用量常为预估的 3-5 倍，那账单数字就完全变了性质。

微软投资 Anthropic 数十亿美元，却叫停内部使用 Anthropic 的产品。不是因为不好用，而是因为太好用、太贵了。

Uber 的四个月烧光全年预算

如果说微软还能用"内部整合"解释，Uber 的故事是纯粹的预算灾难。

2025 年 12 月，Uber 向 5000 名工程师开放 Claude Code。到次年 2 月，使用率从 32% 跃至 63%。3 月，84% 的工程师成为"agent 编程用户"，70% 的提交代码来自 AI。Uber 甚至建了内部排行榜，按工程师的 token 消耗量排名。他们把花钱变成了游戏。

结果毫无意外：CTO Praveen Neppalli Naga 告诉 The Information，2026 年全年 AI 预算到四月就已耗尽。重度工程师月花费 500-2000 美元。Naga 本人一次两小时演示就用掉 1200 美元。他说："我回到了绘图板，因为我以为需要的预算已经被烧光了。"

卖芯片的人说了实话

最讽刺的发言来自 Nvidia 应用深度学习 VP Bryan Catanzaro。四月底他对 Axios 说："对我的团队来说，算力成本远超员工成本。"

说这句话的是全球最大 AI 芯片公司的 VP。连卖铲子的人都说金子太贵了。

据 Axios 和多家媒体转述，Catanzaro 认为许多希望通过 AI 削减人力成本的公司可能走错了方向。MIT 2024 年研究印证了这一点：AI 自动化仅对 23% 的视觉类工作具有经济合理性，其余 77% 仍然是人更便宜。摩根士丹利数据显示，Big Tech 今年资本支出达 7400 亿美元，同比增加 69%。Layoffs.fyi 统计 2026 年科技行业已裁员超 9.2 万人。裁员与 AI 投资同步创历史新高，但被裁掉的人并没有被 AI 以更低成本替代。

高盛预测，到 2030 年全球 token 消耗将增长 24 倍。Gartner 补充说单位 token 价格会下降 90%，但企业 AI 总成本仍将上升，因为 agent 每项任务消耗的 token 远超基础工具。Meta 已建立"Claudeonomics"仪表盘追踪 AI 使用量。亚马逊则在推动"tokenmaxx"（最大化 token 消耗的内部口号）。

AI 的使用曲线本质与云计算账单曲线一样：指数增长，直到有人发现预算已空。只不过主角不再是初创公司，而是全球最大的科技企业。

DeepSeek 为何此时站出来

微软和 Uber 的遭遇揭示了同一件事：当前 AI 的 token 计价模式在规模化部署时存在根本性问题。用越好，账单越失控。Copilot 每月 10-39 美元的固定定价安全但能力有限；Claude Code 能力强但 token 无限敞口，大企业扛不住。

在这个裂缝中，DeepSeek 的定位变得清晰。上周它将 V4 Pro 的 75% 折扣永久化，定价降至每百万输出 token 0.87 美元。对比之下，OpenAI GPT-5 输入每百万 2.5 美元、输出 10 美元；Anthropic Claude Opus 4.7 是输入 5 美元、输出 25 美元。DeepSeek V4 Flash 的缓存命中价甚至低至每百万 0.014 美元。

月消耗 2000 万输入 token 的工作负载下，DeepSeek V4 Flash 费用 1.68 美元。Claude Sonnet 是 135 美元。GPT-5.5 是 250 美元。成本差距是 99% 的量级。

对于被 token 账单压垮的企业来说，这不是边际优化而是架构决策层级的替代方案。当然 DeepSeek 也有自己的问题：地缘政治风险、数据合规隐忧、模型能力差距。但当传统供应商的账单让微软都在撤退时，"不够完美但便宜 35 倍"变成了一个越来越难忽视的选项。

一个有意思的数据点：Salesforce 今年预计在 Anthropic token 上的支出就达 3 亿美元。换到 DeepSeek 定价可以缩到零头。下一个聪明的 CFO 会问：为什么不能两套都用，核心推理走 Claude、日常 coding 走 DeepSeek？

2026 年 Big Tech 在 AI 基础设施上的支出预计 7250 亿美元。最早大规模部署 AI 的公司，微软和 Uber，已经开始撤退，因为经济账算不过来。高盛说这是短期错配，Gartner 说价格会下降 90%。在此之前，每一张失控的 token 账单都在提醒行业：AI 的价值不只在智能，还在于成本曲线是否可持续。

DeepSeek 选的这条路，用极致性价比打穿市场，在微软禁用自家 AI 的这天，看起来比任何时候都更正确。

来源 / Sources

WinBuzzer / Axios / The Information / Gartner / Goldman Sachs / 多方交叉验证