
#AI成本 #微软 #ClaudeCode #DeepSeek
▌ 长话短说
微软已下令大部分内部 Claude Code 许可证在 6 月 30 日前取消,转用自家更便宜的 Copilot CLI。Uber 在四个月内烧光了全年 AI 预算。Nvidia VP 公开说 AI 算力比员工薪资更贵。当西方 AI 的 token 计价让账单失控,DeepSeek 的极低成本路线显得格外应景。
2025 年底,微软向 Experiences + Devices 部门的数千名工程师开放了 Claude Code。六个月内,采用率爆发。工程师们爱上了这个终端里的 AI 编程助手。然后账单到了。
按 token 计费意味着每一次代码审查、每一次调试会话都要付费。当使用规模放大到近十万工程师时,数字变得惊人。五月中旬,微软内部下令:到 6 月 30 日(财年最后一天),大部分 Claude Code 许可证必须取消,工程师全面迁移到 GitHub Copilot CLI。
有史以来最贵的内部实验
据 WinBuzzer 报道,微软 Experiences + Devices 部门——负责 Windows、Microsoft 365、Teams、Outlook 和 Surface 的团队——是本次撤退的首要受影响对象。EVP Rajesh Jha 在内部分将此定性为"收敛策略":同时运行 Copilot CLI 和 Claude Code 做基准测试后,决定统一到自家工具上。
但真实原因没那么复杂。内部对比显示,Claude Code 在不少真实工程任务中优于 Copilot CLI,工程师已建立了偏好。微软花了数月鼓励大家用 Claude Code,现在却要所有人放弃更喜欢的工具。有消息称微软甚至考虑过收购 Cursor 来填补 Copilot 的差距。
更深层的问题是钱。按企业级 Claude Code 定价估算,若 5000 名工程师平均每天做 3 个 agent 会话、每次 10 万 token,每日消耗 15 亿 token。Anthropic 企业定价每百万 token 约 3-15 美元,日成本 4500-22500 美元,月账单 13.5 万到 67.5 万美元。Gartner 报告称 agent 工具的实际用量常为预估的 3-5 倍,那账单数字就完全变了性质。
微软投资 Anthropic 数十亿美元,却叫停内部使用 Anthropic 的产品。不是因为不好用,而是因为太好用、太贵了。
Uber 的四个月烧光全年预算
如果说微软还能用"内部整合"解释,Uber 的故事是纯粹的预算灾难。
2025 年 12 月,Uber 向 5000 名工程师开放 Claude Code。到次年 2 月,使用率从 32% 跃至 63%。3 月,84% 的工程师成为"agent 编程用户",70% 的提交代码来自 AI。Uber 甚至建了内部排行榜,按工程师的 token 消耗量排名。他们把花钱变成了游戏。
结果毫无意外:CTO Praveen Neppalli Naga 告诉 The Information,2026 年全年 AI 预算到四月就已耗尽。重度工程师月花费 500-2000 美元。Naga 本人一次两小时演示就用掉 1200 美元。他说:"我回到了绘图板,因为我以为需要的预算已经被烧光了。"
卖芯片的人说了实话
最讽刺的发言来自 Nvidia 应用深度学习 VP Bryan Catanzaro。四月底他对 Axios 说:"对我的团队来说,算力成本远超员工成本。"
说这句话的是全球最大 AI 芯片公司的 VP。连卖铲子的人都说金子太贵了。
据 Axios 和多家媒体转述,Catanzaro 认为许多希望通过 AI 削减人力成本的公司可能走错了方向。MIT 2024 年研究印证了这一点:AI 自动化仅对 23% 的视觉类工作具有经济合理性,其余 77% 仍然是人更便宜。摩根士丹利数据显示,Big Tech 今年资本支出达 7400 亿美元,同比增加 69%。Layoffs.fyi 统计 2026 年科技行业已裁员超 9.2 万人。裁员与 AI 投资同步创历史新高,但被裁掉的人并没有被 AI 以更低成本替代。
高盛预测,到 2030 年全球 token 消耗将增长 24 倍。Gartner 补充说单位 token 价格会下降 90%,但企业 AI 总成本仍将上升,因为 agent 每项任务消耗的 token 远超基础工具。Meta 已建立"Claudeonomics"仪表盘追踪 AI 使用量。亚马逊则在推动"tokenmaxx"(最大化 token 消耗的内部口号)。
AI 的使用曲线本质与云计算账单曲线一样:指数增长,直到有人发现预算已空。只不过主角不再是初创公司,而是全球最大的科技企业。
DeepSeek 为何此时站出来
微软和 Uber 的遭遇揭示了同一件事:当前 AI 的 token 计价模式在规模化部署时存在根本性问题。用越好,账单越失控。Copilot 每月 10-39 美元的固定定价安全但能力有限;Claude Code 能力强但 token 无限敞口,大企业扛不住。
在这个裂缝中,DeepSeek 的定位变得清晰。上周它将 V4 Pro 的 75% 折扣永久化,定价降至每百万输出 token 0.87 美元。对比之下,OpenAI GPT-5 输入每百万 2.5 美元、输出 10 美元;Anthropic Claude Opus 4.7 是输入 5 美元、输出 25 美元。DeepSeek V4 Flash 的缓存命中价甚至低至每百万 0.014 美元。
月消耗 2000 万输入 token 的工作负载下,DeepSeek V4 Flash 费用 1.68 美元。Claude Sonnet 是 135 美元。GPT-5.5 是 250 美元。成本差距是 99% 的量级。
对于被 token 账单压垮的企业来说,这不是边际优化而是架构决策层级的替代方案。当然 DeepSeek 也有自己的问题:地缘政治风险、数据合规隐忧、模型能力差距。但当传统供应商的账单让微软都在撤退时,"不够完美但便宜 35 倍"变成了一个越来越难忽视的选项。
一个有意思的数据点:Salesforce 今年预计在 Anthropic token 上的支出就达 3 亿美元。换到 DeepSeek 定价可以缩到零头。下一个聪明的 CFO 会问:为什么不能两套都用,核心推理走 Claude、日常 coding 走 DeepSeek?
2026 年 Big Tech 在 AI 基础设施上的支出预计 7250 亿美元。最早大规模部署 AI 的公司,微软和 Uber,已经开始撤退,因为经济账算不过来。高盛说这是短期错配,Gartner 说价格会下降 90%。在此之前,每一张失控的 token 账单都在提醒行业:AI 的价值不只在智能,还在于成本曲线是否可持续。
DeepSeek 选的这条路,用极致性价比打穿市场,在微软禁用自家 AI 的这天,看起来比任何时候都更正确。
来源 / Sources
WinBuzzer / Axios / The Information / Gartner / Goldman Sachs / 多方交叉验证
夜雨聆风