AI编程工具正在＂换血＂:微软撤退、DeepSeek入场、开发者买单

未来协议

AI / 自动化 / 一人公司

看懂科技趋势，建立自己的生产系统。AI 正在重新分配普通人的能力。

同一个星期里， AI 编程圈发生了两件事。表面上毫无关联，但拼在一起看，后背发凉。

5 月 15 日， The Verge 报道，微软副总裁 Rajesh Jha 向内部下令： Windows 11 、 Microsoft 365 、 Outlook 、 Teams 、 Surface 等核心团队的工程师，必须在 6 月 30 日前全面停用 Anthropic 的 Claude Code ，转向自家的 GitHub Copilot CLI 。

5 月 20 日，甲子光年从知情人士处获悉， DeepSeek 内部正在组建一个全新的"Harness"团队，方向是代码智能体产品——对标的正是 Claude Code 。

一个在退，一个在进。

巧合吗？怎么可能。

你可能只看到了"微软省钱"

媒体报道里，微软封杀 Claude Code 最常被提到的理由是"工具链整合"。 Jha 的原话是：虽然 Claude Code 在学习阶段很重要，但 Copilot CLI 能更直接地贴合微软的代码仓库、工作流和安全要求。

听起来政治正确得无可挑剔。

但你细品，这话就不对味了。

钱。

据报道，微软为内部工程师开通 Claude Code 的成本高达每人每月 500 到 2000 美元。一个团队几十号人，一个月轻松烧掉几万美元。 6 月 30 日恰好是微软当前财年的最后一天——这个时间窗口，懂的都懂。

然后是面子问题。这才是真正难堪的部分。

过去半年，微软不仅让开发者用 Claude Code ，还鼓励没有编程经验的设计师和项目经理用它做原型。结果？太受欢迎了。不是一般的受欢迎——是开发者们明确表态，比起自家亲儿子 Copilot ，他们更喜欢竞争对手的产品。

打个比方。一支球队花大价钱请了个外援当陪练，结果陪练比首发都猛，全队心知肚明。教练怎么办？

让陪练走人。不是因为不行。恰恰是因为太行了，行到主力没脸待下去。

真正让人不安的不是微软，是那组数字

把视角拉远一点。

根据 Anthropic 在 G 轮融资时公布的数据， Claude Code 的年化收入已经突破 25 亿美元——这款产品 2025 年 2 月才推出， 5 月全面开放，达到这个数字不到一年。在 AI 编程工具领域， Claude Code 拿下了大约 54%的市场份额， GitHub Copilot 只有 25%左右。

说白了，一个后来者用不到两年，在微软的主场抢走了超过一半的蛋糕。这要是放在篮球场上，就是客队在主场把主队打了个 54:25 。难看。

Claude Code 凭什么？

答案不复杂——它把模型当成了一个有文件系统权限的"初级工程师"。你可以让它读目录、跑 grep 、执行测试、修报错，直到测试通过。它不是在帮你补全代码，而是在帮你干活。

在标准化编程测试中， Claude Code 的通过率约为 80.8%，而 Copilot 约为 72.5%。 8 个百分点的差距，看起来不大，但在实际工程中，这意味着 Claude Code 每 10 次操作能多"做对"将近 1 次——积累下来，就是开发效率的质变。

所以微软的选择——说好听点叫"工具链整合"，说难听点就是被迫撤退。你家的产品打不过别人家的，还天天花钱养着别人家的，这买卖怎么算都亏。

DeepSeek 为什么偏偏在这个时候入场

回到另一边。

DeepSeek 资深研究员陈德里在社交媒体上的招人帖子写得很直白："来 DeepSeek 从零做 Code Harness ，对标 Claude Code 。"

有意思的是"Harness"这个词。根据 DeepSeek 官方的定义，除模型本身以外的所有工作，都属于 Harness 的范畴。

这句话太关键了。

它直接捅破了一层窗户纸：模型再强，没有稳定的运行系统，也是白搭。

DeepSeek-V4 在开源社区的口碑不用多说。但一个聪明的模型和一个好用的编程工具之间，隔着上下文管理、文件系统交互、终端操作、错误恢复、多轮任务编排、权限控制——这些"脏活累活"，恰恰是 Harness 要做的事。

Claude Code 的成功已经证明了这条路走得通：模型能力是基础分， Harness 能力才是加分项。 Anthropic 花了一年多的时间把 Claude 模型包装成 Claude Code 这个产品，才跑到 25 亿美元的年化收入。

DeepSeek 现在补这一课——说实话，有点急了。但再不补，等 Claude Code 在国内开发者圈子里也站稳脚跟，就真来不及了。

三方格局可能比你想的来得更快

如果把 AI 编程工具看成一场联赛，现在的积分榜大概是这样：

玩家	模型底座	工具形态	当前位置
Claude Code	Claude Opus 4.x	终端 Agent	领跑者，年化$25 亿
GitHub Copilot	多模型（含 Claude ）	IDE 插件+CLI	守成者，份额被蚕食
DeepSeek Harness	DeepSeek V4	待定（从零开始）	挑战者，尚未上场

短期内，微软封杀 Claude Code 只会加速两件事：一是 Copilot 团队在压力下疯狂补短板，二是更多开发者开始寻找替代方案——这恰好是 DeepSeek Harness 潜在的窗口期。

长期来看，一个更深层的问题正在浮出水面： AI 编程工具到底应该是谁的生意？

是模型公司的（ Anthropic 做 Claude Code 、 DeepSeek 做 Harness ）？还是平台公司的（微软做 Copilot 、字节做 Trae ）？还是独立工具公司的（ Cursor 、 Windsurf ）？

目前的趋势指向模型公司。原因不难理解——当模型能力成为编程工具的核心壁垒，只有最了解自己模型的团队，才能做出最匹配的工具。 Anthropic 比任何人都清楚 Claude 的上下文窗口怎么用最高效， DeepSeek 比任何人都清楚 V4 的推理强项在哪里。

这对 Cursor 、 Windsurf 这些独立工具公司来说，是个令人焦虑的信号。对开发者来说，倒可能是好事——竞争越激烈，价格越透明，选择越多。

你现在应该关注什么

如果你是一个每天都在用 AI 编程工具的开发者，这场混战的影响可能比想象中来得更直接。

DeepSeek Harness 的招聘要求里，列了一串要求深度使用过的产品清单： Claude Code 、 Codex 、 Cursor 、 OpenCode 、 GitHub Copilot 、 Manus 、 OpenClaw 、 Hermes 。几乎涵盖了当前所有主流选项。

这说明什么？ DeepSeek 在做产品之前，先把整个赛道的产品研究了个遍。接下来半年，大概率会看到一个"集各家所长"的新玩家入场。

但问题也来了。三家同时抢人，开发者的迁移成本在飙升。你的提示词模板、工作流配置、项目上下文——这些东西换一个工具就得重来。很多人的真实感受是：工具越来越好，但换工具越来越痛。

所以，到底该怎么办？

说实话，我也没有标准答案。但有一个判断标准值得想想：你现在用的 AI 编程工具，到底是在帮你"补全代码"还是在帮你"完成任务"？

如果你的工具还停留在"你写一半它猜另一半"的阶段，而别人已经在用 Agent 帮忙跑测试、修报错、提 PR……这个差距，不是换个快捷键能追上的。

关注「未来协议」

AI / 自动化 / 一人公司

看懂科技趋势，建立自己的生产系统

👇 点击下方公众号名片，关注「未来协议」