看懂科技趋势,建立自己的生产系统。AI 正在重新分配普通人的能力。
同一个星期里, AI 编程圈发生了两件事。表面上毫无关联,但拼在一起看,后背发凉。
5 月 15 日, The Verge 报道,微软副总裁 Rajesh Jha 向内部下令: Windows 11 、 Microsoft 365 、 Outlook 、 Teams 、 Surface 等核心团队的工程师,必须在 6 月 30 日前全面停用 Anthropic 的 Claude Code ,转向自家的 GitHub Copilot CLI 。
5 月 20 日,甲子光年从知情人士处获悉, DeepSeek 内部正在组建一个全新的"Harness"团队,方向是代码智能体产品——对标的正是 Claude Code 。
一个在退,一个在进。
巧合吗?怎么可能。
你可能只看到了"微软省钱"
媒体报道里,微软封杀 Claude Code 最常被提到的理由是"工具链整合"。 Jha 的原话是:虽然 Claude Code 在学习阶段很重要,但 Copilot CLI 能更直接地贴合微软的代码仓库、工作流和安全要求。
听起来政治正确得无可挑剔。
但你细品,这话就不对味了。
钱。
据报道,微软为内部工程师开通 Claude Code 的成本高达每人每月 500 到 2000 美元。一个团队几十号人,一个月轻松烧掉几万美元。 6 月 30 日恰好是微软当前财年的最后一天——这个时间窗口,懂的都懂。
然后是面子问题。这才是真正难堪的部分。
过去半年,微软不仅让开发者用 Claude Code ,还鼓励没有编程经验的设计师和项目经理用它做原型。结果?太受欢迎了。不是一般的受欢迎——是开发者们明确表态,比起自家亲儿子 Copilot ,他们更喜欢竞争对手的产品。
打个比方。一支球队花大价钱请了个外援当陪练,结果陪练比首发都猛,全队心知肚明。教练怎么办?
让陪练走人。不是因为不行。恰恰是因为太行了,行到主力没脸待下去。
真正让人不安的不是微软,是那组数字
把视角拉远一点。
根据 Anthropic 在 G 轮融资时公布的数据, Claude Code 的年化收入已经突破 25 亿美元——这款产品 2025 年 2 月才推出, 5 月全面开放,达到这个数字不到一年。在 AI 编程工具领域, Claude Code 拿下了大约 54%的市场份额, GitHub Copilot 只有 25%左右。
说白了,一个后来者用不到两年,在微软的主场抢走了超过一半的蛋糕。这要是放在篮球场上,就是客队在主场把主队打了个 54:25 。难看。
Claude Code 凭什么?
答案不复杂——它把模型当成了一个有文件系统权限的"初级工程师"。你可以让它读目录、跑 grep 、执行测试、修报错,直到测试通过。它不是在帮你补全代码,而是在帮你干活。
在标准化编程测试中, Claude Code 的通过率约为 80.8%,而 Copilot 约为 72.5%。 8 个百分点的差距,看起来不大,但在实际工程中,这意味着 Claude Code 每 10 次操作能多"做对"将近 1 次——积累下来,就是开发效率的质变。
所以微软的选择——说好听点叫"工具链整合",说难听点就是被迫撤退。你家的产品打不过别人家的,还天天花钱养着别人家的,这买卖怎么算都亏。
DeepSeek 为什么偏偏在这个时候入场
回到另一边。
DeepSeek 资深研究员陈德里在社交媒体上的招人帖子写得很直白:"来 DeepSeek 从零做 Code Harness ,对标 Claude Code 。"
有意思的是"Harness"这个词。根据 DeepSeek 官方的定义,除模型本身以外的所有工作,都属于 Harness 的范畴。
这句话太关键了。
它直接捅破了一层窗户纸:模型再强,没有稳定的运行系统,也是白搭。
DeepSeek-V4 在开源社区的口碑不用多说。但一个聪明的模型和一个好用的编程工具之间,隔着上下文管理、文件系统交互、终端操作、错误恢复、多轮任务编排、权限控制——这些"脏活累活",恰恰是 Harness 要做的事。
Claude Code 的成功已经证明了这条路走得通:模型能力是基础分, Harness 能力才是加分项。 Anthropic 花了一年多的时间把 Claude 模型包装成 Claude Code 这个产品,才跑到 25 亿美元的年化收入。
DeepSeek 现在补这一课——说实话,有点急了。但再不补,等 Claude Code 在国内开发者圈子里也站稳脚跟,就真来不及了。
三方格局可能比你想的来得更快
如果把 AI 编程工具看成一场联赛,现在的积分榜大概是这样:
短期内,微软封杀 Claude Code 只会加速两件事:一是 Copilot 团队在压力下疯狂补短板,二是更多开发者开始寻找替代方案——这恰好是 DeepSeek Harness 潜在的窗口期。
长期来看,一个更深层的问题正在浮出水面: AI 编程工具到底应该是谁的生意?
是模型公司的( Anthropic 做 Claude Code 、 DeepSeek 做 Harness )?还是平台公司的(微软做 Copilot 、字节做 Trae )?还是独立工具公司的( Cursor 、 Windsurf )?
目前的趋势指向模型公司。原因不难理解——当模型能力成为编程工具的核心壁垒,只有最了解自己模型的团队,才能做出最匹配的工具。 Anthropic 比任何人都清楚 Claude 的上下文窗口怎么用最高效, DeepSeek 比任何人都清楚 V4 的推理强项在哪里。
这对 Cursor 、 Windsurf 这些独立工具公司来说,是个令人焦虑的信号。对开发者来说,倒可能是好事——竞争越激烈,价格越透明,选择越多。
你现在应该关注什么
如果你是一个每天都在用 AI 编程工具的开发者,这场混战的影响可能比想象中来得更直接。
DeepSeek Harness 的招聘要求里,列了一串要求深度使用过的产品清单: Claude Code 、 Codex 、 Cursor 、 OpenCode 、 GitHub Copilot 、 Manus 、 OpenClaw 、 Hermes 。几乎涵盖了当前所有主流选项。
这说明什么? DeepSeek 在做产品之前,先把整个赛道的产品研究了个遍。接下来半年,大概率会看到一个"集各家所长"的新玩家入场。
但问题也来了。三家同时抢人,开发者的迁移成本在飙升。你的提示词模板、工作流配置、项目上下文——这些东西换一个工具就得重来。很多人的真实感受是:工具越来越好,但换工具越来越痛。
所以,到底该怎么办?
说实话,我也没有标准答案。但有一个判断标准值得想想:你现在用的 AI 编程工具,到底是在帮你"补全代码"还是在帮你"完成任务"?
如果你的工具还停留在"你写一半它猜另一半"的阶段,而别人已经在用 Agent 帮忙跑测试、修报错、提 PR……这个差距,不是换个快捷键能追上的。
AI / 自动化 / 一人公司
👇 点击下方公众号名片,关注「未来协议」
夜雨聆风