Copilot+ PC战略失败背后:微软Build 2026的GPU转向意味着什么
纳德拉认错 · GPU上位 · 6亿台旧电脑的AI重生
Build 2026上,微软CEO纳德拉说了一句很少从大厂CEO嘴里听到的话:"我们把AI叙事绑定在一个硬件规格上,这是一个错误。"
这句话的分量,相当于苹果承认Touch Bar是个败笔。
两年前,微软用Copilot+ PC定义了"AI PC":必须有NPU(神经处理单元)、算力至少40 TOPS。达不到这个门槛的电脑,哪怕你有RTX 4090,也不配叫"AI PC"。
现在微软亲口承认:这条路走不通了。转向GPU。
Copilot+ PC为什么失败
2024年微软推出Copilot+ PC时,逻辑很清晰:NPU功耗低、持续运行能力强,适合AI场景。把AI功能锁定在NPU设备上,既卖新硬件,又制造差异化。
但现实打了三个响亮的耳光。
1. NPU生态太弱。据The New Claw Times报道,微软Windows芯片和系统集成副总裁Jimmy Chen在Build 2026上承认:"NPU开发生态这两年没有达到我们的预期。"开发者不想为了一个只占Windows装机量个位数百分比的硬件单独写代码。没有开发者,就没有应用;没有应用,NPU就是摆设。
2. GPU用户被排除在外。你的游戏本装着RTX 4090,算力是NPU的几十倍,但因为不是Copilot+ PC,Recall、实时字幕、Windows Studio Effects这些AI功能跟你没关系。这种"有枪不让开"的逻辑,连微软的硬件合作伙伴都看不下去了。
3. 企业客户不买账。据Windows News报道,企业客户明确表示"不可能把所有桌面都换成Copilot+ PC"。Accenture和Siemens这些早期合作方报告说,他们60-70%的现有Windows PC已经满足4GB VRAM的GPU基线要求——只是这些PC不是Copilot+认证的。
用产品经理的话说:Copilot+ PC创造了一个"假需求"(买新硬件才能用AI)和"真痛点"(现有硬件明明能跑却用不了)的对立。这不是产品策略,这是自我设限。
GPU转向的技术底座
微软这次转向不是拍脑袋,而是搭了一套完整的技术栈。据Windows News和PCMag报道,核心有三件套。
1. DirectML运行时升级。新的DirectML可以在任何支持DirectX 12的GPU上调度AI工作负载,不管你是NVIDIA、AMD还是Intel的显卡,不需要改代码。Build 2026现场演示了Stable Diffusion XL、Llama 4和Phi-4-mini在从Surface Laptop到RTX 5060台式机上本地运行。
2. GPU Work Scheduler。Windows显示驱动模型里新增了一个调度器,可以在GPU渲染任务的间隙插入AI推理,最短切片500微秒。这意味着AI推理不会打断你打游戏或做设计——GPU一边渲染画面,一边见缝插针跑AI模型。
3. 统一内存池。新的内存共享API让GPU显存和系统内存可以当做一个统一池使用,支持最多80亿参数的模型。这个数字很关键——目前最主流的开源小模型(Llama 4 Scout、Phi-4-mini、Gemma 4 E2B)都在这个范围内。
纳德拉在Keynote上直接演示了一台4年前的笔记本用集成显卡跑Windows Copilot Agent,在Office和Edge里做上下文感知建议——流畅。
这对你意味着什么
作为产品经理,我更关心这个转向对普通人的实际影响。
如果你是Windows用户:你的旧电脑可能突然"能跑AI了"。Canalys数据显示,15亿台活跃Windows设备中,约40%已有支持DirectX 12且至少4GB显存的GPU。也就是说,6亿台电脑不需要换新,就能本地运行AI。Windows AI Readiness Analyzer会扫描你的设备,告诉你能不能跑、推理延迟多少。
如果你是开发者:以前你要么写NPU专用代码(受众极小),要么走云端API(延迟高、成本高)。现在DirectML统一了GPU和NPU的接口,你的AI应用可以一次性覆盖整个Windows装机量。微软还推出了Agent Runtime SDK,基于Semantic Kernel,让你定义多步骤推理Agent,完全本地运行。Q4 2026正式可用。
如果你是企业IT:不用再为AI功能批量采购Copilot+ PC了。现有设备只要GPU达标就行。微软还做了安全加码——本地Agent运行在加固容器里,模型有加密签名防篡改,数据访问受Windows Information Protection策略管控,企业文档不会在Agent工作流中离开设备。
NPU没有死,但角色变了
微软没有完全抛弃NPU。Jimmy Chen说得很清楚:NPU在持续低功耗场景(实时转录、注视追踪、背景降噪)上依然有优势,微软会继续通过DirectML抽象层暴露NPU给开发者。
但微软不会再把NPU TOPS分数当卖点。"NPU development ecosystem isn't where we hoped it would be after two years"——这句话基本宣告了"以NPU为核心卖AI硬件"这条路的终结。
更值得玩味的是微软自己的硬件选择。Build 2026上展示的Surface Pro 11 2026版,搭配的是高通Snapdragon X2 Elite加AMD RDNA 4集显。演示时,重量级AI工作负载故意跑在GPU上,而不是NPU上。当被问及未来Surface是否可能完全去掉NPU时,Chen说"取决于产品形态和用途",但"GPU带来了下一波Agent体验所需的灵活性"。
翻译成人话:NPU可以做轻活,但AI的主力军是GPU。就像苹果的Neural Engine也存在,但真正跑重活的是GPU。
一个更大的信号
把微软GPU转向和OpenAI的Agent化放在一起看,会发现一个清晰的共同指向:AI正在从"云端独占"走向"端云协作"。
OpenAI把ChatGPT变成Agent超级应用,但Agent要替你干活,就得访问你的邮件、日历、文件——这些数据企业不想上传云端。微软让GPU跑本地AI,Agent可以在本地处理敏感数据,不需要联网。
两条线交汇的地方,就是"本地Agent"这个新品类。它的核心特征是:理解你的上下文、本地执行敏感任务、只在需要时调用云端增强。这不只是技术趋势,是合规和隐私的必然要求。
对产品经理来说,这是一个明确的信号:你接下来设计的AI产品,如果还完全依赖云端,会在企业和高价值用户面前越来越被动。开始考虑本地部署方案,现在不早。
夜雨聆风