如果要用一句话总结过去一周的AI行业,大概是这样:模型还在卷,但战场已经转移了。
最醒目的信号不是某个模型又在基准测试上刷了分,而是三个AI助理,Copilot、Claude、ChatGPT,突然挤进了同一个Office应用。当你能在PowerPoint的侧边栏同时看到微软自家的Copilot、Anthropic的Claude和OpenAI的ChatGPT时,这场竞赛的性质已经变了:从拼模型能力,转向拼产品入口。
与此同时,两位世界级AI科学家关于智能本质给出了几乎对立的判断,Google CEO罕见承认落后,两家公司先后开源旗舰模型,AMD用2nm芯片刷新了服务器算力的天花板。这一周的信息密度,本身就是AI行业加速的缩影。
一、ChatGPT杀入PowerPoint,三强同台
5月22日凌晨,OpenAI悄然发布了ChatGPT for PowerPoint插件(Beta版)。用户安装后,可以直接在PowerPoint侧边栏用自然语言生成新幻灯片、修改现有内容、对演示文稿做逻辑审查。它还能连接Gmail、Outlook和SharePoint,从邮件和文档中提取素材。
这个插件覆盖了从免费版到企业版的所有订阅层级,全球同步上线。OpenAI在FAQ中坦承,复杂模板、字体和高级图表功能尚未完全支持,且提示AI可能会误删内容,"因此请务必审阅修改结果"。国内媒体雷科技的实测也印证了这一点:详细提示词能显著提高输出质量,但AI生成的幻灯片仍是"骨架"而非成品,品牌元素缺失、排版还需大量手动调整。
真正有意思的不是插件本身,而是它出现的竞争背景。
Anthropic早在2025年9月就在PowerPoint中集成了Claude的幻灯片生成能力。Google通过Gemini与Google Slides深度整合。微软自家的Copilot更是从2024年起就在Office内充当第一方AI面板,今年2月还增加了Agent模式。现在,三个不同公司的AI助理共存于同一个Office应用之中。这在整个软件史上极为罕见:一个操作系统级应用的插件生态里,同时运行着三家互为竞争对手的AI产品。
这背后是微软-OpenAI在2025年重新谈判的合作协议。根据协议,微软持有OpenAI约27%的股权,并拥有到2032年的非独家知识产权授权。正是这个"非独家"条款,让第三方AI能绕过Copilot直接向微软客户提供服务。
二、"奇点山麓"与"这不叫智能"
同一周,两位AI领域最受尊敬的人物给出了几乎对立的判断。
Demis Hassabis在Google I/O 2026闭幕演讲中说出了那句注定被载入史册的话:"我们正站在奇点的山麓。"这位一向出言谨慎的DeepMind创始人兼CEO表示,AGI可能在五年内实现,其影响将达到"工业革命的十倍,并以十倍的速度发生"。他甚至分享了一个个人化的证据:他最近用AI Agent在深夜搭建小游戏,放在几年前,这需要几个月的工程工作。
而在大西洋彼岸,Yann LeCun公开反驳。他引用心理学家皮亚杰的名言:"智能不是你知道什么,而是你在不知道的时候怎么办。"他认为当前的大语言模型并不具备真正的智能,因为它们缺乏在零训练情况下解决全新问题的能力。LeCun正在研究超越Transformer架构的新技术路线,认为儿童式的学习机制才是通往真正智能的路径。
Gemini项目联合负责人Oriol Vinyals则采取中立立场:如果七年前有人给他看今天的模型,他可能会称之为AGI,但"从经验中学习并产生真正突破的能力仍然缺失"。
这三段话放在一起,勾勒出行业核心认知分歧:我们到底是在攀登的最后阶段,还是在攀登开始之前?Hassabis选择用"奇点"这个极具冲击力的词来定义当下,但值得注意的是,就在几个月前,他曾对Bloomberg说过"我们离那还远"。这种用词的弹性让他的宣布更像是一种信念宣示而非科学预测。
三、"我们有点落后了",皮查伊的罕见坦诚
如果说Hassabis和LeCun的辩论是理论层面的,那么Google CEO Sundar Pichai在Hard Fork播客上的表态则是实战层面的清醒剂。
在被问及Google在AI编程领域的竞争力时,Pichai直言:"在Agent编程与工具使用方面,我们目前有点落后。"他解释说,编程是AI商业回报最直接的领域,而Google此前缺乏外部开发者产品来获取真实使用数据,无法形成"反馈回路"。
他举了一个具体的对比:Anthropic通过和Cursor的深度合作获得了大量真实编程数据流,而Google没有类似的产品入口。现在推出的Antigravity 2.0正是为了填补这个缺口,内部用量"每周翻倍"。
这番坦诚在华尔街和开发者社区引发了广泛讨论。当Google,全球AI人才储备最深厚的公司,承认"落后"时,说明Agent编程领域的竞争壁垒已经不在于模型参数或论文数量,而在于产品生态和数据飞轮。谁能更快地把产品交到开发者手里,谁就能更快地收集反馈、迭代模型、缩小差距。这是一个经典的"先发优势自我强化"机制。
皮查伊也给出了他对AI发展速度的观察:"现在30到60天发生的变化,相当于过去的五年。"这句话本身可能就是这一周最好的注脚。
四、开源阵营的双响炮
在闭源巨头争夺Office入口的同时,开源社区迎来两件重量级发布。
Cohere Command A+于5月20日正式开源。218B总参数、25B激活参数的MoE架构,以Apache 2.0协议发布,这是Cohere首个真正的开源商业许可模型。关键亮点:在W4A4量化下仅需2块H100或1块Blackwell GPU即可运行;支持48种语言;首次引入原生引用溯源机制,每项事实都锚定到来源文档。在电信领域的Agent基准测试τ²-Bench Telecom上,Command A+得分从上一代的37%跃升至85%。
Cohere CEO Aidan Gomez("Attention Is All You Need"论文合著者)将这次发布定位为"主权AI",让政府和企业能在自有基础设施上运行前沿模型,不依赖任何云厂商。近年来开源大模型半壁江山来自中国(Qwen、DeepSeek),Cohere此举旨在为西方市场提供一个合规的可控替代。
字节跳动Lance则选择了不同的赛道。这个5月中旬开源的3B参数统一多模态模型,覆盖图像与视频的理解、生成和编辑全链路,同样采用Apache 2.0协议。最亮眼的数据:VBench视频生成评分85.11,超越所有开源统一模型(包括7B参数级别的竞品),训练仅消耗128张A100 GPU。
Lance的"小参数、全链路"策略与Google I/O刚发布的Gemini Omni形成了有趣的对照。虽然两者参数规模差距巨大,但方向一致:让一个模型同时理解、生成和编辑多种媒体形态。区别在于,Gemini Omni依托Google的万亿美元算力基础设施,而Lance证明了在128张A100的预算内也能训练出一个能打的统一多模态模型。
两个开源发布共同指向一个趋势:AI的"生产工具化"正在加速。当模型权重可下载、可在自有硬件上运行、可用Apache 2.0协议自由商用,越来越多的企业会选择"买模型"而非"租API"。
五、算力基座不停歇
AI应用层的热闹背后,基建层的竞赛从未停歇。
AMD于5月21日宣布,代号"Venice"的第六代EPYC处理器已进入量产爬坡。这是全球首款采用台积电N2(2nm)工艺的HPC产品,搭载最多256个Zen 6核心,支持16通道内存(单路带宽1.6TB/s),性能提升高达70%。
这一里程碑的意义超越了AMD自身。就在此前一周,Nvidia在财报电话会上宣称其Vera CPU打开了2000亿美元的新市场。AMD用真实硅片证明了CPU架构创新远未终结,尤其是在AI Agent对CPU算力的需求正在爆发式增长的背景下。正如Nvidia高管所述,Agent工作负载的很大一部分跑在CPU上:工具调用、任务编排、数据检索,GPU做"思考",CPU做"执行"。
Venice的量产意味着,2026年下半年云厂商和数据中心运营商的服务器节点将迎来一次代际跨越。对于AI推理和Agent部署而言,这直接意味着更低的延迟和更高的吞吐量。
写在最后
这一周的信息密度大到令人眩晕,但如果把碎片拼起来,可以看到一个清晰的方向:AI行业正在从"谁的模型更强"转向"谁的产品更多人用"。
三个AI挤进同一个Office,这是产品入口的争夺。世界级科学家对智能本质的分歧,这是认知框架的碰撞。皮查伊的坦诚,这是数据飞轮决定竞争格局的实证。Cohere和字节的开源双响,这是生态系统不愿被单一巨头锁定的本能反应。2nm芯片的量产,这是算力军备竞赛的永不停歇。
对于中国读者而言,这些信号都有各自的映射:国产模型在性能上持续逼近前沿,但产品化能力和全球开发者生态仍是需要弥补的短板;字节跳动Lance的开源策略展示了另一种性价比路线;而算力自主(华为昇腾开始适配DeepSeek V4等国产模型)正在从表态变为生态事实。
AI不只是在变强。它正在从实验室走进办公室、走进生产流程、走进每个行业的日常运作。这一周,产品上线、哲学辩论、CEO自省、开源发布、芯片量产,恰恰浓缩了这个转变的全貌。
当你能在同一个PowerPoint窗口看到三个AI图标时,AI不再是一个需要"拥抱"的新技术。它已经成为办公桌的一部分。
夜雨聆风