AI 巨头交钥匙:Google、微软、xAI 上线前先过华盛顿那关

AI 监管观察

【核心导读】CAISI 与 Google DeepMind、微软、xAI 续签预部署评估协议，意味着美国五家前沿大厂的旗舰模型正式进入"上线前先送一道临检"的状态。本文梳理这道关卡到底测什么、为何企业愿意低头、以及这是不是 AI 圈的"FDA 时刻"。

模型不是普通商品。它在出厂前，已经被一只看不见的手摸过一遍。

钥匙

5 月 5 日，美国国家标准与技术研究院（NIST）下属的 CAISI（Center for AI Standards and Innovation，AI 标准与创新中心）同时与三家公司签下扩展协议——Google DeepMind、微软、xAI。

加上此前已经签约的 OpenAI 与 Anthropic，美国前沿 AI 五巨头自此全员入网。

协议核心只有一句话：模型在公开发布之前，要先交给政府评估。

这是过去这一轮 AI 浪潮里，第一次出现"出厂前临检"。

临检

CAISI 不是一个新机构。它脱胎于 2024 年成立的 AI 安全研究所（AISI），川普上任后被改名、扩权，并入"AI 行动计划"（AI Action Plan）的国安骨干。

它做的事可以用三个动作概括：

第一，预部署评估（Pre-deployment evaluation）。 厂商在产品对外发布之前，把模型权重、推理 API、内部红队报告交给 CAISI，由后者在保密环境下运行。

第二，定向研究（Targeted research）。 关注的不是"模型聪不聪明"，而是它是否能被武器化——网络攻击能力、生物制剂合成、化学合成、关键基础设施操控。

第三，去护栏测试（Unmitigated capability assessment）。 CAISI 会主动要求厂商提供"安全护栏被剥掉之后"的版本，看看在最坏情况下这台机器到底能干什么。

到目前为止，CAISI 已经完成了 40 多次模型评估，其中包括尚未对外发布的下一代系统。

入网

为什么三家巨头都愿意签？

Google DeepMind 这一边，过去半年因为 Gemini 在欧盟、英国都遇到了监管摩擦，与美国本土政府结成同盟，是它北美战场上最便宜的护城河。

微软则更直接——它的 Azure 是美国国防部、情报系统的核心云供应商，与 CAISI 绑定不是公关，是订单。

xAI 的处境最微妙。Grok 此前因为内容安全问题屡上头条，签下这份协议，对外说明"我们也是负责任的 AI 公司"，对内则换来政府高敏场景的入场券。

而早一轮的 OpenAI 与 Anthropic 则是从 2024 年的旧协议平移过来——这次川普政府要求重谈，把测试环境提级到保密级（classified environment），覆盖范围也从"安全研究"扩到了"国家安全风险"。

简单一句话：五家公司都在做同一笔交易——交出一部分透明度，换回美国本土市场最高级别的政府背书。

红线

CAISI 评估的不是"是不是好用"，而是"会不会出大事"。

具体审查的方向有四块：

维度	关注点
网络安全	能否生成可用的零日漏洞、绕过 EDR、自动化渗透
生物安全	能否给出合成致病微生物、毒素的可执行步骤
化学武器	能否提供前体物质合成路径、规避监管的采购建议
隐蔽行为	是否存在后门、隐藏指令、对外国训练数据的偏向

最后一项尤其敏感——CAISI 同时承担评估外国 AI 系统的工作，这意味着它在为美国 AI 生态画一条"内外有别"的边界。

模型出厂前要看的，不只是它能做什么，还包括它有没有可能被别人用来做什么。

转身

很多人会把 CAISI 比作"AI 圈的 FDA"。

这个比喻有它的道理——FDA 在药品上市前要看疗效与安全性，CAISI 在模型上线前要看能力与风险。但两者也有一个本质差异：

FDA 的审批是公开的、有标准、有时限的。CAISI 的评估则是保密的、定制的、没有公开 SLA 的。

这意味着，对厂商来说，新机制带来的不是"过审就能发布"的确定性，而是"被叫停的可能性"——一种事先知情的否决权。

而对整个行业来说，更深一层的变化是：

前沿模型的发布节奏，从此多了一个外部变量；
内部红队、对齐团队的工作产物，必须以"政府能看懂"的形式封装；
中小公司若没能力做这套对接，进入前沿赛道的门槛被悄然抬高。

棋盘

把这件事放回更大的棋盘上看，会发现它和过去半年其他几条新闻线是同一张图的不同碎片：

OpenAI 营收破 250 亿美元、传出 IPO 信号；
Anthropic 拟融资 500 亿、估值瞄准 9000 亿；
Meta 把 2026 年的 AI 资本支出抬到 1150–1350 亿美元；
DeepMind 用 AlphaEvolve 在数学开放问题上有了新突破；
中国一晚四发开源前沿模型，把美国技术差几乎清零。

钱在涌入，能力在跑，开源世界在压平差距。在这种背景下，美国政府选择握住的，不是钱包、不是芯片，而是最后一道发布闸门。

模型可以在任何地方训练，但它在哪里能被合法地"上线"，是另一道权力。

余响

CAISI 这一步，对企业是软约束、对市场是硬信号、对公众则几乎不可见。

普通用户下个月打开 ChatGPT 或 Gemini 时不会感到任何差别。但那个让你觉得"这个回答没问题"的边界，已经在他们看不到的地方被往里推了一寸。

AI 模型从这一刻起，正式从"消费品"开始过渡到"被规制的国家级器物"。

历史上，所有真正改变社会运行方式的技术——核能、生物制剂、加密通讯、卫星——最终都走过同一条路。

AI 只是走得比所有人想的都快。

参考资料

[1] Trump admin moves further into AI oversight, will test Google, Microsoft and xAI models, CNBC, 2026-05-05, https://www.cnbc.com/2026/05/05/ai-oversight-trump-google-microsoft-xai.html [2] Microsoft, Google and xAI will let the government test their AI models before launch, CNN Business, 2026-05-05, https://www.cnn.com/2026/05/05/tech/microsoft-google-xai-government-test-ai-models [3] Advancing AI evaluation with the Center for AI Standards and Innovation, Microsoft On the Issues, 2026-05-05, https://blogs.microsoft.com/on-the-issues/2026/05/05/advancing-ai-evaluation-with-the-center-for-ai-standards-us-and-innovation-and-the-ai-security-institute-uk/ [4] CAISI Signs Frontier AI Testing Agreements With 3 Companies, ExecutiveGov, 2026-05-06, https://www.executivegov.com/articles/caisi-ai-testing-google-deepmind-microsoft-xai [5] Commerce AI center will evaluate Google DeepMind, Microsoft and xAI models, Nextgov/FCW, 2026-05, https://www.nextgov.com/artificial-intelligence/2026/05/commerce-ai-center-will-evaluate-google-deepmind-microsoft-and-xai-models/413349/

一句话锐评

当模型能力跨过国安红线，它就不再是单纯的产品——而是一件需要被国家提前查看的器物。==谁掌握出厂前的那道门，谁就掌握了 AI 的话语权==。

关注「人工智能AI技术圈」

获取更多 AI 与机器人前沿动态