本周AI那些事儿(5.18-5.24)

AI INTELLIGENCE DAILY

本周AI那些事儿

大模型、国防 AI、智能体、硬件与监管，一天看懂科技世界的暗流。

今日关键词：Google I/O、微软 Build、Claude Gov、GenAI.mil、国产大模型、AI Agent、AI 安全、具身智能。

今天的 AI 圈，有点像深夜的数据中心：表面安静，里面全是风扇轰鸣。

大模型在开发布会，国防部门在做安全评测，企业在搭 Agent，监管机构在补规则，机器人和 AI 硬件也开始往现实世界里挤。

TODAY'S TOP 3

01 / MODEL WAR

全球大模型进入“密集发牌期”

Google、微软、阿里、字节、OpenAI、Anthropic、Meta、Mistral、xAI 几乎同时加速。

02 / DEFENSE AI

国防 AI 评测走向制度化

GenAI.mil 开始从模型性能、系统集成、人机交互、作战场景四个维度评估大模型。

美国国防部部长赫格赛斯

03 / AGENT ERA

AI 从聊天框走向执行系统

Agent、AI PC、自动驾驶、具身智能、AI 安全，都在把模型推向真实业务流程。

SECTION 01

大模型与巨头动态

GOOGLE I/O

Gemini 3.5 Flash 成为搜索与应用新底座

Gemini 3.5 Flash 主打更快推理、更低成本和超长上下文。Gemini Spark 则被包装成云原生个人智能体，打通 Gmail、Docs、Maps、YouTube 等谷歌生态。

搜索也不再只是搜索框，而是变成一个能接收图文语音、能规划、能定位视频片段的 AI 入口。

MICROSOFT BUILD

据传Windows 12 AI Shell：电脑开始“自己办事”

微软把系统级 AI 助手推到台前。Windows 12 AI Shell、Copilot Studio 2.0、Azure AI Agent Service 和 Copilot+ PC 2026 规范一起出现，说明 AI 正在成为操作系统的一部分。

CHINA MODEL LINE

阿里、字节、Kimi、DeepSeek 集体冲刺

阿里 Qwen3.7-Max 强调长程任务、自主工具调用和芯片协同；豆包 2.0 主打低成本、长上下文和“记忆胶囊”；Kimi 与 DeepSeek 继续在编程、数学、多模态方向推进。

OPENAI / ANTHROPIC / META / XAI / AWS

美国 AI 公司从模型卷到生态入口

OpenAI 围绕 GPT-5.5、IPO、智能体团队与 AI 硬件继续扩张；Anthropic 推进 Claude Gov、Claude Code、小企业工作流与大型商业合作；Meta 继续押注 Llama 开源；xAI 推企业版 Grok；AWS 则把 Quick、Kiro 推向商业 Agent 与开发生态。

SECTION 02

国防 AI 与安全评估

PENTAGON GENAI.MIL

五角大楼开始去anthropic化

美国国防部 CDAO 对 GenAI.mil 平台进行综合评估，覆盖 180+ 生成式 AI 用例，从模型性能、系统集成、人机交互、作战场景四个维度打分。

Gemini 3.1 Pro：通过 IL5 环境认证，在文档摘要、流程自动化中有落地，但多步 Agent、编码和对抗鲁棒性仍有短板。

Claude Gov：在机密物理隔离网络中占据关键位置，在情报分析、作战模拟、网络作战支持中表现突出。

Grok 与 OpenAI：Grok 接入 IL5 环境带来实时信息流优势，也引发信息质量与偏见讨论；OpenAI 则推进前沿工具流代理。

最关键的底线是：生成式 AI 必须保持“人在回路”，不能直接进入武器发射决策链路。

SECTION 03

监管、政策与安全

AI 安全从“倡议”进入“流程”

美国商务部 CAISI 与 OpenAI、Anthropic、Google DeepMind、Microsoft、xAI 签署预部署评估协议，重大模型发布前需要通过政府安全评估。

欧盟推进 AI 法案配套细则，英国 AI Safety Institute 更新红队测试指南，重点加入“长程 Agent 任务”评测。

国内政策：AI 立法与国产算力适配提速

国家发改委启动 AI 立法研究，并谋划“人工智能+”配套文件；央国企高价值场景开放，也成为国产 AI 落地的重要信号。

SECTION 04

硬件、自动驾驶与具身智能

AI 开始从屏幕里走出来

特斯拉推进城市道路 L4 公开测试，并在我国推出监管版fsd；英伟达推出 Blackwell Ultra 与边缘推理芯片；英特尔强调本地优先计算；苹果 WWDC 前夕，Siri 独立 App 与系统级 AI 整合成为焦点。

ROBOTICS

机器人进入“能干活”的叙事周期

Figure 03 被描述为已在宝马美国工厂实现连续自主装配；MIT Mobile ALOHA 2.0 展示厨房复杂操作能力。具身智能正在从实验室视频，走向工厂和家庭场景。

SECTION 05

融资与产业趋势

钱继续流向三个方向：Agent、国防、AI 安全

Anthropic 推进超级融资，Isomorphic Labs 完成大额 B 轮融资，137 Ventures 关注 AI 与国防科技交叉领域。

背后的逻辑很简单：谁能让 AI 真正进入业务流程，谁就不只是在卖模型，而是在卖下一代生产力系统。

EDITOR'S NOTE

今日观察：AI 的竞争，正在换题。

过去大家问的是：哪个模型更聪明？

现在真正的问题变成：谁能接入系统，谁能获得数据，谁能被企业放心使用，谁能通过安全评估，谁能让机器人、汽车、电脑、搜索、办公软件都动起来。

AI 不是一阵风，它更像一场换季。旧衣服还能穿，但天气已经变了。

一分钟速览

大模型：Google、微软、阿里、字节、OpenAI、Anthropic 多线更新。

国防 AI：GenAI.mil 评测强调人在回路、红队测试和版本化管理。

Agent：企业级智能体成为巨头共同押注的新入口。

硬件：AI PC、智能眼镜、边缘芯片、自动驾驶同步升温。

监管：美国、欧盟、英国都在把模型评估制度化。