AI INTELLIGENCE DAILY
本周AI那些事儿
大模型、国防 AI、智能体、硬件与监管,一天看懂科技世界的暗流。
今日关键词:Google I/O、微软 Build、Claude Gov、GenAI.mil、国产大模型、AI Agent、AI 安全、具身智能。
今天的 AI 圈,有点像深夜的数据中心:表面安静,里面全是风扇轰鸣。
大模型在开发布会,国防部门在做安全评测,企业在搭 Agent,监管机构在补规则,机器人和 AI 硬件也开始往现实世界里挤。
TODAY'S TOP 3
01 / MODEL WAR
全球大模型进入“密集发牌期”
Google、微软、阿里、字节、OpenAI、Anthropic、Meta、Mistral、xAI 几乎同时加速。
02 / DEFENSE AI
国防 AI 评测走向制度化
GenAI.mil 开始从模型性能、系统集成、人机交互、作战场景四个维度评估大模型。

美国国防部部长赫格赛斯
03 / AGENT ERA
AI 从聊天框走向执行系统
Agent、AI PC、自动驾驶、具身智能、AI 安全,都在把模型推向真实业务流程。
SECTION 01
大模型与巨头动态
GOOGLE I/O
Gemini 3.5 Flash 成为搜索与应用新底座
Gemini 3.5 Flash 主打更快推理、更低成本和超长上下文。Gemini Spark 则被包装成云原生个人智能体,打通 Gmail、Docs、Maps、YouTube 等谷歌生态。
搜索也不再只是搜索框,而是变成一个能接收图文语音、能规划、能定位视频片段的 AI 入口。
MICROSOFT BUILD
据传Windows 12 AI Shell:电脑开始“自己办事”
微软把系统级 AI 助手推到台前。Windows 12 AI Shell、Copilot Studio 2.0、Azure AI Agent Service 和 Copilot+ PC 2026 规范一起出现,说明 AI 正在成为操作系统的一部分。

CHINA MODEL LINE
阿里、字节、Kimi、DeepSeek 集体冲刺
阿里 Qwen3.7-Max 强调长程任务、自主工具调用和芯片协同;豆包 2.0 主打低成本、长上下文和“记忆胶囊”;Kimi 与 DeepSeek 继续在编程、数学、多模态方向推进。

OPENAI / ANTHROPIC / META / XAI / AWS
美国 AI 公司从模型卷到生态入口
OpenAI 围绕 GPT-5.5、IPO、智能体团队与 AI 硬件继续扩张;Anthropic 推进 Claude Gov、Claude Code、小企业工作流与大型商业合作;Meta 继续押注 Llama 开源;xAI 推企业版 Grok;AWS 则把 Quick、Kiro 推向商业 Agent 与开发生态。
SECTION 02
国防 AI 与安全评估
PENTAGON GENAI.MIL
五角大楼开始去anthropic化
美国国防部 CDAO 对 GenAI.mil 平台进行综合评估,覆盖 180+ 生成式 AI 用例,从模型性能、系统集成、人机交互、作战场景四个维度打分。
Gemini 3.1 Pro:通过 IL5 环境认证,在文档摘要、流程自动化中有落地,但多步 Agent、编码和对抗鲁棒性仍有短板。
Claude Gov:在机密物理隔离网络中占据关键位置,在情报分析、作战模拟、网络作战支持中表现突出。
Grok 与 OpenAI:Grok 接入 IL5 环境带来实时信息流优势,也引发信息质量与偏见讨论;OpenAI 则推进前沿工具流代理。
最关键的底线是:生成式 AI 必须保持“人在回路”,不能直接进入武器发射决策链路。
SECTION 03
监管、政策与安全
AI 安全从“倡议”进入“流程”
美国商务部 CAISI 与 OpenAI、Anthropic、Google DeepMind、Microsoft、xAI 签署预部署评估协议,重大模型发布前需要通过政府安全评估。
欧盟推进 AI 法案配套细则,英国 AI Safety Institute 更新红队测试指南,重点加入“长程 Agent 任务”评测。
国内政策:AI 立法与国产算力适配提速
国家发改委启动 AI 立法研究,并谋划“人工智能+”配套文件;央国企高价值场景开放,也成为国产 AI 落地的重要信号。
SECTION 04
硬件、自动驾驶与具身智能
AI 开始从屏幕里走出来
特斯拉推进城市道路 L4 公开测试,并在我国推出监管版fsd;英伟达推出 Blackwell Ultra 与边缘推理芯片;英特尔强调本地优先计算;苹果 WWDC 前夕,Siri 独立 App 与系统级 AI 整合成为焦点。

ROBOTICS
机器人进入“能干活”的叙事周期
Figure 03 被描述为已在宝马美国工厂实现连续自主装配;MIT Mobile ALOHA 2.0 展示厨房复杂操作能力。具身智能正在从实验室视频,走向工厂和家庭场景。

SECTION 05
融资与产业趋势
钱继续流向三个方向:Agent、国防、AI 安全
Anthropic 推进超级融资,Isomorphic Labs 完成大额 B 轮融资,137 Ventures 关注 AI 与国防科技交叉领域。
背后的逻辑很简单:谁能让 AI 真正进入业务流程,谁就不只是在卖模型,而是在卖下一代生产力系统。
EDITOR'S NOTE
今日观察:AI 的竞争,正在换题。
过去大家问的是:哪个模型更聪明?
现在真正的问题变成:谁能接入系统,谁能获得数据,谁能被企业放心使用,谁能通过安全评估,谁能让机器人、汽车、电脑、搜索、办公软件都动起来。
AI 不是一阵风,它更像一场换季。旧衣服还能穿,但天气已经变了。
一分钟速览
大模型:Google、微软、阿里、字节、OpenAI、Anthropic 多线更新。
国防 AI:GenAI.mil 评测强调人在回路、红队测试和版本化管理。
Agent:企业级智能体成为巨头共同押注的新入口。
硬件:AI PC、智能眼镜、边缘芯片、自动驾驶同步升温。
监管:美国、欧盟、英国都在把模型评估制度化。
夜雨聆风