本周 AI 产业界 21 条情报速递

一、AI 应用 / Agent 落地

1、Notion 接入 Cursor SDK

Notion 宣布可直接把 spec 和任务委派给 Cursor cloud agent，agent 用与 Cursor 相同的模型和运行时完成规划、构建、测试并提交 PR，显示 agent 正在进入真实团队协作和代码交付链路。

2、Notion Mail 直接关停，全面转向 agent

Notion 宣布 Notion Mail 将于 2026 年 9 月 22 日彻底关停，理由是「超过一半用户已经从不打开收件箱」，公司选择全面押注 agent 接管邮箱，释放出「AI 重构软件界面」的明确信号。

3、Palantir 与 Zeta Global 推进 agentic marketing

双方达成 7 年战略合作，把 Zeta 的 Data Cloud 重构在 Palantir Foundry 上，以 Athena by Zeta 为核心建设统一数据与 AI 基础设施，推动 agent 从分析层走向营销决策与实时执行层。

4、Palantir 展示 Trinity Industries 智能审计工作流

新案例显示 agent 已进入发票审计、应付账款匹配等企业后中台流程，不再局限于问答或代码生成。

5、Vercel 发布 AI SDK 7

新版本加入 reasoning control、tool approval、durable workflows、sandbox support 和 telemetry，重点已经从「能调用模型」转向「能跑生产级 agent」。

6、xAI 为 Grok Build 加入 /goal 能力

新功能支持交付单一目标后由 agent 长时自主执行并内建验证（plan→execute→verify，可暂停/恢复），其 subagents 并行运行于各自隔离的 Git worktree，说明 agent 平台正从工具调用走向可组合任务执行。

7、Palo Alto 加入 OpenAI Daybreak 安全 agent 合作计划

Daybreak 把漏洞发现、验证和修复压缩到同一工作流；Palo Alto 是其 Cyber Partner Program 的合作伙伴之一（同列还有 Cisco、CrowdStrike、IBM、Wiz、Tenable、Zscaler、Cloudflare 等），安全 agent 开始从辅助分析走向实际处置。

二、AI 模型 / 编码模型 / 长上下文

8、OpenAI 预览 GPT-5.6 系列模型

OpenAI 已预览 GPT-5.6，采用 Sol（旗舰）/ Terra（中档）/ Luna（效率）三档命名，GPT-5.6 Sol 重点强调 coding、science 和 cybersecurity；因 Sol 跨过「高」网络风险阈值，目前以受限、政府门槛的有限预览形式开放。

9、智谱发布 GLM-5.2，继续强化开源模型竞争力

智谱新模型主打 1M token 上下文、长程任务能力、编码表现提升（Code Arena 第一），以及思考强度分档控制（官方为 High / Max 两档及关闭思考），MIT 许可开源，进一步强化国产模型向 Agent 和工程场景靠拢的趋势。

GLM-5.2 被定位为面向长任务、代码和复杂执行流程的开源（MIT 许可）旗舰，独立评测称其在多项长程编码基准上以约 1/6 成本超过 GPT-5.5。

10、DeepSeek 上线 DSpark 推理加速框架

DeepSeek 在 Hugging Face 上线 DSpark，一套「半并行」speculative decoding 框架（并非新模型），DeepSeek-V4-Pro-DSpark 是在既有 V4-Pro 检查点上挂载 DSpark 草稿模块，单用户生成提速约 57–78%，市场关注点正是其推理提速路线。

三、AI 基础设施 / 推理效率 / 系统层

11、Qualcomm 推出 Dragonfly 数据中心 AI 路线

Investor Day 披露 Dragonfly 组合：C1000 CPU、AI250/AI300 加速器与 HBC 近存计算架构，显示其正从边缘 AI 向数据中心 AI 基建延伸。

12、Qualcomm 宣布收购 Modular

这是一笔已宣布、预计 2026 下半年完成的全股票交易（约 39.2 亿美元），尚未交割。它强化了 Qualcomm 在「硬件 + 软件栈」上的布局，对标 Nvidia 的 CUDA。

13、OpenAI 自研 AI 芯片继续推进

OpenAI 已公布首款自研推理 ASIC（代号 Jalapeño，与 Broadcom 合作），目标推理成本约降一半、2026 年底起部署，模型公司前移到自控算力和推理效率层的趋势更明显。

14、Sail Research 获 Kleiner Perkins 支持

Sail Research 以 8000 万美元融资出场（Kleiner Perkins 领投 A 轮），主打面向长程 agent 的推理基础设施，强调 agent 时代的核心瓶颈已转向 inference cost 和 throughput。

15、SemiAnalysis 强调数据中心 CPU 被低估

其「CPUs are Back」一文认为，AI agent、数据库调用、context management 和编译验证，会抬升 CPU 在 AI capex 中的重要性。

16、Databricks 强调 inference speed 与上下文基础设施

在 Data + AI Summit 2026 上，Databricks 一方面突出推理性能，另一方面继续强化数据库（Lakebase）、上下文和 agent harness 在企业 AI 体系中的位置。

17、OpenAI GPT-5.6 Sol 即将在 Cerebras 上运行

OpenAI 计划于 7 月在 Cerebras 大芯片上线 GPT-5.6 Sol，速度可达约 750 tokens/s，初期面向部分客户、随产能逐步开放，显示超低延迟推理正成为前沿模型的新卖点。

四、能源 / 电力 / 数据中心约束

18、Microsoft 更新数据中心水资源效率进展

微软称水耗强度从早期约 2.3 L/kWh 降至 2025 年 0.27 L/kWh（约 88%，微软表述为「近 90%」），并强调 AI 基建扩张不能脱离水资源与社区约束。

19、NVIDIA 持续强化液冷与 AI 工厂效率叙事

市场对 NVIDIA 的关注点已扩展到液冷、热管理、能源调度和 AI 工厂整体效率（Rubin 参考设计采用直触液冷）。

20、美国能源部持续释放核能扩张信号

DOE 围绕下一代反应堆、SMR 部署（如 TVA、Holtec 各获 4 亿美元成本分摊）和供应链重建展开，强化「AI 用电增长 — 核能供给扩张」的逻辑链条。

21、中国 AI 硬件资产重估信号增强

围绕 CXMT 长鑫 IPO、存储扩产、阿里平头哥增资（注册资本由 3 亿增至 10 亿元）等线索的讨论增多，资金更关注能映射到产业利润和资本开支的具体环节。

最后，为委内瑞拉大地震的灾民祈祷。