一、AI 应用 / Agent 落地
1、Notion 接入 Cursor SDK
Notion 宣布可直接把 spec 和任务委派给 Cursor cloud agent,agent 用与 Cursor 相同的模型和运行时完成规划、构建、测试并提交 PR,显示 agent 正在进入真实团队协作和代码交付链路。
2、Notion Mail 直接关停,全面转向 agent
Notion 宣布 Notion Mail 将于 2026 年 9 月 22 日彻底关停,理由是「超过一半用户已经从不打开收件箱」,公司选择全面押注 agent 接管邮箱,释放出「AI 重构软件界面」的明确信号。
3、Palantir 与 Zeta Global 推进 agentic marketing
双方达成 7 年战略合作,把 Zeta 的 Data Cloud 重构在 Palantir Foundry 上,以 Athena by Zeta 为核心建设统一数据与 AI 基础设施,推动 agent 从分析层走向营销决策与实时执行层。
4、Palantir 展示 Trinity Industries 智能审计工作流
新案例显示 agent 已进入发票审计、应付账款匹配等企业后中台流程,不再局限于问答或代码生成。
5、Vercel 发布 AI SDK 7
新版本加入 reasoning control、tool approval、durable workflows、sandbox support 和 telemetry,重点已经从「能调用模型」转向「能跑生产级 agent」。
6、xAI 为 Grok Build 加入 /goal 能力
新功能支持交付单一目标后由 agent 长时自主执行并内建验证(plan→execute→verify,可暂停/恢复),其 subagents 并行运行于各自隔离的 Git worktree,说明 agent 平台正从工具调用走向可组合任务执行。
7、Palo Alto 加入 OpenAI Daybreak 安全 agent 合作计划
Daybreak 把漏洞发现、验证和修复压缩到同一工作流;Palo Alto 是其 Cyber Partner Program 的合作伙伴之一(同列还有 Cisco、CrowdStrike、IBM、Wiz、Tenable、Zscaler、Cloudflare 等),安全 agent 开始从辅助分析走向实际处置。
二、AI 模型 / 编码模型 / 长上下文
8、OpenAI 预览 GPT-5.6 系列模型
OpenAI 已预览 GPT-5.6,采用 Sol(旗舰)/ Terra(中档)/ Luna(效率)三档命名,GPT-5.6 Sol 重点强调 coding、science 和 cybersecurity;因 Sol 跨过「高」网络风险阈值,目前以受限、政府门槛的有限预览形式开放。
9、智谱发布 GLM-5.2,继续强化开源模型竞争力
智谱新模型主打 1M token 上下文、长程任务能力、编码表现提升(Code Arena 第一),以及思考强度分档控制(官方为 High / Max 两档及关闭思考),MIT 许可开源,进一步强化国产模型向 Agent 和工程场景靠拢的趋势。
GLM-5.2 被定位为面向长任务、代码和复杂执行流程的开源(MIT 许可)旗舰,独立评测称其在多项长程编码基准上以约 1/6 成本超过 GPT-5.5。
10、DeepSeek 上线 DSpark 推理加速框架
DeepSeek 在 Hugging Face 上线 DSpark,一套「半并行」speculative decoding 框架(并非新模型),DeepSeek-V4-Pro-DSpark 是在既有 V4-Pro 检查点上挂载 DSpark 草稿模块,单用户生成提速约 57–78%,市场关注点正是其推理提速路线。
三、AI 基础设施 / 推理效率 / 系统层
11、Qualcomm 推出 Dragonfly 数据中心 AI 路线
Investor Day 披露 Dragonfly 组合:C1000 CPU、AI250/AI300 加速器与 HBC 近存计算架构,显示其正从边缘 AI 向数据中心 AI 基建延伸。
12、Qualcomm 宣布收购 Modular
这是一笔已宣布、预计 2026 下半年完成的全股票交易(约 39.2 亿美元),尚未交割。它强化了 Qualcomm 在「硬件 + 软件栈」上的布局,对标 Nvidia 的 CUDA。
13、OpenAI 自研 AI 芯片继续推进
OpenAI 已公布首款自研推理 ASIC(代号 Jalapeño,与 Broadcom 合作),目标推理成本约降一半、2026 年底起部署,模型公司前移到自控算力和推理效率层的趋势更明显。
14、Sail Research 获 Kleiner Perkins 支持
Sail Research 以 8000 万美元融资出场(Kleiner Perkins 领投 A 轮),主打面向长程 agent 的推理基础设施,强调 agent 时代的核心瓶颈已转向 inference cost 和 throughput。
15、SemiAnalysis 强调数据中心 CPU 被低估
其「CPUs are Back」一文认为,AI agent、数据库调用、context management 和编译验证,会抬升 CPU 在 AI capex 中的重要性。
16、Databricks 强调 inference speed 与上下文基础设施
在 Data + AI Summit 2026 上,Databricks 一方面突出推理性能,另一方面继续强化数据库(Lakebase)、上下文和 agent harness 在企业 AI 体系中的位置。
17、OpenAI GPT-5.6 Sol 即将在 Cerebras 上运行
OpenAI 计划于 7 月在 Cerebras 大芯片上线 GPT-5.6 Sol,速度可达约 750 tokens/s,初期面向部分客户、随产能逐步开放,显示超低延迟推理正成为前沿模型的新卖点。
四、能源 / 电力 / 数据中心约束
18、Microsoft 更新数据中心水资源效率进展
微软称水耗强度从早期约 2.3 L/kWh 降至 2025 年 0.27 L/kWh(约 88%,微软表述为「近 90%」),并强调 AI 基建扩张不能脱离水资源与社区约束。
19、NVIDIA 持续强化液冷与 AI 工厂效率叙事
市场对 NVIDIA 的关注点已扩展到液冷、热管理、能源调度和 AI 工厂整体效率(Rubin 参考设计采用直触液冷)。
20、美国能源部持续释放核能扩张信号
DOE 围绕下一代反应堆、SMR 部署(如 TVA、Holtec 各获 4 亿美元成本分摊)和供应链重建展开,强化「AI 用电增长 — 核能供给扩张」的逻辑链条。
21、中国 AI 硬件资产重估信号增强
围绕 CXMT 长鑫 IPO、存储扩产、阿里平头哥增资(注册资本由 3 亿增至 10 亿元)等线索的讨论增多,资金更关注能映射到产业利润和资本开支的具体环节。
最后,为委内瑞拉大地震的灾民祈祷。
夜雨聆风