AI 前沿日报 2026-05-08

本期 AI 前沿动态来了，enjoy 📮

━━━━ 本期重点 ━━━━

Subquadratic：挑战 Transformer 的注意力机制困境，宣称 1000 倍效率提升

一家总部位于迈阿密的初创公司 Subquadratic 本周正式亮相，抛出了一枚重磅炸弹：该公司声称已构建出首个完全突破自 2017 年 Transformer 架构诞生以来一直困扰所有 AI 系统的数学瓶颈的大型语言模型。

Subquadratic 推出的首个模型 SubQ 1M-Preview，号称是首个基于"次二次"（subquadratic）架构构建的 LLM——即计算量不再随上下文长度呈二次方增长，而是呈线性增长。在 1200 万 token 的上下文长度下，该公司称其注意力计算量比现有前沿模型减少了近 1000 倍。如果这一数据经过独立验证，将成为 AI 效率领域史无前例的突破。

团队已获得 2900 万美元种子轮融资，估值据报道达到 5 亿美元。然而 AI 学术界反应不一，部分研究者直接质疑这是"空气币"式的宣传，要求独立第三方验证。目前该公司开放 API、命令行编码工具 SubQ Code 和搜索工具 SubQ Search 的内测申请。

"The company claims its first model is the first LLM built on a fully subquadratic architecture — one where compute grows linearly with context length." — VentureBeat

OpenAI 上线"记忆来源"功能：让 AI 的"记忆"变得透明可见

OpenAI 将 ChatGPT 的默认模型升级为 GPT-5.5 Instant，并同步推出全新"记忆来源"（Memory Sources）功能——用户现在可以查看 AI 回答究竟引用了哪些记忆或历史对话。这一功能解决了长期困扰企业级用户的一个核心问题：当模型"记住"某些内容时，用户无法确认它从何处获取这些信息，导致在合规和审计场景中产生风险。

用户只需点击回答底部的"来源"按钮，即可查看模型调用了哪些保存的记忆或历史聊天记录，并可删除或修正过时信息。OpenAI 明确表示，该功能目前尚不完整，"模型可能不会展示塑造回答的每一个因素"，但这是 AI 可观测性（Observability）领域的重大一步。

与此同时，OpenAI 因现场活动场地爆满，向 8000 多名报名者发放了为期一个月的 Codex 速率限制 10 倍提升权益作为补偿。Sam Altman 在 X 上发文称这一举措是"感谢所有申请者的小小心意"。

"When a response is personalized, you can see what context was used, such as saved memories or past chats, and delete or correct it if something is outdated or no longer relevant." — OpenAI 官方博客

━━━━ 技术与行业 ━━━━

微软 Agent 365 正式发布：应对"影子 AI"的企业级安全危机

微软本周宣布其企业 AI 代理管理平台 Agent 365 正式脱离预览阶段、全面上市。该产品的核心定位是成为企业 IT 和安全团队的"统一控制面板"，无论 AI 代理运行在微软自身生态、AWS Bedrock、Google Cloud、企业员工终端，还是第三方 SaaS 代理生态中，都可以实现统一观测、治理和安全管控。

真正令业界关注的，是微软对"影子 AI"（Shadow AI）这一新兴威胁的警示。David Weston（微软 AI 安全副总裁）表示，企业中员工自行安装的 AI 编码助手和个人效率工具正在形成一个 IT 部门完全不可见的 AI 代理盲区——这与多年前"影子 IT"问题的性质如出一辙，但危害更大、扩散更快。微软的策略是在 Agent 365 中内置代理发现引擎，自动扫描企业环境中的本地 AI 工具并纳入管控。

"Most enterprises are trying to find a balance between YOLO — just let anything run — and 'oh no,' where nothing works at all." — David Weston, Microsoft AI Security

Amex 推出 AI 代理商务工具包：意图合约与一次性令牌构建代理支付信任体系

美国运通（Amex）本周发布了面向 AI 代理的商务体验开发者工具包（ACE Kit），旨在解决 AI 代理代替用户完成购物和支付过程中的核心信任问题。与目前大多数依赖外部支付协议的项目不同，Amex 利用其"封闭环路"优势——同时充当发卡机构和支付网络——对代理交易进行端到端验证。

其核心机制包括：意图合约（Intent Contract）在交易前明确代理的行为边界；一次性令牌（Single-Use Token）防止代理无限重复扣款；以及发卡机构级验证确保交易可审计、可撤销。这套体系虽然目前仅限 Amex 自有网络内运行，但代表了金融机构在代理经济（Agentic Economy）中建立信任基础设施的重要探索。

"This is really the first time that an issuer is coming to the table." — Luke Gebb, Amex EVP

SageOX 获 1500 万美元融资：用"代理上下文基础设施"解决团队协作难题

SageOX 由 AWS EC2 和 EBS 基础设施的早期建设者创立，本周正式走出隐匿模式并宣布获得 1500 万美元种子轮融资。该公司提出了一个在 AI 代理时代极具前瞻性的问题：AI 代理如何才能像团队成员一样，获得 Slack 讨论、会议对话等"隐性上下文"？

SageOX 的方案是通过硬件记录设备结合现有企业工具来捕获这些"上下文"，并用开源框架 Ox CLI 将其转化为代理可消费的信号。其理念被创始团队形容为"爵士乐式的协作"——不是线性流程审批，而是动态实时协调。创始人 Ajit Banerjee 表示，"产品开发是一场团队运动，背景上下文不仅仅来自打字，它发生在对话之中"。

"Product development is a team sport, and the context doesn't just come from people typing on a keyboard. It happens in conversations." — Ajit Banerjee, CEO of SageOX

━━━━ 学术前沿 ━━━━

LongSeeker：弹性上下文编排让长程搜索代理更高效

本周 arXiv 发表的最新研究（arXiv:2605.05191）提出了 Context-ReAct 范式，专门解决长程搜索代理在推理过程中的上下文管理难题。研究指出，随着代理执行多步推理、调用工具并接收反馈，其工作上下文会呈指数级膨胀——若不加控制地积累所有中间内容，不仅成本飙升，错误率也会急剧上升。

Context-ReAct 提供五种原子操作：Skip（跳过）、Compress（压缩）、Rollback（回滚）、Snippet（截取）和 Delete（删除）。基于这一范式，研究团队微调了 LongSeeker 模型（基于 Qwen3-30B-A3B），在四个搜索基准测试中实现了显著超越——在 BrowseComp 上达到 61.5%（对比 Tongyi DeepResearch 的 43.2%），在中文 BrowseComp-ZH 上达到 62.5%。

"Agents can achieve more reliable and efficient long-horizon reasoning by actively shaping their working memory." — arXiv:2605.05191

SPINE 框架：具身 AI 的全生命周期隐私保护

已被 ICML 2026 接收的立场论文（arXiv:2605.05017）指出，当前具身 AI 系统各环节独立优化导致在高频真实部署场景下形成系统性隐私危机。论文认为，隐私不应被视为某个环节的局部特性，而应是贯穿整个 AI 生命周期的架构级约束。

论文提出了 SPINE（Secure Privacy Integration in Next-generation Embodied AI）框架，通过多准则隐私分类矩阵在具身 AI 管道的各阶段边界协调上下文敏感性。该研究开源了代码，呼吁业界停止用"碎片化隐私补丁"应对系统性隐私风险。

"Privacy in EAI is a life cycle-level architectural constraint rather than a stage-local feature." — arXiv:2605.05017

由 Cyan AI 动态小组整理 · Sources: VentureBeat · arXiv · TechCrunch · The Verge