AI内参|Google I/O改写搜索、Gemini Omni世界模型登场、Qwen3.7-Max连续自主35小时

AI内参｜Google I/O改写搜索、Gemini Omni世界模型登场、Qwen3.7-Max连续自主35小时

2026 年 5 月 24 日 · 第 21 周 · 周末深度版

# AI内参｜Google I/O改写搜索、Gemini Omni世界模型登场、Qwen3.7-Max连续自主35小时

2026 年 5 月 24 日（周日）· 第 21 周 · 周末深度版

本周是 AI 行业的大事件周——Google I/O 2026 刚刚落幕，带来了搜索25年来最根本的改版和 Gemini Omni 世界模型的震撼演示；阿里巴巴在云栖峰会期间发布了 Agent 优先的 Qwen3.7-Max，展示了35小时连续自主运行的惊人能力；AMD CEO 苏姿丰亲临上海，强调中国市场是"必选项"并押注 Agentic AI。以下是本期综合日报。

🛠️ 技术生态

◆ Google I/O 2026：搜索25年最大改版，Gemini Omni 世界模型登场

5月19日（周二），Google I/O 2026 主旨演讲在 Mountain View 举行。这可能是 Google 近年来最大胆的一次产品升级——从搜索框到世界模型，全线拥抱 AI Agent。

搜索：25年来首次改版

Google Search 迎来了自 1998 年上线以来最根本的变革。The Next Web 的报道（https://thenextweb.com/news/google-search-ai-overhaul-information-agents-io-2026）和 NYT 的分析（https://www.nytimes.com/2026/05/19/business/google-seach-bar-ai-gemini.html）详细描述了这次改版的核心变化。传统的白色搜索框被替换为一个"智能搜索框"，支持长文本、多模态输入（图片和视频），并且不再返回蓝色链接列表——而是直接交付 AI 生成的交互式体验。

Google 官方博客（https://blog.google/products-and-platforms/products/search/search-io-2026）列出了三个核心变化：

1. 信息代理（Information Agents）：用户可以创建全天候监控网络的 AI 代理——例如设置一个代理监测特定行业的竞品新闻，每天早上推送摘要

2. 生成式 UI：Gemini 3.5 Flash 可以根据查询内容动态生成定制化的小工具、模拟器和可视化工具——比如搜索"比较三款显卡性能"时，直接生成一个交互式对比图表

3. Agentic 预订能力：通过自然语言描述需求（如"找一个周五晚上可以容纳6人的包间、供应宵夜"），Search 自动完成比价、预订全流程

Google 还推出了 AI Mode 的"个人智能"（Personal Intelligence）扩展，覆盖近200个国家和地区的98种语言，无需订阅即可使用。WIRED 的深度报道（https://www.wired.com/story/everything-google-announced-at-google-io-2026）指出，这标志着 Google 从"信息索引器"向"任务执行平台"的转型——搜索框不再是一个入口，而是一个 AI Agent 的启动器。

Gemini Omni：原生多模态世界模型

Google 发布了 Gemini Omni，一个"可以从任何输入创造任何输出"的世界模型。Mashable 的报道（https://mashable.com/article/gemini-omni-flash-ai-video-generation-google-io-2026）和 YouTube 分析（https://www.youtube.com/watch?v=moxr8bz0ykU）展示了其核心能力：

Omni Flash
：首个发布的 Omni 系列模型，支持文本、音频、图像、视频四种模态的混合输入和输出
对话式视频编辑
：用户可以通过自然语言命令编辑视频——"把这个角色的背景换成海滩"、"把这段的色调调暖"——模型实时响应
世界模型物理规律
：利用 Gemini 的"真实世界知识"生成物理更准确的视频内容，减少了传统视频生成中常见的物理不符合现实的问题
更准确的物理引擎
：相比 Genie 和 Veo 3.1，Omni 在物理模拟精度上有了质的提升

GadgetMatch 的 I/O 2026 回顾（https://www.youtube.com/watch?v=moxr8bz0ykU）将 Gemini Omni 描述为"今年最令人震惊的 AI 演示"，并指出它在视频编辑和生成方面已显著超越市场上所有竞品。

Gemini Spark：Google 版的 OpenClaw

作为 I/O 的另一大亮点，Google 推出了 Gemini Spark。WIRED 的分析（https://www.wired.com/story/googles-response-to-openclaws-24-7-ai-agent）指出，这是 Google 对 OpenClaw 病毒式增长的直接回应——一个 24/7 全天候运行的 AI 代理，可以帮用户完成购物、研究旅行选项、管理日程等日常任务。与 OpenClaw 不同的是，Gemini Spark 深度集成 Google 生态（Gmail、Calendar、Maps），并内置了比 OpenClaw 更强的安全护栏。

Google AI 订阅分层

Google 同步推出了 AI Pro 和 AI Ultra 订阅层级，用户可创建"超级应用"（super apps），将 Gemini、搜索、Workspace 能力整合到自定义界面中。这一举措标志着 Google 正将 AI 能力从免费产品向付费订阅模式迁移。

来源：https://thenextweb.com/news/google-search-ai-overhaul-information-agents-io-2026

来源：https://www.nytimes.com/2026/05/19/business/google-seach-bar-ai-gemini.html

来源：https://blog.google/products-and-platforms/products/search/search-io-2026

来源：https://www.wired.com/story/everything-google-announced-at-google-io-2026

来源：https://mashable.com/article/gemini-omni-flash-ai-video-generation-google-io-2026

来源：https://www.wired.com/story/googles-response-to-openclaws-24-7-ai-agent

◆ 阿里 Qwen3.7-Max：专为 Agent 时代设计的旗舰模型，自主运行 35 小时

5 月 20 日，阿里巴巴 Qwen 团队在 2026 阿里云峰会上正式发布 Qwen3.7-Max，这是一款面向 Agent 时代构建的专有旗舰推理模型。VentureBeat 的独家报道（https://venturebeat.com/technology/alibabas-proprietary-qwen3-7-max-can-run-for-35-hours-autonomously-and-supports-external-harnesses-like-anthropics-claude-code）和 AI/ML API 的深度分析（https://aimlapi.com/blog/qwen3-7-max-and-the-35-hour-question-how-does-it-stay-coherent）披露了关键细节。

核心规格：

排名：LM Arena 文本排行榜全球 #13（Qwen 3.7 Max-Preview）
数学子项排名第7、专家级提示排名第9、软件与 IT 排名第9
闭源专有模型（非开源权重，通过阿里云 Model Studio API 提供）
支持外部工具框架集成，包括 Anthropic Claude Code 等主流编码代理框架

35 小时自主运行——最引人注目的实验：

在 Qwen 官方博客（https://qwen.ai/blog?id=qwen3.7）公布的实验中，Qwen3.7-Max 被赋予一个"低层级内核优化"任务——在一个从未见过的芯片架构上进行性能优化，不提供架构参考或性能追踪数据。模型自主规划、执行、验证、调整，持续运行了约 35 小时，完成了 1,158 次工具调用，最终实现了 10 倍性能提升。

AI/ML API 的分析指出，最值得关注的不是性能数据本身，而是 35 小时内的连贯性——模型在整个过程中没有出现上下文漂移、目标遗忘或陷入无效循环。这得益于 Qwen3.7-Max 的"Agent 原生"架构设计：它不是一个"后挂 Agent 的聊天模型"，而是从底层为长时程 Agent 任务设计的推理引擎。

跨框架通用性：

Qwen3.7-Max 不仅能在阿里云自身的 Agent 框架中运行，还支持 Anthropic Claude Code 和 OpenClaw 等外部工具框架。这种"跨工具框架兼容性"表明 Qwen 团队有意将其定位为开放生态中的模型基础设施，而非锁定在阿里云内的封闭系统。

战略意义：

值得注意的是，Qwen3.7-Max 是 闭源专有模型——这与 Qwen 团队此前开源 Qwen3.6 系列的做法截然不同。VentureBeat 的分析指出，这反映了 AI 行业从"开源获客"到"闭源变现"的转变趋势：在经历了几位核心团队成员离职后，Qwen 团队选择了更可持续的商业化路径。

来源：https://venturebeat.com/technology/alibabas-proprietary-qwen3-7-max-can-run-for-35-hours-autonomously-and-supports-external-harnesses-like-anthropics-claude-code

来源：https://qwen.ai/blog?id=qwen3.7

来源：https://aimlapi.com/blog/qwen3-7-max-and-the-35-hour-question-how-does-it-stay-coherent

来源：https://www.zeniteq.com/alibaba-released-qwen3-7-max-and-it-can-run-autonomously-for-35-hours-i692ir

◆ AMD 苏姿丰上海开讲：Agentic AI 和 50 亿用户的未来

5 月 19 日，AMD 董事会主席兼 CEO Lisa Su（苏姿丰）在上海举办的 AMD AI 开发者日 2026 发表主题演讲。搜狐科技（https://www.sohu.com/a/1025044244_616364）对整场演讲进行了详尽记录。

五大核心观点：

1. 中国市场是"必选项"而非"可选项"：Lisa Su 强调 AMD 进入中国超过 30 年，上海研发中心是其全球最大的研发中心之一。她表示"中国拥有全球最具活力的 AI 生态系统，而且中国生态系统真正引领着开放创新的领域"

2. 押注 Agentic AI：这是整场演讲中最具技术指向性的部分。Lisa Su 直言，过去几个月 AI 正在发生根本性转变——"从大语言模型的一问一答，转向智能体 AI"。她预测未来的 AI 不是一个人问一个问题、模型给出一个答案，而是"每个人拥有 5 个、10 个甚至 100 个智能体"

3. GPU 无处不在：GPU 不只在云端，要在整个生态系统中铺开，从 PC 到边缘到机器人。Lisa Su 在台上问开发者"你们喜欢 GPU 吗？想要更多 GPU 吗？"——这显然是 AMD 与 NVIDIA 正面交锋的领域

4. 开放生态是核心要素：Lisa Su 反复强调"开放"这个词，特别提到与中国开源项目、模型的合作，要让开发者"选择恰当的算力、合适的模型"

5. 50 亿 AI 用户前景：目前全球 AI 活跃用户已超 10 亿，未来几年将超 50 亿。但瓶颈在应用层——"没有单一应用、没有单一工作流能支撑这个体量"

演讲后，Lisa Su 邀请的第一位对话嘉宾是李开复——这被视为 AMD 不仅重视开发者，也在争取中国 AI 产业投资端支持的信号。

在结束上海行程后，Lisa Su 于 5 月 21 日抵达台北，准备参加 Computex 2026 和《天下杂志》45 周年论坛。台湾新闻的报道（https://www.taiwannews.com.tw/en/news/6367070）显示，她将在台北参加闭门会议和公开论坛，与媒体高管讨论 AI 策略和技术转型。

来源：https://www.sohu.com/a/1025044244_616364

来源：https://www.taiwannews.com.tw/en/news/6367070

来源：https://www.moomoo.com/news/post/70228682/su-zifeng-delivered-a-speech-in-shanghai-predicting-that-within

◆ Adobe 发布生产力 Agent：PDF 从静态文档变身交互式体验

5 月 6 日，Adobe 发布了其 生产力 Agent（Productivity Agent），将 Acrobat 数十年的文档智能整合到一个 Agent 界面中。Adobe 官方新闻稿（https://news.adobe.com/news/2026/05/adobes-new-productivity-agent）和 Thurrott 的报道（https://www.thurrott.com/a-i/335746/adobe-announces-an-ai-productivity-agent）提供了完整细节。

核心功能：

PDF Spaces
：AI 驱动的工作空间，用户可以将文件、链接和笔记组合在一起进行研究、获取洞察和创建内容
对话式 PDF 编辑
：通过聊天界面与文档交互，而不是传统编辑工具
跨格式内容生成
：从 PDF 一键生成演示文稿、播客、博客文章和社交媒体帖子
语音概述
：为 PDF 生成 AI 语音摘要

Adobe 总裁 David Wadhwani 表示："Adobe 的生产力 Agent 正在重新定义人们处理信息的方式。我们将 Acrobat 数十年的文档智能与 Agent 结合，帮助人们更快地发现洞察、轻松生成丰富内容、分享带有定制 Agent 的交互式体验。"

据 Adobe 数据，用户每年在 Acrobat 中打开超过 4000 亿 个 PDF，发送超过 2 亿 个 PDF。生产力 Agent 支持与 Adobe 的创意 Agent 以及第三方 Agent 的互操作。

来源：https://news.adobe.com/news/2026/05/adobes-new-productivity-agent

来源：https://www.thurrott.com/a-i/335746/adobe-announces-an-ai-productivity-agent

🏢 大厂动态

◆ Google I/O 2026：AI 重塑搜索、视频和 Agent 生态

除了前述技术产品外，Google I/O 2026 还释放了多个战略层面的信号：

Google DeepMind 员工投票成立工会

WIRED 的报道（https://www.wired.com/story/google-deepmind-workers-vote-to-unionize-over-military-ai-deals）披露了一个重要事件：Google DeepMind 员工投票决定成立工会，核心争议点是公司与军方签订的 AI 合同。这反映出 AI 行业内部日益紧张的伦理张力——一线研究人员正在通过集体行动表达对 AI 军事化的担忧。这是继 2025 年 Google 废除"不将 AI 用于武器"内部准则后，DeepMind 员工最强烈的反弹。

Demis Hassabis 谈 AI 裁员

在同一场 I/O 大会上，Google DeepMind CEO Demis Hassabis 对 AI 导致的裁员潮表态。WIRED 的报道（https://www.wired.com/story/demis-hassabis-ai-layoffs-deepmind-google-io）引用了他的原话，他认为大规模裁员是"愚蠢的"（dumb），并指出"人类与 AI 协作才是最有效的生产力提升路径，而不是简单地用 AI 替代人类"。这一表态与本周 Meta 8000 人裁员形成鲜明对比。

Android 17 + Gemini

Google 同步发布了 Android 17 的重大更新（https://www.wired.com/story/android-17-gemini-top-new-features），深度整合 Gemini AI 能力。新系统支持：端侧 AI Agent 运行、基于上下文的智能建议、与 Gemini Spark 的无缝协作。Android 17 的 AI 能力被描述为"从操作系统层面原生支持 Agent"，而非简单地增加一个 AI 助手 App。

◆ AMD 的中国战略 vs NVIDIA 的 Blackwell 狂潮

虽然 NVIDIA 本周发布了令人瞠目的 Q1 FY27 财报（上期日报已覆盖），但 AMD 也在策略性地布局中国市场。

Lisa Su 的上海演讲释放了一个清晰信号：AMD 希望成为中国 AI 生态中的"中性算力提供商"。在 NVIDIA 面临中美芯片出口管制升级的不确定背景下，AMD 强调开放生态、与国产模型（Qwen、GLM、DeepSeek 等）的合作，以及"为合适应用匹配合适算力"的产品哲学。

她特别提到 AMD 的 ROCm 开放计算平台 正在与中国的开源项目和模型进行深度适配——这与 NVIDIA 的 CUDA 锁定策略形成鲜明对比。Hugging Face 最新的《2026 年春季开源状态报告》（https://huggingface.co/blog/huggingface/state-of-os-hf-spring-2026）也印证了这一趋势：中国开源模型正在获得全球开发者的广泛采用，而 AMD GPU 的软件生态支持正在追赶 NVIDIA。

◆ 科技巨头 AI 资本支出竞赛持续白热化

本周虽然没有全新的财报或融资数据，但来自上周的几个趋势在周末得到了更多分析师的解读：

NVIDIA 的"游戏业务消失"信号：Tom's Hardware 的报道（上期已覆盖）揭示了 NVIDIA 不再将游戏 GPU 列为独立业务线。对这一信号，多位分析师在本周末发表了跟进评论——普遍认为这标志着 NVIDIA 已彻底从"GPU 公司"转型为"AI 基础设施公司"，游戏显卡仅作为 AI 生态的消费级延伸存在。

AI 行业风投趋势：VentureBeat 在本周发布的一篇分析（https://venturebeat.com/technology/calling-all-gen-ai-disruptors-of-the-enterprise-apply-now-to-present-at-transform-2026）显示，企业级 AI Agent 正在成为风投最热门的标的。Forbes 在 2026 年初的调查发现，只有 23% 的组织在至少一个业务职能中规模化部署了 Agentic AI，另外 39% 正在试点——这意味着市场渗透率仍有巨大提升空间。

来源：https://www.wired.com/story/google-deepmind-workers-vote-to-unionize-over-military-ai-deals

来源：https://www.wired.com/story/demis-hassabis-ai-layoffs-deepmind-google-io

来源：https://www.wired.com/story/android-17-gemini-top-new-features

来源：https://huggingface.co/blog/huggingface/state-of-os-hf-spring-2026

来源：https://venturebeat.com/technology/calling-all-gen-ai-disruptors-of-the-enterprise-apply-now-to-present-at-transform-2026

📍 论文解读

◆ Equilibrium Reasoners：学习吸引子实现可扩展推理

arXiv:2605.21488 · https://arxiv.org/abs/2605.21488

HF Papers：https://huggingface.co/papers/2605.21488

5 月 20/21 日提交的这篇论文正在学术界迅速走红。研究团队提出了一种新颖的理论框架，解释为什么迭代推理模型能在测试时通过增加计算量来提升性能。

研究背景：扩展测试时计算（test-time compute）已成为提升 AI 推理能力的重要范式——典型的例子包括 OpenAI 的 o1/o3 模型、DeepSeek-R1 等。但一个根本问题一直悬而未决：为什么反复更新隐状态能让模型推理更深？ 内部机制是什么？如果不搞清楚这个问题，该领域的进步只能靠实验摸索而非理论指导。

核心假设：团队提出，可泛化的推理能力产生于学习任务条件化吸引子（task-conditioned attractors）——即隐空间中的动态系统，其稳定的固定点对应有效解决方案。换句话说，当你让模型反复思考一个问题时，它在隐空间中"滚下山坡"，最终停在一个稳定的"谷底"，而这个谷底恰好对应正确答案。

提出的方法——Equilibrium Reasoners（EqR）：

无需外部验证器或任务特定先验，即可实现测试时扩展
沿两个维度扩展内部动态：深度（运行更多迭代）和广度（从多个初始随机轨迹聚合）
固定点残差（fixed-point residual）作为关键诊断指标：残差越低，预测误差越低

关键实验结果：

在 Sudoku-Extreme 数据集上：前馈模型准确率仅 2.6%，而 EqR 通过扩展到相当于 40,000 层 的迭代，准确率提升至 超过 99%
性能提升与吸引子收敛度紧密耦合——简单案例 1-5 步即收敛，最难案例需要大量测试时计算
论文同时提供了严格的数学分析，证明吸引子视角是理解可扩展推理的有效力学透镜

研究团队与投稿方向：论文标注目标为 ICML 2026，已附代码。这一工作将测试时计算扩展的研究从"工程经验"提升到了"理论可解释"的层面，有望推动推理模型设计的范式转换。

来源：https://arxiv.org/abs/2605.21488

来源：https://huggingface.co/papers/2605.21488

来源：https://alanhou.org/blog/arxiv-equilibrium-reasoners-learning-attractors-enables-scalable

来源：https://deeplearn.org/arxiv/756892/equilibrium-reasoners:-learning-attractors-enables-scalable-reasoning

◆ Agent JIT Compilation：延迟优化的 Web Agent 规划与调度

arXiv:2605.21470 · https://arxiv.org/abs/2605.21470

5 月 20 日提交，这篇论文提出了一个令人耳目一新的概念——Agent 即时编译（Agent JIT Compilation），将编译原理中的 JIT 思想引入 AI Agent 的规划与调度。

研究背景：Web Agent 在执行复杂任务时，通常需要先"思考"（规划）再"行动"（执行）。但传统的 Agent 框架在规划阶段是离线完成的——Agent 先完整规划再执行，导致响应延迟高、无法适应网页的动态变化。理想的情况是像 JIT 编译器一样，边解析边执行、按需编译热点路径。

核心方案：Agent JIT Compilation 采用三层架构：

1. 解释执行（Interpretation）：对新任务快速响应，立即执行最简单的可行动作

2. 热点检测（Hotspot Detection）：实时监控 Agent 的执行轨迹，识别频繁执行的路径模式

3. 动态编译优化（Dynamic Compilation）：对识别出的热点路径进行编译优化，生成高效的"编译后"规划模板

实验效果：在标准 Web Agent benchmark（如 WebArena 和 MiniWoB++）上，Agent JIT Compilation 将任务完成时间平均降低 34%，同时保持或提升了任务成功率。特别是在重复性任务场景下（如每天整理邮箱、定期数据抓取），编译优化后的执行速度提升超过 2 倍。

理论意义：这项工作将 Agent 效率研究提升到了"计算系统"的高度——Agent 不再是一个简单的大语言模型 + 工具调用的组合，而是一个需要运行时优化的"执行引擎"。与 JIT 编译器的类比不仅有趣，而且在实验上被证明是有效的。

来源：https://arxiv.org/abs/2605.21470

来源：https://huggingface.co/papers/2605.21470

◆ Reasoning-Trace Collapse：微调过程中显式推理能力丢失的评估

arXiv:2605.21127 · https://arxiv.org/abs/2605.21127

研究背景：大语言模型的训练流程通常是"预训练 → 推理数据微调 → 任务对齐微调（RLHF/DPO）"。然而，实践者发现一个令人困惑的现象：模型在推理数据微调后表现出了出色的推理能力（能展示详细的思考链），但在后续的任务对齐微调后，这种显式推理能力有时反而退化——模型变得不再"展示推理过程"，或者推理链的质量下降。

核心发现：这篇论文系统性地研究了这一现象，称为 推理轨迹坍塌（Reasoning-Trace Collapse）。研究发现，推理轨迹坍塌发生在以下条件下：

对齐微调数据中包含大量"无需推理"的简单问答对
奖励模型对简洁回答的偏好超过对推理过程的偏好
微调过程中推理链的长度被隐式惩罚

关键实验：在多个模型（包括 Llama-4、Qwen3.5）和数据集上，论文展示了推理轨迹坍塌的普遍性。当推理轨迹部分坍塌时，模型在需要多步推理的任务（如 GSM8K、MATH）上的准确率下降 8-15%，尽管在无需推理的简单任务上性能保持稳定。

可操作的解决方案：论文提出了一种简单的缓解策略——推理轨迹保持训练（Reasoning Trace Preservation, RTP），在任务对齐微调数据中强制混入一定比例（建议 30%）的推理轨迹数据，并在损失函数中加入推理链长度正则化项。实验显示，RTP 可以有效防止推理轨迹坍塌，同时不牺牲任务对齐性能。

产业意义：这篇论文直接呼应了 NVIDIA Nemotron-Cascade 2 论文中关于"推理 RL 应优先于偏好对齐"的核心发现（上期日报已覆盖）。两者共同指向一个关键原则：推理能力是脆弱的，对推理能力的保持应该在训练管线设计中被优先保障。

来源：https://arxiv.org/abs/2605.21127

来源：https://huggingface.co/papers/2605.21127

◆ 本周 W21 其他值得关注的论文速览

除上述三篇深度解读外，第 21 周还有以下论文值得关注：

ACC: Compiling Agent Trajectories for Long-Context Training
（https://huggingface.co/papers）—— 提出将 Agent 轨迹编译为长上下文训练数据的方法，将 Agent 执行中的完整交互历史编译为结构化训练样本

MemReread: Enhancing Agentic Long-Context Reasoning via Memory-Guided Rereading
（https://huggingface.co/papers）—— 为长上下文 Agent 推理设计的记忆引导重读机制，让 Agent 在长上下文中主动回溯关键信息

WorldKV: Efficient World Memory with World Retrieval and Compression
（https://huggingface.co/papers）—— 提出对 KV Cache 进行"世界级"压缩和检索的方法，使 Agent 在极长对话中仍能高效使用历史信息

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories
（https://arxiv.org/abs/2605.21468）—— 发现只需极少量（不到 1000 条）的高质量推理数据，就能通过 Rank-1 轨迹方法有效提升 LLM 的推理能力，且微调后性能在未见过的难度级别上也能外推

Solve the Loop: Attractor Models for Language and Reasoning
（https://arxiv.org/abs/2605.12466）—— 与 Equilibrium Reasoners 同期发布的另一篇吸引子模型论文，提出了将固定点求解器引入大语言模型的通用架构，在大规模语言建模和推理任务上均取得更好性能

来源：https://huggingface.co/papers

来源：https://arxiv.org/list/cs.AI/recent

来源：https://arxiv.org/abs/2605.12466

来源：https://arxiv.org/abs/2605.21468

📝 周末综述：W21 的三大主题信号

回顾第 21 周（5 月 18 日-24 日），以下是贯穿本周的三大核心主题：

1. Agent 从概念走向工程标杆

从 Google I/O 的"信息代理"到 Qwen3.7-Max 的 35 小时自主运行，从 AMD 苏姿丰判断"Agentic AI 正在根本性转变"到 Adobe 推出生产力 Agent——Agent 不再是一个概念炒作，而是正在变成可衡量、可部署的工程产品。Qwen3.7-Max 的 1,158 次工具调用 / 35 小时连续运行，可能是迄今为止最令人信服的 Agent 长时程能力证明。

2. 搜索范式正在被重写

Google 搜索 25 年来首次改变搜索框设计，从"返回链接"到"生成体验"。这一变革的影响可能远超 AI 行业本身——如果数十亿用户的搜索习惯被彻底改变，整个互联网的流量分配、广告模式和信息发现方式都将随之重构。

3. 推理机制正在从经验走向理论

本周的两篇吸引子论文（Equilibrium Reasoners 和 Solve the Loop）以及推理轨迹坍塌研究，代表了 AI 推理研究从"实验试错"向"理论理解"的重要转向。理解"为什么推理会工作"和"为什么推理会失效"，正在成为与"如何让推理更强大"同等重要的研究方向。

标签： #AI日报 #GoogleIO2026 #GeminiOmni #Qwen3.7 #AMD #苏姿丰 #Agent #世界模型 #搜索改版 #EquilibriumReasoners #AgentJIT #推理轨迹坍塌 #论文解读 #大厂动态 #技术生态 #W21周末深度 #Adobe生产力Agent

AI 信息跟踪框架 · 每日扫描
生成于 2026-05-24 · 数据来源详见各段落内标注